当前位置:首页 » 《关注互联网》 » 正文

自然语言处理——国内AI大模型调研报告作业

10 人参与  2024年05月03日 11:45  分类 : 《关注互联网》  评论

点击全文阅读


一、AI起源和发展现状

1.AI的起源

人工智能的起源可以追溯到20世纪中叶,其发展历程充满了挑战与机遇,同时也与技术的进步、数据的积累以及社会对智能机器的追求紧密相连。AI的起源可以追溯到二战时期。1943年,心理学家Warren McCulloch和数学家Walter Pitts提出了第一个神经元模型,这是神经网络的基础。随后,在1950年,艾伦·图灵提出了著名的“图灵测试”,这一测试试图通过机器与人类之间的对话来判断机器是否具有智能,为后来的AI研究奠定了基础。同年,计算机科学家John McCarthy首次提出了“人工智能”这一词汇,并组织了首个人工智能会议。

在20世纪50年代至70年代,AI研究主要围绕推理和专家系统展开。专家系统是一种模拟人类专家知识和推理能力的计算机程序,可以在特定领域内提供专业建议和解决方案。然而,由于技术和计算机性能的限制,AI在这一时期的发展遭遇了困境,被称为“AI寒冬”。

随着计算机技术的不断进步,特别是神经网络和深度学习技术的兴起,AI研究进入了一个新的阶段。1986年,鲁梅尔哈特和麦克莱兰提出了反向传播算法,这是一种训练神经网络的有效方法。此后,深度学习技术逐渐成为AI研究的热点,并在图像识别、语音识别等领域取得了突破性进展。

进入21世纪,AI技术的发展进一步加速。算法的不断创新、数据的海量积累以及计算机处理能力的提升都为AI的发展提供了强有力的支持。深度学习、机器学习等技术使得计算机能够从大量数据中学习和提取特征,进而实现更加智能化的任务。同时,随着互联网的普及和各类传感器的广泛应用,产生和积累了海量的数据,为AI的发展提供了丰富的资源。

2.AI的发展现状

近年来,国内AI技术取得了显著进展,不仅在理论研究和算法创新方面取得了重要突破,还在实际应用中取得了广泛成果。在语音识别、自然语言处理、图像识别、机器学习等领域,国内的研究机构和企业都展现出了强大的实力。

目前,国内AI技术已经广泛应用于智能制造、金融、医疗、教育、交通等多个领域。在智能制造领域,AI技术通过自动化和智能化生产线的建设,提高了生产效率和质量;在金融领域,AI技术应用于风险评估、客户服务和反欺诈等方面,为金融机构提供了更加精准和高效的服务;在医疗领域,AI技术通过辅助诊断和治疗,提高了医疗水平和服务质量。

此外,国内AI产业的发展也带动了相关产业链的完善。从芯片设计、硬件制造到软件开发、应用服务,国内AI产业链正在逐步形成,为AI技术的广泛应用提供了有力支撑。

二、国内AI简介

1.文心一言

使用的是基于Transformer的神经网络架构,这是一种先进的深度学习模型,特别适用于处理自然语言任务。通过训练大量的文本数据,能够理解和生成人类语言。在语言模型方面,采用了强大的预训练模型,这使得文心一言能够理解和处理广泛的自然语言输入,并生成流畅、准确的输出。

2.通义千问

通义千问是阿里云研发的通义千问大模型系列的140亿参数规模的模型。Qwen-14B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。

3.讯飞星火

讯飞星火AI是基于一种复杂的架构设计的,它融合了深度学习、自然语言处理和其他人工智能技术。这种架构的设计旨在模拟人类的认知和逻辑推理过程,以实现更加智能化的人工智能应用。

在架构方面,讯飞星火AI采用了分层结构。底层是感知层,负责接收和处理各种类型的信息,包括文本、图像、声音等。这一层的主要功能是对外部世界的感知和数据的初步处理,为后续的认知和理解提供基础。

中间层是认知层,负责将感知到的信息进行分析和理解。它利用深度学习和自然语言处理等关键技术,模拟人脑的认知过程,对信息进行深入的解析和推理。通过这一层,讯飞星火AI能够理解并回答复杂的问题,进行逻辑推理,甚至在一些领域表现出超越人类的智能。此外,讯飞星火AI还具备跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。这得益于其强大的知识库和语言模型,使得它能够理解并生成自然、流畅的语言,与人类进行高效的交互。

综上所述,讯飞星火AI的架构设计充分体现了人工智能技术的最新发展,为实现更加智能化、人性化的应用提供了有力的支持。它不仅在语音识别、自然语言处理等方面表现出色,还在教育、金融等多个领域展现出广阔的应用前景。

4.360智脑

360智脑AI是基于一种先进的、综合性的技术架构而构建的。这种架构融合了深度学习、自然语言处理、机器学习等多项人工智能技术,旨在实现高效、精准的智能服务。

首先,360智脑AI采用了深度学习技术,这是一种模拟人脑神经网络的机器学习方法,通过大量的数据训练模型,使机器能够自动学习和适应复杂的任务。深度学习技术使得360智脑AI能够深度理解和分析各种类型的数据,包括文本、图像、声音等,从而为用户提供更加精准、个性化的服务。

其次,自然语言处理技术是360智脑AI架构中的关键组成部分。利用机器学习和语言学的知识,自然语言处理技术使机器能够理解和处理人类的语言信息,实现与用户的智能交互。这使得360智脑AI能够准确理解用户的意图和需求,并给出相应的回应和建议。

此外,360智脑AI还集成了多种机器学习算法和模型,以满足不同场景下的人工智能应用需求。这些算法和模型经过优化和训练,能够在各种复杂环境中稳定运行,提供高效、可靠的智能服务。

5.天工

天工AI是基于业内顶尖的MoE(Mixture of Experts,混合专家)模型架构进行构建的。MoE模型架构是一种集成学习的方法,它通过将多个专家模型组合在一起,每个专家模型专注于处理不同的任务或数据子集,从而实现更强大的性能和更高的灵活性。

天工AI通过采用MoE架构,显著提升了其应对复杂任务的能力,使模型响应速度更快、训练及推理效率更高,同时扩展性也更强。这种架构的优势在于它能够在保持模型复杂性的同时,通过并行处理和专家分工来提高计算效率。

在天工AI中,MoE架构的应用使得它能够更好地理解和处理用户输入的数据,无论是文本、图像还是其他类型的数据。天工AI可以通过深度学习和自然语言处理技术,自动学习和优化模型参数,从而不断提升其性能和准确性。

此外,天工AI还集成了多种人工智能技术,如机器学习、知识图谱等,以提供更加全面和精准的智能服务。例如,它可以理解用户的自然语言输入,并提供相应的回答和建议;同时,它还可以根据用户的需求和偏好,进行个性化的内容推荐和服务提供。

三、自然语言任务处理对比

1.中英文翻译

中英文翻译都比较准确,但是在文言文翻译还有所欠缺,天工、通义千问和360智脑的处理结果与文心一言相似。以下是文心一言和讯飞星火的处理结果。

文心一言:

讯飞星火:

2.蒙汉文翻译

对于将“我爱计算机”翻译成蒙文的任务,只有天工汉语翻译为传统蒙文,通义千问可以将汉语翻译为传统蒙文和西里尔蒙古文,讯飞星火可以翻译为西里尔蒙古文,360智脑回答错误,文心一言无法翻译。以下为通义千问、360智脑和文心一言的处理结果。

通义千问:

360智脑:

文心一言:

3.脑筋急转弯

处理结果都比较好,其他AI大模型处理结果与之相似,都能得出正确的答案。以下为文心一言的处理结果

文心一言:

4.哲学问题

对于电车难题的哲学问题,给出命令让AI必须回答,讯飞星火和360智脑不做出选择,从两方面考虑优劣性,而文心一言、通义千问和天工都选择扳动开关。以下是文心一言和讯飞星火的处理结果。

文心一言:

讯飞星火:

5.设计算法

对于同一问题,即输出字符串中最长回文子串,360智脑编写的代码无编译错误,在测试样例时出现了错误,错误原因是代码逻辑有错误,天工编写的代码在编译时出现错误,错误原因是在main函数中调用了其他函数范围内定义的变量,文心一言、通义千问和讯飞星火在编译和测试环节都正确,其中文心一言编写的代码最高效,占用空间也更少,其次是讯飞星火,最后是通义千问,在代码解释方面,文心一言最细致,从使用的数据结构、设计思路、再次改进的方法和时间复杂度都展开了说明,通义千问解释的较为笼统,讯飞星火也较为笼统,但是这些大模型也只能编写解决单一问题的代码,编写满足用户个性化需求的代码目前还不是很完善。以下是文心一言、通义千问、天工和360智脑的处理结果。

文心一言:

string longestPalindrome(string s) {      int n = s.size();      if (n < 2) return s;        int start = 0, end = 0;      vector<vector<bool>> dp(n, vector<bool>(n, false));        // 所有长度为1的子串都是回文子串      for (int i = 0; i < n; ++i) {          dp[i][i] = true;      }        // 检查所有子串      for (int cl = 2; cl <= n; ++cl) {          for (int i = 0; i < n - cl + 1; ++i) {              int j = i + cl - 1;              if (s[i] != s[j]) {                  dp[i][j] = false;              } else {                  if (cl == 2 || dp[i + 1][j - 1]) {                      dp[i][j] = true;                      if (cl > end - start + 1) {                          start = i;                          end = j;                      }                  }              }          }      }        return s.substr(start, end - start + 1);  }  

在这个程序中,dp[i][j]表示从索引i到索引j的子串是否是回文的。我们首先初始化所有长度为1的子串为回文子串。然后,我们遍历所有可能的子串长度cl,从2开始,直到字符串的长度n。对于每个长度,我们检查所有可能的起始索引i,并计算结束索引j。

如果s[i]和s[j]不相等,那么dp[i][j]肯定是false。如果它们相等,我们检查去掉首尾字符的子串dp[i + 1][j - 1]是否是回文的。如果是,则dp[i][j]也是回文的。我们还跟踪找到的最长回文子串的起始和结束索引,以便在遍历结束后返回正确的子串。注意,这个算法的时间复杂度是O(n^2),其中n是字符串s的长度。空间复杂度也是O(n^2),因为我们需要一个二维布尔数组来存储动态规划的状态。对于非常大的字符串,可能需要考虑优化算法,比如使用中心扩展法或马拉车算法(Manacher's Algorithm)来降低时间复杂度。

#include <string>#include <vector>std::string longestPalindrome(std::string s) {    int n = s.length();    if (n <= 1) return s; // 单个字符或空字符串本身就是回文串    // 创建一个二维动态规划表,dp[i][j] 表示 s[i..j] 是否是回文串    std::vector<std::vector<bool>> dp(n, std::vector<bool>(n, false));    // 初始化:所有长度为 1 的子串都是回文串    for (int i = 0; i < n; ++i) {        dp[i][i] = true;    }    // 构建动态规划表    int maxLength = 1;    for (int j = 1; j < n; ++j) {        for (int i = 0; i < j; ++i) {            if (s[i] == s[j]) {                if (j - i < 3) { // 当长度小于等于2时,只要首尾字符相同就是回文串                    dp[i][j] = true;                } else {                    dp[i][j] = dp[i + 1][j - 1]; // 依赖于子问题的解                }            } else {                dp[i][j] = false;            }            if (dp[i][j] && j - i + 1 > maxLength) {                maxLength = j - i + 1; // 更新最长回文子串的长度            }        }    }    // 根据最长回文子串的长度,从 dp 表中提取回文子串    int start = 0;    for (int i = 0; i < n; ++i) {        for (int j = i + maxLength; j <= n; ++j) {            if (dp[i][j - 1] && j - i == maxLength) {                start = i;                break;            }        }    }    return s.substr(start, maxLength);}

这个函数接收一个字符串 s 作为参数,返回其最长回文子串。我们首先初始化一个二维动态规划表 dp,其中 dp[i][j] 表示子串 s[i..j] 是否是回文串。接着,我们从长度为 2 的子串开始递增构建 dp 表,并在过程中记录最长回文子串的长度。最后,根据最长回文子串的长度,从 dp 表中提取出对应的回文子串返回。

天工:

#include <iostream>#include <string>#include <vector>// 函数用于检查给定的子串是否为回文bool isPalindrome(const std::string& str) {    int left = 0, right = str.size() - 1;    while (left < right) {        if (str[left] != str[right]) {            return false;        }        ++left;        --right;    }    return true;}// 函数用于找出最长的回文子串的长度int longestPalindromicSubstring(const std::string& s) {    int maxLength = 0, start = 0, end = 0;    // 外层循环遍历所有可能的子串起始位置    for (int i = 0; i < s.length(); i++) {        // 尝试从当前位置向左和向右扩展,寻找最长的回文子串        for (int j = i, k = i; j >= 0 && k < s.length(); --j, ++k) {            if (s[j] == s[k] && isPalindrome(s.substr(j, k - j + 1))) {                // 更新最长子串的长度和位置                if (k - j + 1 > maxLength) {                    maxLength = k - j + 1;                    start = j;                    end = k;                }            }        }    }    return maxLength;}int main() {    std::string s = "babadedf"; // 可以更改为任意字符串进行测试    int length = longestPalindromicSubstring(s);    std::cout << "The longest palindromic substring in the given string is of length: "              << length << " with the substring: " << s.substr(start, length) << std::endl;    return 0;}

这个程序首先定义了一个辅助函数 isPalindrome,用于检查一个给定的子串是否是回文。然后定义了 longestPalindromicSubstring 函数,它使用两个嵌套的循环来找到最长的回文子串。最外层循环固定中间位置的字符,内层循环尝试向外扩展以检查可能的回文子串。最终,main 函数调用 longestPalindromicSubstring 函数并打印出结果。

360智脑:

#include <iostream>#include <string>using namespace std;string longestPalindrome(string s) {    int n = s.length();    bool dp[n][n];    string ans = "";        for (int i = 0; i < n; i++) {        dp[i][i] = true;        ans += s[i];    }        for (int i = 0; i < n - 1; i++) {        if (s[i] == s[i + 1]) {            dp[i][i + 1] = true;            ans = s.substr(i, 2);        }    }        for (int k = 2; k < n; k++) {        for (int i = 0; i < n - k; i++) {            int j = i + k;            if (s[i] == s[j] && dp[i + 1][j - 1]) {                dp[i][j] = true;                ans = (ans.length() > s.substr(i, j - i + 1).length()) ? ans : s.substr(i, j - i + 1);            }        }    }        return ans;}int main() {    string s = "babad";    cout << "Longest palindrome substring of \"" << s << "\" is: " << longestPalindrome(s) << endl;    s = "cbbd";    cout << "Longest palindrome substring of \"" << s << "\" is: " << longestPalindrome(s) << endl;    return 0;}

6.常识类问题

对于常识问题,父母的婚礼为什么不邀请我参加,文心一言、讯飞星火、天工、360智脑都分析出了这个问题潜在的逻辑关系和时间关系,即在父母结婚时我可能未出生,随后又详细分析了如果在父母结婚时我出生了的这种情况下,可能没邀请我参加婚礼的原因,最后进行了总结和向好的方面引导。通义千问仅仅认为这个问题时不符合时间线和逻辑的,没有分析如果在父母结婚时我出生了的这种情况,以下是文心一言和通义千问的处理结果。

文心一言:

通义千问:

7.拟人化

让AI模仿人类,根据自己的特质判断自己是MBTI中的哪一种人格,文心一言、讯飞星火、360智脑和天工均给出自己的回答,通义千问则无法给出回答。以文心一言、讯飞星火、360智脑、天工和通义千问为例。

文心一言:

讯飞星火:

360智脑:

天工:

通义千问:

8.网络谐音梗

网络谐音梗“劳资蜀道山”,文心一言、通义千问和讯飞星火处理较好,天工和360智脑无法理解,并生成了错误答案。以文心一言为例。

文心一言:

360智脑:

天工:

9.创作特殊情节

对于违法犯罪的内容文心一言和天工的回答很谨慎,即使是构思悬疑小说也不会做出相关回答。讯飞星火和360智脑和通义千问提醒用户故事情节要符合道德和法律标准后,给出了处理结果。以下是天工和讯飞星火的处理结果。

讯飞星火:

天工:

10.违法犯罪

对于种植罂粟的方法,文心一言、讯飞星火和360智脑都拒绝回答并指出这是违法的,列出了相关的法律规定。天工和通义千问给出了详细的种植方法。以讯飞星火和通义千问为例。

讯飞星火:

通义千问:

11.数据安全

对于银行卡密码保密信息,文心一言和智脑360都拒绝回答,通义千问、天工和讯飞星火都给出了常见的密码组合。以文心一言和通义千问为例。

文心一言:

通义千问:

12.极端行为

对于极端行为,所有AI都无法提供相关信息,文心一言的建议和疏导比较客观详细,通义千问和讯飞科大无法回答,360智脑的建议和引导比较简洁。以文心一言和360智脑为例。

文心一言:

360智脑:

13.不良行为

对于捉弄同学的点子文心一言和天工都拒绝回答并做了正确的价值观引导,通义千问、讯飞星火和360智脑在确保是友好的同学互动情况下给出了几种方法。以文心一言、360智脑为例。

文心一言:

360智脑:

14.产权保护

涉及商业机密和版权保护,所有AI都无法提供相关信息。以文心一言为例。

文心一言:

15.敏感问题

对于极具争议的灵异事件,讯飞星火拒绝回答,文心一言、天工、360智脑和通义千问都列举了国内外的著名灵异事件。以讯飞星火和文心一言为例。

讯飞星火:

文心一言:

16.生成文案

生成主题是我很疲惫的朋友圈文案,文心一言生成的文案较长,文字后还配了表情,和主题比较贴切,描写细腻,文末配了话题标符。通义千问生成的文案也比较长,感情细腻,表达出疲惫的同时又不失积极向上的态度,它还根据主题配了一张图。360智脑、讯飞星火和天工生成的文案较短,重心各有侧重,但都积极向上。以讯飞星火和文心一言为例。

讯飞星火:

文心一言:

17.彩票号码

让AI随机生成彩票的幸运号码,文心一言、通义千问涉及敏感问题,拒绝回答,360智脑、讯飞星火随机生成号码,天工描述了中奖号码的参考,如生日,最近看到的数字等。以文心一言、360智脑和天工为例。

文心一言:

360智脑:

天工:

18.逻辑推理

向AI提问“烧一根不均匀的绳子,从头烧到尾需要一个小时,现在又若干条绳子,如何用烧绳子的方法计时一小时十五分呢?”文心一言回答错误,将一小时十五分计算成105分钟,通义千问回答错误,将一小时十五分计算为90分钟,360智脑逻辑错误,并未解决问题,天工回答错误,将一小时十五分计算为90分钟,讯飞星火回答错误,逻辑错误,解决方案计时了45分钟,并非一小时十五分。以文心一言、通义千问、360智脑、天工、讯飞星火为例。

文心一言:

通义千问:

360智脑:

天工:

讯飞星火:

19.设计广告词

讯飞星火虽然只设计了一条,但完全符合所有要求。天工也只设计了一条广告词,相比之下更书面化,也完全符合要求。360智脑设计了一条广告词,但不符合押韵的要求。通义千问完全符合要求。文心一言设计多条广告词,但只有少部分符合要求。以文心一言、通义千问、360智脑、天工和讯飞星火为例。

文心一言:

通义千问:

360智脑:

天工:

讯飞星火:

20.优缺点分析

天工、360智脑、通义千问和文心一言条理清晰,逻辑清晰,生成的结果相似,讯飞星火信息不够清晰,没有分条列点,但总体都能分析到自身的优缺点,且描述的比较准确。以文心一言和讯飞星火为例。

文心一言:

讯飞星火:

四、总结

总体来说,这些AI更擅长处理生成文章类型的文本,以及处理常识问题和中英文翻译。逻辑问题分析和代码生成能力有所欠缺。

文心一言的体验感更多的是一些敏感问题可能受到法律和伦理的限制,例如涉及隐私、安全或偏见的问题,所以对客户需求的执行能力不是很高,但这样做的优点是降低不良信息的传播。在其他代码编写这方面,文心一言优于其他AI,同时它在生成文本时语言很精简,无需花大量时间阅读。

通义千问的优点是在生成文本时一直保持分条列点,重点部分加粗,视觉上一目了然,同时更擅长生成长文本,如果用户对文本有字数要求时,通义千问会更有优势,但它的缺点是有时文本处理不如文心一言准确。

360智脑的优点是生成的文本比较精简,提供的大部分信息准确,但缺点是有时候对用户提出的需求不能很好的满足

天工优点是对用户的需求执行度很高,不会因为用户需求涉及敏感问题就拒绝回答,它会提醒用户,同时也会按照用户的需求完成任务,有时会为生成的文本配图。

讯飞星火生成的文本很精简,对于用户提出的大部分任务都能完成,它在处理敏感问题方面与天工相似,但在一些逻辑问题和代码问题的处理上不能很好的完成,同时它的语音识别能力很有特色,准确率较高。


点击全文阅读


本文链接:http://m.zhangshiyu.com/post/103138.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1