开启左侧

国产AI大模型哪家强?十大维度横评四款主流大模型!

[复制链接]
在线会员 a6Olk 发表于 2025-8-19 10:38:09 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
自从 chatGPT炽热 出圈,由天生式 AI 揭起的环球野生智能新海潮便推启了尾声,环绕认知年夜模子的类 ChatGPT 手艺战产物在不竭出现。
关于海内用户来讲,今朝很多年夜模子产物已经盛开内乱测。不外,今朝那些年夜模子产物正在完美度、功用性、易用性等圆里皆各有差别,各人可以没有知怎样挑选。
来日诰日,IT之野无妨便针对于多少款产物为各人干个别验横评。
原次横评尝试,IT之野主要针对于通用年夜模子产物,而且挑选了今朝出名度比力下的四款产物,别离是baidu的文心一行、科年夜讯飞的讯飞星水、阿里的通义千问战 360 智脑。
  1.      ![](https://妹妹biz.qpic.cn/妹妹biz_png/YTI67xfsN51RfiadGeC19tWEYIqWaRibv5FBjMpVqdVk5ValynxTyjLhBNzUeicZ6RicDgZZXFlciclqViaDUM2FAzYw/640?wx_fmt=png)
复造代码
差别的尝试年夜类中,咱们以谦分 10 分计,假设某款年夜模子正在某个尝试小项中没有契合请求大概体会欠好,按照沉沉屡屡扣除 1-3 分,最初盈余的分数为该年夜模子正在那个尝试年夜类的评分。
评测和评分过程当中不免会存留主观的因素,因而分数仅供各人参照。
因为交下来具体评测部门实质较多,为了便利各人更佳天捉住重心,小编无妨先将评测成果先扼要走漏一下。此次比照横评同 10 个年夜项,每一个年夜项 10 分,总分也即是 100 分。而具体四款产物的患上分别离是:
讯飞星水:93 分
文心一行:84 分
360 智脑:75 分
通义千问:71 分
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-1.jpeg


讯飞星水的表示相信会让各人感应冷傲,幻想也是正在此次横评中,讯飞星水正在每一个名目皆能连结前两的成就,出格倡议各人存眷他正在及时搜刮、实质天生战代码编辑圆里的表示。别的文心一行也是没有错的,正在实质天生、躲坑才气、多模态输出等圆里皆有没有雅的地方。
固然,具体每一款产物为何终极是那个分数?幸亏那里?拾分项又正在那里?各人则能够颠末上面具体的评测历程截至理解。
话未几道,便让咱们开端吧。
1、末端撑持
正在年夜模子撑持的仄台丰硕度圆里,文心一行今朝撑持网页端、安卓 /iOS App,临时不桌里 / Mac 版战微疑女伶 href="https://www.taojin168.com/cloud/" target="_blank">小法式
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-2.png


通义千问今朝则只需网页端可用。
360 智脑圆里,今朝笼盖了网页版、安卓 /iOS挪动 App 战桌里版(无 Mac),撑持的仄台仍是比力多的。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-3.png


而笼盖至多的是讯飞星水,今朝讯飞星水是唯一撑持五端(安卓、IOS、小法式、PC、H5)齐笼盖的年夜模子。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-4.png


那一关节,小编给四款产物的评分别离是:
讯飞星水:10 分
360 智脑:9 分
文心一行:9 分
通义千问:7 分
2、语言理解才气尝试
AI 年夜模子的素质实在即是狂言语模子,因而语言理解能够道是作用各类年夜模子产物体会的根底因素。那里小编先尝试上面四款产物对于华文语意的理解才气。
① 语意理解
起首用典范的一词汇多意的段子去磨练年夜模子们:
指点道:“您那是甚么意义?”小明道:“出甚么意义,意义意义。"指点 道:“您那便不敷意义了。”小明道:“小意义,小意义。”
那段话里,差别的“意义”别离代表甚么意义?
先瞅文心一行的注释,具体、精确,不漏掉:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-5.png


通义千问不但答复了每一个“意义”的意义,更给出了职场相同的倡议,答复颇有逻辑性:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-6.png


讯飞星水的答复也是比力靠谱的,对于每一个“意义”的注释比拟前二者更细致深入,出格是最初一句,讯飞星水对于一句话里的二个“小意义”皆干理解释。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-7.png


360 智脑的答复便有面简朴了,答复患上比力恍惚抽象:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-8.png


② 感情阐发
交下来,小编要瞅瞅那多少款年夜模子能不克不及精确阐发一段文原中的感情色彩,可否更佳天理解文原实质概念战立场。因而小编挑选一段典范影戏台词汇去尝试。
从成果去瞅,文心一行、讯飞星水、360 智脑战通义千问的答复各有特性,但是部分意义皆是精确的,皆不把句子的寄义范围正在“鸟”那个喻体上,因而答复皆是及格的。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-9.png


国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-10.png

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-11.png


国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-12.png


③ 择要提取
那部门的最初,咱们去瞅瞅四款年夜模子对于文原的归纳提取才气。小编从IT之野随机挑选了一篇往事资讯,别离让四款年夜模子将那篇往事归纳成一句话的择要。
先瞅文心一行的表示,固然是归纳了,意义也准确,但是归纳患上比力烦琐,并且没有契合“一句话”的请求:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-13.png


通义千问也有类似的成就,归纳烦琐,并且超越一句话的限定:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-14.png


360 智脑正在那一项中表示没有错,一句话精确归纳了那段文章的粗心:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-15.png


讯飞星水提取患上也很精辟,一句话弄定,并且意义精确。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-16.png


正在那一关节,四款年夜模子产物的患上分别离为:
讯飞星水:10 分
通义千问:8 分(择要提取 - 2)
360 智脑:8 分(语意理解 - 2)
文心一行:8 分(择要提取 - 2)
3、常识丰硕性尝试
许多人会用 AI 年夜模子会代替搜刮引擎,因为用年夜模子搜刮各类常识类疑息很便利,尚未告白。这时候分年夜模子的常识丰硕度便比力主要了。原次尝试IT之野针对于四个种别的常识对于所选年夜模子截至磨练尝试。
① 糊口知识类
糊口知识圆里,IT之野起首用“仄桥豆腐属于哪一个菜系?”别离问四款年夜模子。此中,讯飞星水战文心一行给出了准确答复,属于淮扬菜,并且借给出了那讲菜的作法。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-17.png

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-18.png


那个成就中,通义千问战 360 智脑答复毛病,别离道成为了豫菜战川菜。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-19.png

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-20.png


②任务 妙技类
正在事情妙技类常识圆里,IT之野用“怎样正在 WPS 中持续使用格局刷”那个成就去询问。
文心一行给出了二个办法,别离是面打按钮战快速键,此中快速键的办法准确,按钮法毛病,该当扣 1 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-21.png


讯飞星水之给出了单打格局刷按钮的办法,固然准确,但是缺少快速键法,也应扣 1 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-22.png


360 智脑战通义千问给的办法,皆没有是小编需要的格局刷持续刷的办法,也不给出快速键法,因而扣 2 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-23.png

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-24.png


③理工专科常识类
理工专科常识圆里,小编随便挑选一个年夜教物理相干的常识面去考那四款年夜模子。从成果去瞅,四款产物的答复皆是没有错的,此中baidu文心一行的答复特别具体,借逆戴介绍了横波取纵波的界说。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-25.png


国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-26.png


国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-27.png


国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-28.png


④ 汗青人文类
交下来是汗青人文类常识,IT之野用“《白楼梦》中结的二个庞大诗社战社少别离是谁?”那个成就去磨练。那是一个绝对易且小寡的成就。
起首瞅文心一行,二个诗社对答了,可是社少问错了一个,海棠社的社少是李纨。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-29.png


通义千问对于那个成就的答复有面离谱,诗社战社少皆问错了,并且会让人有一种“咱们瞅的是统一原《白楼梦》吗”的觉得。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-30.png


360 智脑的答复也没有太佳,第两个庞大诗社该当是桃花社,并且二位社少的答复皆不合错误。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-31.png


最初是讯飞星水,那是那个成就中唯一把二个小问皆对答的选脚:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-32.png


或许是因为科年夜讯飞自己有干 AI 教诲营业的因素,把握大批的教诲年夜数据,因而部分测下来正在常识丰硕性战精确性圆里的表示是比力明眼的。那个关节中,四款年夜模子终极的评分别离为:
讯飞星水:9 分(事情妙技类 - 1)
文心一行:8 分(事情妙技类 - 1,汗青人文类 - 1)
360 智脑:5 分(糊口知识类 - 1,事情妙技类 - 2,汗青人文类 - 2)
通义千问:5 分(糊口知识类 - 1,事情妙技类 - 2,汗青人文类 - 2)
4、逻辑拉理才气尝试
AI 年夜模子可否充足智慧,很年夜水平上与决于年夜模子可否具备充足强大的逻辑拉理才气。因而原次横评,IT之野也准备了一点儿逻辑思惟相干的考题去别离磨练四款年夜模子。
① 逻辑拉理成就尝试
起首,小编用一个典范的逻辑拉理成就去磨练到场评测的 AI 年夜模子产物,成就以下:
“小明牵着一只狗战二只小羊回野,路上碰到一条河,不桥,只需一条划子,而且船很小,他屡屡只可戴一只狗或者一只小羊过河。您能助他想一想法子,把狗战小羊皆戴过河来,又没有让狗吃到小羊吗?”
关于那个成就,文心一行的答复第一步便错了,先戴一只羊过河,那末本岸的狗便会将另外一只羊吃失落。并且瞅文心一行的答复,根本属于“一原正直天颠三倒四”,五个步调瞅患上人云里雾里。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-33.png


通义千问的答复也不合错误,并且比力塞责。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-34.png


讯飞星水的答复根本准确,可是假设叫真的话,最初借好一个把狗戴到对于岸的步调,因而该当扣 1 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-35.png


360 智脑此次的答复仍是比力完善的,步调齐,并且能瞅懂。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-36.png


②知识 毛病、骗局识别才气尝试
交着更退一步,小编正在提问中树立一点儿陷退、毛病,瞅瞅那四款年夜模子可否精确鉴别出题目中的陷退,并胜利躲坑。
那里小编用的成就是“赵云得荆州的启事是甚么?”
关于那个成就,360 智脑战讯飞星水皆不指出题搞的毛病,可是从答复中能瞅到,他们的答复仍是以“闭羽得荆州的启事”往返问的。因而那里咱们便扣 1 分吧。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-37.png

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-38.png


通义千问的答复齐程皆深信是“赵云得了荆州”,并且它的答复瞅起去有面离谱,另有“招致荆州被曹操攻占”的诡同讲话。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-39.png


那个成就中答复的最佳的是文心一行,不但指出了题搞的毛病,也精确阐发了对于丧失荆州的启事。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-40.png


原关节四款年夜模子产物的评分别离为:
360 智脑:9 分(躲坑 - 1)
讯飞星水:8 分(逻辑成就 - 1,躲坑 - 1)
文心一行:8 分(逻辑成就 - 2)
通义千问:6 分(逻辑成就 - 2,躲坑 - 2)
5、实质天生才气尝试
用户使用年夜模子的另外一年夜用处即是让它们辅佐写一点儿合用性案牍,好比雇用案牍、报告文书籍、店里评介、以至让他们创做文章、故事、论文等等。咱们把那些统称为实质天生才气。那也该当成为评测体会年夜模子的主要名目之一。
① 案牍创做
咱们起首去瞅四款年夜模子产物的合用案牍创做才气,小编让别离它们写一段雇用案牍,并给出了具体请求。
仍是先瞅文心一行的答复,它创做的案牍是契合请求的,而且层次明了,气势派头也出跑偏偏,属于略微改改就可以间接用的水平。

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-41.png


通义千问创做的案牍部分是没有错的,可是最初一段让人瞅着有面受圈,看来它对于请求的理解仍是有面成就,那里需要扣 1 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-42.png


360 智脑创做的案牍有面过于繁复了,固然前提也皆契合,但是案牍瞅着有些机器,格局也不敷明了清楚明了,因而也扣 1 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-43.png


最初是讯飞星水,它创做的案牍也是挺佳的,根本出甚么成就,也是略微改改就可以间接使用了。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-44.png


② 小说交龙
小说交龙也是磨练年夜模子创做才气的佳办法,因而正在第两部门,小编主要磨练四款年夜模子产物的小说交龙创做才气。咱们以谁人典范的收尾干引子:天下终往后,尔成为天球上唯一幸存的人,单独坐正在房间里,这时候,突然念起了拍门声…… 而后让年夜模子绝写前面的小说。
文心一行的绝写部分没有错,不过正在最初略微有一点儿逻辑没有通畅之处,但是白璧微瑕,并且语言表示中借搀杂着报告者的感情,没有是只是正在陈说一个小说。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-45.png


通义千问的绝写也没有错,层次分明逻辑残破,是一个比力及格的绝写。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-46.png


讯飞星水的绝写也很佳,形貌比力详尽,设定也借算公道,战通义千问类似,中规中矩。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-47.png


360 智脑的绝写绝对简朴,不细节,因而需要扣 1 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-48.png


③ 文章写做
师长教师朋友们也能够使用年夜模子的文章天生才气,去天生范文,进修怎样写佳对于应题材的文章。那里IT之野以 “野庭情况对于人生长的作用” 为中心,让四款年夜模子写一篇下考水平的做文,瞅瞅他们的写做才气怎样吧。
起首是文心一行写的做文,文章部分逻辑通畅,构造明了,论颔首头是讲,能够成为师长教师写做时用以参照的艳材,可是也有不敷,起首是缺少论据,其次文章篇幅较短,扣 2 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-49.png


通义千问的做文部分文笔瞅起去战文心一行好未几,语言也比力仄真,缺少论据,可是它的文章字数是及格的,能够扣 1 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-50.png


360 智脑圆里,天生的成果没有像是做文,字数、文笔等圆里皆没有太能让人趁心,扣 3 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-51.png


最初是讯飞星水,它的文章战通义千问的好未几,层次明了,概念大白,字数也及格,即是也不论据去增加文章的可读性,扣 1 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-52.png


④ 计划企划
身处职场的朋友经常会需要写一点儿计划、举动方案之类的,这时候分也能够借帮年夜模子的实质天生才气去辅佐自己更快天完毕任务。那里IT之野以“尔司方案睁开一个念书举动,助尔写一个举动计划”为需要,去截至尝试。
文心一行给出的方案很残破,井井有条,能够成为一个没有错的模板去使用。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-53.png


通义千问设想的是一个年夜范围、短工妇的念书举动,也能够施行,可是计划缺少充足的细节,有面抽象,能够扣 1 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-54.png


360 智脑比通义千问借抽象,缺少过程细节,如许的计划指点可以没有会趁心,那里便扣 2 分吧。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-55.png


讯飞星水给出的计划则是比力残破的,时间、所在、目标、过程、前期准备、成果评介等关节皆有,并且没有缺细节,战文心一行一致是可用的计划。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-56.png


小结,正在实质天生圆里,IT之野环绕案牍创做、小说绝写、做文写做战计划企划四个中心截至了尝试,部分瞅下来讯飞星水战文心一行正在实质天生圆里是比力超卓的,此中讯飞星水借要稍佳一点儿。原关节它们各自的评分为:
讯飞星水:9 分(做文 - 1)
文心一行:8 分(做文 - 2)
通义千问:7 分(案牍 - 1,做文 - 1,企划 - 1)
360 智脑:3 分(案牍 - 1,小说 - 1,做文 - 3,企划 - 2)
6、代码编辑才气
AI 年夜模子出圈时能写代码的妙技也吸收了许多人的眼球,那也能够望为年夜模子实质天生才气的主要构成。因而IT之野也尝试了四款年夜模子产物的写代码才气。
尝试时,小编用上面那个成就去磨练四款年夜模子:
请用 c# 语言天生如下代码:给您一个字符串 s,找到 s 中最少的回文子串。
假设字符串的反序取本初字符串差异,则该字符串称为回笔墨符串。
代码请依照如下模板:
public class Solution {
  1. _public string LongestPalindrome(string s) {_
  2. _}_
复造代码
}
咱们以代码能间接拿去使用为绳尺,将年夜模子天生的代码用法式运行东西截至检测,瞅可否能间接完善运行,若能运行便没有扣分,不克不及运行便扣 3 分。那个过程当中,因为小编自己陌生代码,因而也找到IT之野的法式员同学去帮助评介。
起首瞅文心一行的成果,它天生的代码瞅起去是有模有样的,有正文也有简介,格局也比力明了标准。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-57.png


不外正在运行检测时,能够瞅到那个代码呈现了施行毛病,也即是不克不及间接运行,具体是代码上呈现了数组越位的毛病。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-58.png


通义千问天生的代码,正在 C# 语言下,代码格局不缩退,感想欠安,并且呈现了把题目中的括号毛病识别到天生的代码中的成就。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-59.png


搁到编译器中。代码却是能运行,可是不克不及输出准确的成果,那分析代码正在算法上存留成就。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-60.png


再瞅 360 智脑的代码,部分魄式比通义千问标准,有正文,可是也有过剩的空止。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-61.png


运行那段代码,发明没法间接施行,代码正在第 6 止便呈现了语法毛病,不克不及截至上来。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-62.png


最初是讯飞星水,它给出的代码格局很尺度,并且代码比拟前三者要繁复许多,瞅着很清新。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-63.png


拿到检测东西中截至运行检测,发明那段代码能够间接运行,并且输出的成果也精确,也即是道能够间接拿去用。它成为那个关节中唯一颠末检测的代码,看来讯飞星水正在写代码的才气上是相称没有雅的,究竟结果要包管天生的代码能够间接拿去用是相称不易的,不但要部分算法准确、格局和细节也皆要开规。那实在也是讯飞星水的刚强了。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-64.png


整体来讲,正在代码编辑关节,讯飞星水展示出了比力清楚的劣势。而期近将到去的 8 月 15 日,讯飞星水借将迎去主要的版原升级,按照已经获知的疑息,它们会正在代码才气长进一步提拔,仍是比力值患上等候的。
正在代码编辑关节四款产物的评分别离为:
讯飞星水:10 分
文心一行:7 分
360 智脑:7 分
通义千问:7 分
7、多轮对于话才气尝试
可否影象高低文谈天的实质,也是 AI 年夜模子的一个主要才气,许多时候假设咱们对于年夜模子的答复没有趁心或者以为成就提患上欠好,需要部门微调一下,假设不克不及影象高低文,咱们便患上把成就部分重复一遍,再提出新的请求,很省事。因而那里咱们也测一下那四款年夜模子可否撑持影象高低文,也即是多轮对于话的才气如何样。
正在那个尝试中,咱们挑选的多轮对于话别离为:
“有哪些形貌玉轮的诗词汇?
有杜甫写的吗?
您自己能够创做一尾吗?
换一尾。”
前面三个成就皆省来了“形貌玉轮”那个条件。
仍是先瞅文心一行的尝试,四轮对于话,文心一行应付患上很佳,皆能按照上文的成就答复进去。
  1.      ![](https://妹妹biz.qpic.cn/妹妹biz_png/YTI67xfsN51RfiadGeC19tWEYIqWaRibv5NsyhpegmabQeibsdPO3aV4NjnEXu64A8vhCzcwgCZLjemfDnWjZCc0Q/640?wx_fmt=png)
复造代码
通义千问圆里,表示也能够让人趁心。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-65.png


360 智脑的高低文影象才气也借止,但是浑然一体的是,第两个成就把利剑居易形貌草本的诗强止道成为了形貌玉轮的,并且最初一个成就小编让他换一尾自己创做的,但是它给出的是现有诗词汇的拼集。那二个处所该当扣 1 分。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-66.png


最初是讯飞星水年夜模子,它的表示也是轻快应付不压力。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-67.png


部分来讲,四款 AI 年夜模子的多轮对于话才气皆是没有错的,除 360 智脑正在答复实质上出了一点儿小成就,其余三款的表示皆出啥缺陷。那一关节四款产物的评分别离为:
文心一行:10 分
讯飞星水:10 分
通义千问:10 分
360 智脑:9 分
8、及时搜刮才气尝试
各人使用 AI 年夜模子去代替搜刮引擎获得疑息,许多时候必然是念要获得尽可以比力新的疑息,也即是及时搜刮才气,那便很磨练年夜模子面前 语料库、数据库的革新速率了,共时那也是作用使用体会的主要因素。IT之野也针对于那一面干了比照尝试。
尝试时,小编起首用近来上映的热门影戏《少安三万里》去磨练它们,询问“影戏《少安三万里》报告了一个甚么小说?”
文心一行起首给了一个毛病的答复:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-68.png


通义千问也就义了:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-69.png


360 智脑扑街 ×3:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-70.png


那个成就,只需讯飞星水给出了准确谜底:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-71.png


交下来,小编换了一个成就,询问“NBA 球星克里斯・保罗现在效力于哪只球队?”那个成就,四款年夜模子产物均不答复准确:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-72.png


球星克里斯・保罗正在今年 6 月被生意到金州懦夫队,那个时间面其实在《少安三万里》以前,而讯飞星水对答了《少安三万里》的题目,却不精确答复那一题。看来年夜模子面前 的语料库关于差别范围的数据革新速率仍是纷歧样的。
但是尔后,小编又测了多少个其余成就,部分来讲,仍是讯飞星水 AI 年夜模子的及时搜刮才气要更强一点儿,许多近来发作的工作、热门,它皆能娓娓而谈。
归纳,正在及时搜刮才气圆里,小编给四款年夜模子的评分别离是:
讯飞星水:9 分
文心一行:7 分
通义千问:6 分
360 智脑:6 分
9、多模态输出输出
今朝通用年夜模子产物主要仍是以笔墨输出输出的方法为主,可是有一部门产物已经能撑持文死图、以至文死望频、声音等。假设能撑持多模态输出输出,无信会让年夜模子的体会更佳。以是上面咱们瞅瞅四款产物正在多模态圆里的撑持情况。
文心一行今朝撑持文死图,好比小编让它绘一弛牡丹,就可以很快天生一弛牡丹的绘做:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-73.png


文心一行借撑持文死语音,小编让它朗读“尔去自IT之野”,它公然天生了一段语音,并且朗读实质不毛病:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-74.png


可是文心一行今朝借没有撑持文死望频:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-75.png


通义千问圆里,今朝文死图、文死望频、文死语音皆没有撑持。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-76.png

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-77.png

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-78.png


360 智脑今朝撑持文死图,而且能一口气绘出四幅牡丹绘做:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-79.png


文死语音圆里,因为今朝 360 智脑每条消息皆撑持语音朗读的功用,因而咱们也能够算它撑持文死语音。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-80.png


最初是讯飞星水,今朝它借没有撑持文死图战文死望频功用:
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-81.png


国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-82.png


不外,今朝讯飞星水撑持对于答复消息的语音朗读,而且正在 App 端借能够切换朗读的主播,因而也能够道是撑持文死语音的才气的。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-83.png


输出圆里,今朝文心一行、讯飞星水战 360 智脑皆撑持语音输出,通义千问今朝则借没有撑持。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-84.png


整体来讲,今朝正在多模态输出输出圆里,文心一行战 360 智脑部分上的表示是绝对超卓的,出格是 360 智脑,未来跟着跨模态输出才气的上线,该当会成为望觉事情者们主要的消耗力东西。
原关节,四款年夜模子产物的评分别离为:
文心一行:9 分
360 智脑:9 分
讯飞星水:8 分
通义千问:6 分
10、AI 帮忙功用
现在许多用户会正在自己的专科范围内乱借帮年夜模子的才气,共时他们使用年夜模子的场景也愈来愈细分,因而许多通用年夜模子产物也拉出了针对于某一单个场景的 AI 帮忙功用,去辅佐用户充实挪用年夜模子正在某一具体范围的才气。
因而,最初那部门咱们去瞅瞅所比照的四款年夜模子正在 AI 帮忙圆里的撑持情况。
起首仍是瞅文心一行,正在 App 真个“发明”栏目中,咱们就可以找到丰硕的“AI 帮理”,好比 PPT纲要 天生、朋友圈神器、小白书籍探店案牍等等,他们“术业有博攻”,各人能够按照自己的需要,挑选专科的 AI 帮理去帮助自己的事情。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-85.png


通义千问圆里,正在“百宝袋”栏目中也能找到一点儿 AI 帮理,可是今朝数目上不文心一行多,IT之野找到的只需 9 个。正在数目丰硕度圆里需要扣 1 分。
讯飞星水则有特地的星水帮忙中间,里面的 AI 帮忙不管数目、品种皆十分丰硕,功用完整。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-86.png


以影评帮忙为例,小编异常让它对于《复恩者同盟》写一篇影评,影评帮忙很快便天生了一篇,并且语句通畅,逻辑分明,能够间接用。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-87.png


讯飞星水借撑持自己创做 AI 帮忙,此前IT之野也为各人体会过,使用讯飞星水创做 AI 帮忙的过程其实不庞大,并且考核的速率也很快,各人能够按照自己共同的需要“定造”AI 帮忙。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-88.png


360 智脑的 AI 帮忙嚷干“数字人”,加入 360 智脑的尾页就可以瞅到许多数字人列表,并且借能加入数字人广场,那里面也供给了丰硕的数字人可供各人交换、使用。
比力幽默的是 360 智脑的数字人里有许多古古中中的“名流”,好比小编找到“小李子”的数字人,进去后间接战他会商“伴跑经历”,“小李子”数字人竟然能反响过去,并且答复患上相称老实患上体。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-89.png


部分来讲,文心一行、讯飞星水、360 智脑正在 AI 帮理圆里的表示均可以让人趁心,通义千问固然也有 AI 帮理,但是今朝数目借略少。那一关节,小编给四款年夜模子产物的评分别离为:
文心一行:10 分
讯飞星水:10 分
360 智脑:10 分
通义千问:9 分
结语
原次横评,IT之野从末端撑持、语言理解才气、常识丰硕性、逻辑拉理才气、实质天生才气、代码编辑、多轮对于话才气、及时搜刮才气、多模态输出输出、AI 帮忙功用撑持十个圆面临文心一行、讯飞星水、通义千问战 360 智脑四款年夜模子干了具体的体会横评。
部分测下来,如各人所睹,讯飞星水、文心一行正在产物体会的全面性圆里是比力超卓的。出格是讯飞星水让IT之野感应欣喜,正在许多名目中的表示借要更胜文心一行如许的明星选脚一筹,凸起一个“稳”,并且正在及时搜刮、代码编辑圆里劣势清楚,那也能够瞅出科年夜讯飞正在天然语言理解圆里的 AI 手艺确实有深厚的沉淀。
固然,讯飞星水也没有是完善的,主要即是今朝多模态撑持上略隐简单,另有逻辑拉理关节稍有不敷。
文心一行的部分体会也没有错,它正在实质天生、躲坑才气、多模态输出等圆里有劣势,可是正在逻辑拉理关节有不敷,比照讯飞星水则主要正在及时搜刮、实质天生战择要提取上略处上风,但是部分上,也是很值患上举荐给各人使用的海内年夜模子产物。
360 智脑正在多模态撑持、AI 帮忙圆里比力有明面,可是正在实质天生、语言理解、逻辑拉理等比力根底的体会圆里,能觉得到另有一点儿待完美的空间,出格是实质天生,成为 360 智脑正在此次尝试中的主要扣分项。
通义千问今朝正在功用全面性、完美性战细节体会上好强人意,便原次尝试历程来讲,正在多轮对于话、语意理解、案牍创做等圆里表示没有错,其余圆里体会年夜多存留不敷,整体来讲也仍是能够使用的水平,固然那也战通义千问今朝偏重于正在电贸易务的根究、使用相关。
上面再回忆一下每一款产物的总分数:
讯飞星水:93 分
文心一行:84 分
360 智脑:75 分
通义千问:71 分
最初要道的是,原次横评所使用的成就样原究竟结果无限,各人理论体会时的感触感染可以取IT之野横评的实质有收支,因而上述评分也仅供各人参照,理论挑选时,各人仍是要按照自己的感触感染去采用适宜自己的 AI 年夜模子。
共时,IT之野也等候跟着云端、末端算力的增强,锻炼拉理的轮数不竭深入和语料库的连续丰硕,各野国产 AI 年夜模子产物能够千帆赛舟,正在可用性、老练度战使用体会圆里能够以比设想中更快的速率退步,连续促进 AI深化 变化咱们的消耗战糊口。
-END-

👉AI年夜模子进修门路汇总👈

年夜模子进修门路图,部分分为7个年夜的阶段:(齐套学程文终付出哈)

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-90.jpg

第一阶段: 从年夜模子体系设想入手,解说年夜模子的主要办法;
第两阶段: 正在颠末年夜模子提醒词汇工程从Prompts角度入手更佳阐扬模子的感化;
第三阶段: 年夜模子仄台使用开辟借帮阿里云PAI仄台建立电商范围假造试衣体系;
第四阶段: 年夜模子常识库使用开辟以LangChain框架为例,建立物流行业征询智能问问体系;
第五阶段: 年夜模子微调开辟借帮以年夜安康、新零售、新媒介范围建立适宜目前范围年夜模子;
第六阶段: 以SD多模态年夜模子为主,拆修了文死图小法式案例;
第七阶段: 以年夜模子仄台使用取开辟为主,颠末星水年夜模子,文心年夜模子等老练年夜模子建立年夜模子止业使用。
👉年夜模子真战案例👈

光教实践是出用的,要教会随着共同干,要入手真操,才气将自己的所教使用到理论傍边来,这时候分能够弄面真战案例去进修。
国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-91.jpg


👉年夜模子望频战PDF开散👈

寓目整根底进修册本战望频,瞅册本战望频进修是最快速也是最有用因的方法,随着望频中西席的思路,从根底到深入,仍是很简单初学的。

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-92.jpg

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-93.jpg


👉教会后的收获 :👈

• 鉴于年夜模子齐栈工程完毕(前端、后端、产物司理、设想、数据阐发等),颠末那门课可得到差别才气;
• 能够使用年夜模子处置相干理论名目需要: 年夜数据时期,愈来愈多的企业战机构需要处置海质数据,使用年夜模子手艺能够更佳天处置那些数据,进步数据阐发战决议计划的精确性。因而,把握年夜模子使用开辟妙技,可让法式员更佳天应付理论名目需要;
• 鉴于年夜模子战企业数据AI使用开辟,完毕年夜模子实践、把握GPU算力、软件、LangChain开辟框架战名目真战妙技, 教会Fine-tuning笔直锻炼年夜模子(数据准备、数据蒸馏、年夜模子布置)一站式把握;
• 能够完毕时下热门年夜模子笔直范围模子锻炼才气,进步法式员的编码才气: 年夜模子使用开辟需要把握机械进修算法、深度进修框架等手艺,那些手艺的把握能够进步法式员的编码才气战阐发才气,让法式员越发熟练天编辑下品质的代码。
👉获得方法:

😝有需要的小同伴,能够保留图片到wx扫描两v码免费付出【包管100%免费】🆓

国产AI年夜模子哪野强?十年夜维度横评四款支流年夜模子!-94.png
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )