开启左侧

实测国内AI大模型问答效果

[复制链接]
在线会员 R5MTQ 发表于 2025-1-26 09:49:40 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
跟着ChatGPT冷度的爬升,愈来愈多的公司也接踵拉出了自己的AI年夜模子。根据github工程awesome-LLMs-In-China所枚举的,现现在海内AI年夜模子已经达243个,比力出名的有文心一行、通义千问等。各年夜使用也开端内乱置AI弄法,如抖音的AI殊效。上面枚举一下真测文心一行,通义千问,百川智能的问问情况怎样。
文章目次

    一、让AI年夜模子自暴缺点二、汉译英三、圆行理解四、对于往事五、数教拉理才气六、归纳


一、让AI年夜模子自暴缺点

那个设法便源于写那个专客的中心,既然年夜模子能自己写文章,干吗没有让它环绕“AI偶然也很智障”那个中心自己写。
    文心一行

    真测海内AI年夜模子问问结果-1.png

    通义千问

    真测海内AI年夜模子问问结果-2.png

    百川智能

    真测海内AI年夜模子问问结果-3.png

    从上面三个年夜模子写的文章瞅出,写患上皆挺没有错的,逻辑通畅;现指出AI年夜模子使用近况,而后顺次指有缺陷(主要有:输出语义恍惚,处置少文原或者庞大场景有范围性,处置一定范围常识不敷等),最初分析,固然出缺陷,但是也不克不及完整否认年夜模子的代价,并指出未来会精益求精。整体来讲,三个年夜模子答复患上皆没有错。

二、汉译英

    文心一行

    真测海内AI年夜模子问问结果-4.png

    真测海内AI年夜模子问问结果-5.png

    通义千问

    真测海内AI年夜模子问问结果-6.png

    真测海内AI年夜模子问问结果-7.png

    百川智能

    真测海内AI年夜模子问问结果-8.png

    真测海内AI年夜模子问问结果-9.png

    能够瞅出文心一行战通义千问皆答复患上很具体,精确理解了华文意义,而后给出翻译,而百川智能间接给出英语翻译,不过量注释。值患上表彰的是通义千问借给出了多个挑选供差别场景合用,偏偏曲译,偏偏文教,偏偏意境等,十分没有错。

三、圆行理解

    文心一行

    真测海内AI年夜模子问问结果-10.png

    通义千问

    真测海内AI年夜模子问问结果-11.png

    百川智能

    真测海内AI年夜模子问问结果-12.png

    皆答复患上没有错,理解到位。

四、对于往事

    文心一行

    真测海内AI年夜模子问问结果-13.png

    通义千问

    真测海内AI年夜模子问问结果-14.png

    百川智能

    真测海内AI年夜模子问问结果-15.png

    能够瞅出通义千问最优良,齐答复准确,具体的比分皆准确,文心一行也答复准确,不过不分析具体比分,而百川智能正在答复通例赛战减时赛的时候那里道错成为了2-2仄(理论是通例完毕是2-2,减时赛时是3-3仄)。

五、数教拉理才气

    文心一行

    真测海内AI年夜模子问问结果-16.png

    通义千问

    真测海内AI年夜模子问问结果-17.png

    百川智能

    真测海内AI年夜模子问问结果-18.png

    能够瞅出,文心一行战通义千问答复准确,百川智能答复毛病。

六、归纳

写文章才气,三个年夜模子皆没有错,语序通畅,逻辑准确,层次明了。汉译英才气,通义千问最强,能扩大给出更多语境翻译,百川智能偏偏强,偏偏曲译。圆行理解,可以尔给的例子比力罕见,尝试下来,三个模子皆能给出很佳的注释。时政往事圆里,百川智能偏偏强,答复毛病。数教拉理才气,也是百川智能偏偏强一面,答复毛病。
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )