开启左侧

ChatGPT对国内AI大模型的排名与点评(挺客气的)

[复制链接]
在线会员 BLpt8N 发表于 2025-2-11 09:18:29 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
(原文除括号里那句话,对于问问仅干了排版,并已对于实质干所有窜改。)

Part.1



可否给华夏的AI年夜模子的分析才气水平干一个排名,并截至简朴的评介,包罗劣势、劣势、使用场景等等?感谢。

ChatGPT(o3-mini)道:

华夏的AI年夜模子范围比年去得到了清楚平息,出现出多款具备合作力的模子。如下是对于部门争先模子的分析才气排名及扼要评介:

① DeepSeek-R1

劣势:DeepSeek-R1以其下效的功用战高本钱的锻炼方法引起普遍存眷。固然使用的芯片没有如好国偕行先辈,但是其正在庞大成就处置圆里表示超卓,展示了华夏AI正在资本受限情况下的立异才气。

劣势:因为模子的盛开性战通明性,可以正在数据宁静战隐衷圆里激发担心。别的,模子正在处置敏感话题时可以存留限定。

使用场景:合用于需要下效成就处置的范围,如智能客服、教诲教导等。

②阿里云 - 通义千问

劣势:具有千亿参数,撑持多轮对于话、案牍创做、逻辑拉理、多模态理解战多语言撑持,使用场景普遍。

劣势:正在某些庞大任务的处置上可以没有如其余模子活络,正在多模态天生圆里另有提拔空间。

使用场景:合用于智能帮忙、客服体系、集会记要及时转录、音望频实质归纳等。

③baidu - 文心一行

劣势:具备跨模态、跨语言的深度语义理解取天生才气,正在常识问问、创意天生等任务上表示超卓。

劣势:正在下并收或者年夜范围数据处置时可以面对挑战。

使用场景:合用于文教创做、贸易案牍创做、常识问问等。

④科年夜讯飞 - 星水年夜模子

劣势:撑持对于话、写做、编程等功用,具备文原天生、语言理解、常识问问、逻辑拉理、代码才气战多模态才气。

劣势:正在庞大场景下的处置速率战粗度上仍有提拔空间。

使用场景:合用于语音接互、智能写做、编程帮助等。

⑤字节跳动 - 豆包

劣势:为创作家挨制的AI帮忙,撑持望频剧本撰写、案牍天生、营销筹谋等,性价比下。

劣势:正在某些专科范围的创做才气上有所完美。

使用场景:合用于实质创做、营销筹谋等。

⑥智谱华章 - 智谱浑行

劣势:融合海质常识,可用于贸易阐发、决议计划帮助、客户效劳等范围,具备通用对于话、多轮对于话、创意写做、代码天生等才气。

劣势:正在一定止业的使用深度上需要退一步劣化。

使用场景:合用于贸易阐发、客户效劳、代码天生等。

⑦华为云 - 盘古

劣势:正在中英文理解、多轮对于话、知识拉理等圆里表示优良,主要里背企业级用户。

劣势:今朝仅对于企业用户盛开,可以限定其提高度。

使用场景:合用于企业级使用,如智能客服、数据阐发等。

⑧百川智能 - 百川年夜模子

劣势:公布了Baichuan-7B、Baichuan-13B二款启源可免费商用的华文年夜模子,正在多个声威评测榜单中数一数二。

劣势:正在贸易化使用圆里需要更多的商场考证。

使用场景:合用于教术钻研、手艺开辟等。

⑨腾讯 - 混元

劣势:善于盛开域谈天、实质创做、常识问问,交进微疑搜一搜、搜狗搜刮等搜刮引擎。

劣势:正在一定范围的专科性上需要退一步提拔。

使用场景:合用于交际媒介、实质创做、常识检索等。

⑩商汤 -商量 SenseChat

劣势:多模态对于话接互仄台,使用望觉、语言等手艺,供给沉醉式人机接互体会。

劣势:正在下背载或者庞大场景下的颠簸性上需要增强。

使用场景:合用于假造帮忙、智能客服等。

整体而行,华夏的AI年夜模子正在百般性战使用广度上展示出微小的开展势头。各模子正在差别使用场景中各有劣势,但是也存留需要改良的范围。跟着手艺的不竭进步战商场的考证,那些模子无望正在未来得到更年夜的突破。



排名里不KIMI,是排没有退前十名吗?

ChatGPT 道:

Kimi是由Moonshot AI(月之暗里)开辟的智能帮忙,具备处置少文原的才气,能够一次性承受多达20万个字符的输出。

那使其正在少文原理解战处置圆里表示凸起,合用于需要深入阐发战处置大批文原的场景,如教术钻研、文档阐发等。

可是,正在部分功用战使用场景的广度上,Kimi相较于其余争先的年夜模子可以有所范围。因而,正在此前的排名中没有将其加入前十。但是值患上留神的是,Kimi正在一定范围展示了共同的劣势,出格是正在少文原处置战及时疑息获得圆里。

综上,固然Kimi正在分析才气排名中已加入前十,但是正在一定使用场景下,特别是需要处置大批文原疑息的任务中,展示了其共同的劣势。

Part.2



Part2是问GPT对于国产 AI 年夜模子产物正在脚机端和齐渠讲装置及理论使用情况:

News9短期对于六个AI的测评:

https://www.news9live.com/technology/artificial-intelligence/india-ai-growth-18000-gpus-llm-ai-infrastructure-2818066

ChatGPT 道:

上面收拾整顿了短期公然数据中对于国产 AI 年夜模子产物正在脚机端和齐渠讲(挪动端+PC端)使用情况的相干数据战排名情况:

1. 脚机端装置的 AI 年夜模子 APP 用户范围取活泼度

按照 2024 年国产年夜模子最强前10榜单公然的数据citeturn0search0,正在脚机上装置的 AI 年夜模子 APP 中,用户数目排名前三的是:

① 豆包:约 2.4 亿用户

② Kimi:约 1.8 亿用户

③ 文心一行:约 1.5 亿用户

而正在活泼度(以日会见质计)圆里,排名前三的产物别离为:

- 豆包:日会见质约 3723 万次

- Kimi:日会见质约 3648 万次

- 文心一行:日会见质约 2937 万次

那些数据反应出,正在用户范围战一样平常活泼度上,豆包老手业内乱今朝处于争先职位,其次是 Kimi 取文心一行。

2. 齐渠讲(挪动端战 PC 端)理论使用的国产 AI 模子

除脚机端 APP 以外,从全部渠讲(包罗 PC 端战挪动端)去瞅,baidu的文心年夜模子展示了极其微小的使用范围。据新浪财经报导citeturn0search13:

- 文心年夜模子的日挪用质已经超越 6 亿次

- 日均 Tokens 使用质约为 1 万亿

那表白,正在理论的使用场景中,不管是企业级使用仍是一般用户的体会,文心年夜模子的使用频次战笼盖里皆处于海内共类产物的争先职位。

归纳

- 脚机端 APP 排名:豆包、Kimi 战文心一行别离正在用户总质战日活泼会见质上位列前三,此中豆包用户范围最年夜,且日活数据争先。

- 齐渠讲使用情况:baidu的文心年夜模子凭仗超越 6 亿次的日挪用质战 1 万亿 Tokens 的日均使用质,显现出正在部分用户笼盖战使用深度上远远争先。

那些数据表白,正在国产 AI 年夜模子产物中,差别产物各有偏重,但是部分上,baidu文心年夜模子正在理论使用层里(笼盖 PC 及挪动端)具备最下的挪用质战用户粘性,而正在脚机 APP 商场中,豆包则以宏大的用户基数战下活泼度成为争先者。

编纂:心侍老周
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )