职贝云数AI新零售门户

标题: 国内 AI大模型产业发展深度分析 2024 [打印本页]

作者: GVUjP    时间: 昨天 15:53
标题: 国内 AI大模型产业发展深度分析 2024
伴随人工智能技术的加速演进,AI 大模型已成为全球科技竞争的新高地、将来产业的新赛道、经济发展的新引擎,发展潜力大、运用前景广。近年来,我国高度注重人工智能的发展,将其上升为国家战略,出台一系列扶持政策和规划,为 AI 大模型产业发展创造了良好的环境。
当前,通用大模型、行业大模型、端侧大模型如雨后春笋般涌现,大模型产业的运用落地将进一步提速。作为新一代人工智能产业的核心驱动力,AI 大模型广泛赋能我国经济社会的多个范畴,打开迈向通用人工智能的大门,推进新一轮的科技革命与产业变革。在大模型盛行的时代,产业发展到何种阶段,遇到何种应战,将来将走向何方,这些都是需求面对的成绩,亟需社会各界共同努力。
2023 年人工智能大模型片面迸发,给科技创新、消费生活带来严重变革、机遇和应战。全球大模型竞争日趋激烈,众多国产大模型锋芒毕露。
大模型与电力、批发、出版等传统行业的成功交融,展现对传统产业改造提升的潜力。大模型赋能金融、医疗等行业提质增效,对推进新质消费力疾速发展起到重要作用。
大模型持续健康发展,需求政策法规保驾护航,满足隐私保护、数据安全等多方面要求。等待将来大模型持续深耕技术创新并服务于各行各业,为全社会全方位地注入高质量发展的新动能。
AI 大模型的出现,使得应用人工智能技术来生成内容,从“可用”跨越到“好用”。消费内容是一切行业共有的需求,如今大模型曾经在电商、影视、传媒等范畴被规模运用。
大模型的商业化需求供需单方同时发力:供给侧来看,以Transformer 为代表的根技术存在分明成本成绩,当前大模型还有进一步紧缩成本、提高性价比的空间;需求侧来看,企业高效运用 AI 大模型的必然前提是,投入大量资金、人力、工夫以提升企业本身数字化程度。将来,人工智能生成内容从“好用”到“高效”,也许会再阅历一次或多次技术范式的颠覆。
2024 年,多重利好要素将推进大模型疾速发展,首先是“人工智能+”举动等来自政府层面的有力支持,其次用户提升生活、工作效率的需求激增,再加上科技公司加大对 AI 范畴投入资金、人力、技术研发,各环节协同支撑大模型发展。 当前大模型产业也面临应战,包括算力分散不足、Transformer 结构能否为最优的疑问、范畴数据稀缺、短少现象级运用的成绩。就产业趋向而言,投入基础模型训练的公司将来能够会大幅减少,转而更多的公司会去寻觅运用场景和爆款运用。vivo 结合自研大模型端侧化、矩阵化的技术优势并且会聚焦手机行业的运用阅历,应用大模型重构手机各类功能,找到落地场景,普惠更多用户。
第一章 扬帆起航:中国 AI 大模型产业发展背景
1.1 中国 AI 大模型产业发展政策驱动力
近年来,我国一直高度注重人工智能发展机遇和顶层设计,发布多项人工智能支持政策,国务院于 2017 年发布《新一代人工智能发展规划》。科技部等六部门也于 2022 年印发《关于加快场景创新 以人工智能高程度运用促进经济高质量发展的指点意见》对规划停止落实。
2024 年《政府工作报告》中提出展开“人工智能+”举动。伴随人工智能范畴中大模型技术的疾速发展,我国各地方政府出台相关支持政策,加快大模型产业的持续发展。
当前,北京、深圳、杭州、成都、福建、安徽、上海、广东等地均发布了关于 AI 大模型的相关政策。详细来看:
2023 年以来我国各地出台的大模型产业相关政策
(, 下载次数: 0)


(, 下载次数: 0)


(, 下载次数: 0)


(, 下载次数: 0)


(, 下载次数: 0)


1.2 AI 大模型产业发展技术驱动力
近年来,AI 大模型得到疾速发展,当前大模型热潮次要由言语大模型相关技术引领。言语大模型经过在海量无标注数据上停止大规模预训练,让模型学习大量知识并停止指令微调,从而获得面向多义务的通用求解才能。
2017年,Google提出基于自留意力机制的神经网络结构——Transformer 架构,奠定了大模型预训练算法架构的基础。2018 年,OpenAI 和 Google 分别发布了 GPT-1 与 BERT 大模型,预训练大模型成为自然言语处理范畴的主流。
2022 年,OpenAI 推出 ChatGPT,其拥有弱小的自然言语交互与生成才能。2023 年,OpenAI 多模态预训练大模型GPT-4 发布,其具有多模态了解与多类型内容生成才能。2024 年,OpenAI 发布视频生成大模型 Sora,提出时空碎片和分散 Transformer 技术,大模型的多模态生成才能的进一步成熟。本部分将从经典 Transformer 架构出发,经过片面梳理基于人类反馈强化学习、指令微调、提示学习等相关大模型技术,表现技术对于产业发展的带动作用。
1.2.1 Transformer 架构
Transformer 架构是目前言语大模型采用的主流架构,于 2017 年由 Google提出,其次要思想是经过自留意力机制获取输入序列的全局信息,并将这些信息经过网络层停止传递,Transformer 架构的优势在于特征提取才能和并行计算效率。
Transformer 架构次要由输入部分、多层编码器、多层解码器以及输入部分组成。其中,输入部分包括源文本嵌入层、地位编码器;编码器部分由 N 个编码器层堆叠而成;解码器部分由 N 个解码器层堆叠而成;输入部分包括线性层和Softmax 层。
Transformer 架构图
(, 下载次数: 0)


自留意力机制造为 Transformer 模型的核心组件,其允许模型在处理序列数据时,对每个词地位的输入停止加权求和,得到一个全局的上下文表示。
在计算自留意力时,模型首先将输入序列停止线性变换,得到 Q(查询)、K(键)和 V(值)三个向量。
然后,经过计算 Q 和 K 的点积,并运用 Softmax 函数,得到每个地位的权重。最后,将权重与 V 向量相乘,得到自留意力的输入。
为提高模型的表达才能,Transformer 模型采用了多头自留意力机制,这意味着模型在同一工夫关注来自不同表示子空间的留意力信息。多头自留意力的完成方法是将输入序列分成多个组,每个组运用一个独立的权重矩阵停止线性变换,并计算自留意力。最终,自留意力的输入被拼接起来,并经过一个线性层得到最终的输入表示。
在计算自留意力和多头自留意力之后,Transformer 模型运用前馈神经网络对输入序列停止变换。前馈神经网络由多个全衔接层组成,每个全衔接层都运用 ReLU激活函数。前馈神经网络的作用是对输入序列停止非线性变换,以捕捉更复杂的特征。
1.2.2 AI 言语大模型关键技术
AI 言语大模型关键技术次要触及基于人类反馈强化学习、指令微调、模型提示等相关技术。
(1) 基于人类反馈强化学习
基于人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF),是指将人类标注者引入到大模型的学习过程中,训练与人类偏好对齐的奖励模型,进而有效指点言语大模型的训练,使得模型可以更好地遵照用户意图,生成符合用户偏好的内容。
基于人类反馈强化学习详细包括以下几个步骤:
1)训练监督策略模型:运用监督学习或无监督学习的方法,对一个预训练的言语模型停止训练,经过给予特定奖励或惩罚引导 AI 模型的行为,使其可以根据给定的输入预测输入或行为。
2)训练奖励模型:让标记员参与提供有关模型输入结果的反馈,对模型生成的多个输入或行为的质量或正确性停止排名或评分,这些反馈被转换为奖励信号,用于后续的强化学习过程。
3)采用近端策略优化停止强化学习:先经过监督学习策略生成近端策略优化(PPO)模型,经过奖励机制反馈最优结果后,再将结果用于优化和迭代 PPO模型参数。详细而言,在 PPO 模型训练过程中,智能系统经过尝试不同的行为,并根据每个行为获得的奖励来评价其质量,智能系统逐渐改停止为策略。
基于人类反馈强化学习表示图
(, 下载次数: 0)


(2) 指令微调
指令微调 (Instruction Tuning),是一种协助言语大模型完成人类言语指令遵照的才能,在零样本设置中泛化到未知义务上的学习方法。指令微调是让言语大模型了解人类指令并按照指令要求完成义务,即在给定指令提示的状况下给出特定的回应。
指令微调可被视为有监督微调(Supervised Fine-Tuning,SFT)的一种特殊方式,但两者目的有所差别。SFT 是一种运用标记数据对预训练模型停止微调的过程,以便模型可以更好地执行特定义务,而指令微调是一种经过在(指令,输入)对的数据集上进一步训练大型言语模型(LLMs)的过程,以加强LLMs 的才能和可控性。指令微调的特殊之处在于其数据集的结构,即由人类指令和希冀的输入组成的配对,这种结构使得指令微调专注于让模型了解和遵照人类指令。
(3) 模型提示
经过大规模文本数据预训练之后的言语大模型具有作为通用义务求解器的潜在才能,这些才能在执行特定义务时能够不会显式地展现出来,在大模型输入中设计合适的言语指令提示有助于激发这些才能,称为模型提示技术。典型的模型提示技术包括指令提示和思想链提示。
指令提示(Instruction Prompt)。OpenAI 在 GPT-3 中初次提出上下文提示,并发现 GPT-3 在特定范畴少样本提示下可以达到人类程度,证明在低资源场景下非常有效。指令提示的核心思想是避免强迫言语大模型顺应下游义务,而经过提供“提示(Prompt)”来给数据嵌入额外的上下文以重新组织下游义务,使之看起来更像是在言语大模型预训练过程中处理的成绩。
思想链提示(Chain of Thought, CoT)。推理的过程通常触及多个推论步骤,经过多步推理允许产生可验证的输入,可以提高黑盒模型的可解释性。思想链是一种提示技术,已被广泛用于激发言语大模型的多步推理才能,被鼓励言语大模型生成处理成绩的中间推理链,相似于人类运用沉思熟虑的过程来执行复杂的义务。
在思想链提示中,中间自然言语推理步骤的例子取代少样本提示中的〈输入,输入〉对,构成〈输入,思想链,输入〉三元组结构。思想链被以为是言语大模型的“涌现才能”,通常只要模型参数规模增大到一定程度后才采用思想链才能。激活言语大模型的思想链才能方法,在提示中给出逐渐的推理演示作为推理的条件,每个演示都包含一个成绩和一个通向最终答案的推理链。
1.3 中国 AI 大模型产业发展市场驱动力
中国 AI 大模型产业发展源于多范畴的广泛需求,例如来自办公、制造、金融、医疗、政务等场景中降本增效、消费自动化、降低风险、提高诊断准确率、提高政务服务效率等诉求。相关范畴的创新和发展共同推进着中国 AI 大模型产业的蓬勃发展,预示着将来更广阔的市场前景。
1.3.1 办公场景
近年来,随着文字、语音、图像等处理才能跃迁,大模型摇身变为“助理”走入办公室和会议室,结合传统软件使得办公和会议智能化。
基于大模型的智能办公产品满足日常办公场景中文案生成、PPT 丑化、数据分析等各种需求。仅经过自然言语交互,用户便可将繁琐的文字、演示、数据处理工作交给“助理”,用节约的工夫做更有创意的事情。智能文档担任协助用户构建文章大纲、一键生成模板、生成内容、优化表达、处理和了解文档;智能演示承担自动排版丑化、生成演讲备注、一键生成幻灯片等义务;智能表格经过对话即可生成公式、数据批量处理、自动生成表格。
智能会议方面,大模型可从会议策划、同声传译、会议记录等各环节赋能。会议策划场景大模型根据会议主题等提示词,自动生成会议环节、会议分论坛、会议工夫、会议预算等残缺策划内容;
在大模型才能加持下,同声传译的准确性、及时性和多言语才能得到分明提升;经过大模型处理后,结构明晰、要点明白的会议记录结果使得会后回顾愈加高效。
1.3.2 制造场景
人工智能崛起引领制造行业的深入变革,改变研发设计、消费制造、供应链管理等流程。大模型+EDA/CAE/CAD,将传统研发设计软件效率进一步提升。大模型助力数字孪生和机器人,获得弱小的感知场景和执行义务才能。大模型交融供应链管理,完成工厂管理的智能化转型。
在研发设计阶段,以大模型+EDA 为例,应用云端扩展性完成设计自动化,并确保设计在电气方面准确无误,同时简化系统设计流程,延长 PCB 设计周转工夫。企业借此延长研发周期、降低研发成本、提升行业竞争力;消费制造中,应用 AIGC 和数字孪生技术,可模拟真实消费环境派出虚拟人代替工人停止风险、缺点排查,或是经过仿真设备操作场景,完成沉浸式作业教学。
拥有大模型功能的机器人仰仗机器视觉技术,可执行途径规划、物体辨认等义务;大模型集成于供应链管理系统中,能重构数字化办公流程,经过自然言语指令完成人机交互,推进企业停止更高效的管理决策、更便捷的数据分析与可视化,在需求端及时预测需求达到降本增效的目的,在仓库和物流端完成智能调度、智能跟踪和智能预警。
1.3.3 金融场景
金融行业存在前、中和后台的业务划分,在数字经济时代的浪潮中,相关业务已被大模型全局赋能提升效率。以银行为例,对话机器人、虚拟助理曾经逐渐出如今个性化服务、电子营销、金融欺诈检测、信贷支持等服务场景中。个性化服务方面,银行大模型以客户数据为根据,为客户提供定制的财务和产品计划;电子营销方面,大模型根据客户行为偏好生成个性化电子邮件;金融欺诈检测方面,大模型赋能专业人员检索大量数据辨认欺诈行为;信贷支持方面,大模型经过分析海量消费生活和信誉数据,为信贷部门人员生成高质量的信贷方案建议,减少银行贷款收益损失。
1.3.4 医疗场景
得益于近年来医疗大模型的不断迭代,复杂的医疗数据分析义务得以处理。由于患者行为数据的独特性,大模型经过个性化设计,满足患者“千人千面”的医疗服务需求,运用于智慧影像、智慧手术、智慧健康等范畴。智慧影像覆盖 CT、MR、DR、US、DSA、钼靶等医疗影像场景,为患者停止早期检测、诊断及健康风险评价;智慧手术功能大幅提高患者病情评价准确度,打牢术前风险评价、术中手术规划、术后预后估计的基础;智慧健康则作为普通患者的贴身健康助手,经过小程序等便捷方式为患者提供高质量导诊服务和个性化健康建议。
1.3.5 政务场景
在办公、制造、金融、医疗场景得到助力的同时,政务场景下的效率、信息参考范围、阅历共享、规范性等常见痛点也获得大模型才能加持得以处理。为提升效率,大模型应用自动化的政策检索、政策比对处理海量政策参考、人工分析比对的耗时成绩;为减少信息参考范围,政策撰写助手结合政策数据威望白名单,并接入政策全量库,避免不牢靠信息来源引发言论风险;为提高政策管理阅历共享,大模型引入政策阅历知识库,提升政务业务了解和政策管理才能;为规范政策撰写,政务大模型仰仗规范化生成、检查功能维护成果的规范性、威望性。
第二章 百舸争流:中国 AI 大模型产业现状及典型案例
2.1 AI 大模型次要特征
AI 大模型具有泛化性(知识迁移到新范畴)、通用性(不局限于特定范畴)以及涌现性(产生预料之外的新才能)特征。
以 ChatGPT 为代表的 AI 大模型因其具有巨量参数和深度网络结构,能学习并了解更多的特征和形式,从而在处理复杂义务时展现弱小的自然言语了解、意图辨认、推理、内容生成等才能,同时具有通用成绩求解才能,被视作通往通用人工智能的重要途径。
AI 大模型的三大特征:泛化性、通用性、涌现性
(, 下载次数: 0)


2.2 AI 大模型次要类型
按照部署方式划分,AI 大模型次要分为云侧大模型和端侧大模型两类。云侧大模型由于部署在云端,其拥有更大的参数规模、更多的算力资源以及海量的数据存储需求等特点;端侧大模型通常部署在手机、PC 等终端上,具有参数规模小、本地化运转、隐私保护强等特点。
详细而言,云侧大模型分为通用大模型和行业大模型;端侧大模型次要有手机大模型、PC 大模型。从云侧大模型来看,通用大模型具有适用性广泛的特征,其训练数据涵盖多个范畴,可以处理各种类型的义务,普适性较强。
行业大模型具有专业性强的特点,针对特定行业(如金融、医疗、政务等)的需求停止模型训练,因此对特定范畴具有更深的业务了解和场景运用才能。从端侧大模型来看,手机和 PC 大模型由于直接部署在设备终端,让用户体验到愈加个性化和便捷的智能体验。
AI 大模型次要分为云侧大模型和端侧大模型两类
(, 下载次数: 0)


当前,我国 AI 大模型产业呈现蓬勃发展的态势。伴随多家科技厂商推出的AI 大模型落地商用,各类通用、行业以及端侧大模型已在多个范畴获得了分明的成果,如在金融、医疗、政务等范畴,AI 大模型已成为提升服务质量和效率的重要手腕。
我国具有代表性的通用 AI 大模型次要包含科大讯飞的讯飞星火认知大模型、百度公司的文心一言大模型、阿里巴巴的通义千问大模型等;行业AI 大模型次要涵盖蜜度的文修大模型、容联云的赤兔大模型、用友的 YonGPT 大模型;同时具有云侧和端侧大模型的端云结合 AI 大模型次要有 vivo 的蓝心大模型;端侧 AI 大模型次要以蔚来的 NOMI GPT 大模型为代表。
中国 AI 大模型分类及典型案例
(, 下载次数: 0)


2.3 中国 AI 通用大模型典型案例
案例一:科大讯飞—讯飞星火认知大模型
(1)大模型简介:
讯飞星火认知大模型是科大讯飞推出的新一代认知大模型,可完成基于自然对话方式的用户需求了解与义务执行。讯飞星火从赋能万物互联时代的人机交互、赋能知识学习与内容创作、提升数智化消费力三个方面展现其运用才能。讯飞星火认知大模型具有七大核心才能:文本生成、言语了解、知识问答、逻辑推理、数学才能、代码才能和多模态才能。
(2)大模型优势:
2024 年 1 月,讯飞星火认知大模型 V3.5 发布,七大核心才能片面提升。据科大讯飞宣称,数学、言语了解超 GPT-4 Turbo,在代码才能方面曾经达到 GPT-4Turbo 的 96%。另外,星火大模型在多模态了解方面达到 GPT-4V 的 91%,其中语音的多模态才能曾经超过 GPT-4。
讯飞星火认知大模型 V3.5 七大才能
(, 下载次数: 0)


讯飞星火认知大模型 V3.5 从三个角度展现了模型才能的提升,赋能万物互联时代人机交互、赋能知识学习与内容创作、提升数智化消费力。人机交互方面,讯飞星火 V3.5 在语义了解、指令跟随和多轮对话中展现优秀才能,在心情感知和拟人合成方面也有出色表现;知识学习与内容创作方面,要素抽取、成绩生成等底层才能的提高,可以协助知识学习和内容创作范畴,产生更丰富更有用的智能体。
讯飞星火大模型可以结合外部知识停止合理拓展,做到“引经据典”;数智化消费力方面,逻辑推理才能和时空推理才能并重,数学则是大模型的基础才能,而代码才能用于生成各种工具链接虚拟和理想世界,最后多模态才能也是机器人、工业、家庭等场景中必备的才能。讯飞星火 V3.5 在这些关键技术范畴获得分明提高。
(3)大模型运用:
讯飞星火七大才能的提升,完成了各类运用场景功能晋级。
案例二:百度公司—文心一言大模型
(1)大模型简介:
文心一言是百度研发的人工智能大言语模型产品,具有跨模态、跨言语的深度语义了解与生成才能,在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等众多范畴都能为用户提供高质量服务。文心一言拥有四大基础才能:了解才能、生成才能、逻辑才能、记忆才能。
(2)大模型优势:
2023 年 10 月发布的“文心大模型 4.0”,相比上一代文心大模型,四大才能分明晋级,其中逻辑提升幅度是了解的 3 倍,记忆提升幅度是了解的 2 倍。
了解才能方面,文心一言能听懂潜台词、复杂句式、专业术语、前后乱序、模糊意图等复杂提示词,也能胜任代码了解与调试义务;
生成才能方面,文心一言能疾速生成风格多样的文本、代码、图片、图表、视频,比如停止文案创作、制定生活计划、编写高质量代码;
逻辑才能方面,文心一言能帮用户处理复杂的逻辑难题、困难的数学计算、重要的职业/生活决策、代码纠错、常识推理、逻辑校验、平面几何、辩论灵感等;
记忆才能方面,经过多轮对话后,文心一言依然能记住对话的重点,轻松胜任复杂成绩、沉浸体验角色对话。
文心大模型 4.0 的才能提升源自相关举措:
(1)在万卡算力上基于飞桨平台,经过集群基础设备和调度系统、飞桨框架的软硬协同优化,支持了大模型的波动高效训练。
(2)经过建设多维数据体系,构成了从数据发掘、分析、合成、标注到评价闭环,充分提高数据的应用效率,大幅提升模型效果。
(3)基于有监督精调、偏好学习、强化学习等技术停止多阶段对齐,保证了模型可以更好地与人类的判别和选择对齐。
(4)应用可再生训练技术经过增量式的参数优,有效节省了训练资源和工夫,加快了模型迭代速度。
文心大模型 4.0 典型特征
(, 下载次数: 0)


(3)大模型运用:
文心大模型在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等方面已有运用面向用户开放。
文学创作方面,文心一言可以明晰地表达观点、传递情感,因此可以运用于小说、散文、诗歌等文学作品的创作中;
文案创作方面,在商业范畴,文心一言可以撰写商业计划、市场分析报告等商业文案,提供有力的文字支持。文心一言可以激发创意思想,为广告行业提供新的灵感和想法,可以协助广告人员疾速构思出吸引人的广告文案和宣传语;
搜索问答方面,基于文心一言的聊天机器人可以与用户停止自然言语交互,了解用户的意图和需求,并提供相应的回答和建议。这种运用可以广泛运用于生活服务、教育辅导、客服等范畴;
多模态生成方面,文心大模型支持图像生成和处理,可以根据用户需求生成图像或者对已有图像停止处理编辑。文心大模型还支持语音合成、语音辨认和音频分类。文心大模型还能对视频数据停止处理,或将文本转化为动态图像序列完成视频分类、目的检测等义务;
数理逻辑推算方面,文心大模型可以处理复杂的数学成绩,也可以成为代码编写助手,比如百度基于文心大模型研制了智能代码助手 Comate,提供智能引荐、智能生成、智能问答等多种功能,支持多种编程言语和 IDE。
案例三:阿里巴巴—通义千问大模型
(1)大模型简介:
通义千问是阿里云研发的预训练言语模型,基于先进的自然言语处理技术(NLP), 执行了解、生成和解释人类言语、图片和文档等义务。通义千问能在创意文案、办公助理、学习助手、兴趣生活等方面为运用者提供丰富的交互体验。
通义千问具有中英文了解、数学推理、代码了解等才能。
(2)大模型优势:
2023 年 10 月,千亿级参数大模型通义千问 2.0 发布,相比 1.0 版本,其在复杂指令了解、文学创作、通用数学、知识记忆、幻觉抵御等才能上均有分明提升。
中英文了解才能是大言语模型了解和表达的基础才能,英语义务中,通义千问 2.0 的 MMLU(伯克利大学、哥伦比亚大学等结合发布)基准得分是 82.5。中文义务中,通义千问 2.0 在模型训练中学习了更多中文语料,在 C-EVAL(上海交大和清华结合研发的中文大言语模型测试集)基准上获得最高分;
数学推理方面,在推理基准测试 GSM8K(OpenAI 发布的小学数学测试集)中,通义千问排名第二,展现了弱小的计算和逻辑推理才能;
代码了解方面,HumanEval(OpenAI发布)测试衡量大模型了解和执行代码片段的才能,通义千问排名第三,这一才能是大模型在编程辅助、自动代码修复等场景的基础。
通义千问 2.0 参数及目的评测
(, 下载次数: 0)


(3)大模型运用:
通义千问目前次要运用于四个方向:创意文案、办公助理、学习助手、兴趣生活。
创意文案运用包括:“撰写营销文案”,输入产品引见获得量身定制的金牌营销文案。“文章润饰”能对用户提交的文章停止深度分析,发掘其中表达不足之处,提供词汇句式变化建议。“直播带货剧本生成”,基于丰富的商品信息和用户需求,为电商主播提供生动风趣且具有营销力的脚本内容;
办公助理运用于:“SWOT 分析”为用户提供片面、深化且精准的战略决策支持,从多元视角了解并评价内外部环境对特定项目的影响。“PPT 框架生成”,智能地为用户构建专业且逻辑明晰的 PPT 结构;
学习助手运用包含了:“标题加工厂”,根据提供的专业以及学科范畴停止高质量试题生成,大大节省了教师、家长以及教育机构在出题上的工夫和精神。“学习计划站”可为用户提供个性化、系统化的学习途径规划,定制高效且迷信的学习日程安排;
兴趣生活运用有:“会放飞的菜谱”,输入菜名逐渐指点提供美食烹饪秘诀。“AI 健身教练”为用户制定专属健身计划。“写歌词”,根据用户提示的歌名写出生动歌词。
2.4 中国 AI 行业大模型典型案例
案例四:容联云—赤兔大模型
(1)大模型简介:
赤兔大模型是容联云开发的面向企业运用的垂直行业多层次大言语模型,赋能企业搭建专属智能客服和数智化营销,完成从“降本增效”到“价值创造”的退化。丰富的智能运用为赤兔大模型才能保驾护航,包含会话洞察、业务话术、问答知识库、知识运用、数据分析、智能对话框架、流程管理。
(2)大模型优势:
赤兔大模型三个核心点分别是智能性、可控性和投产比。
智能性方面是客户最关怀的,首先才能能否足够丰富,能否处理以前不能处理的成绩以及相关才能到底能做多好。
智能性方面,包括检索加强、会话分析、逻辑推理、数据分析。
检索加强是指在海量文档中疾速定位到信息,经过整理给客户提供答案。
会话分析能让模型在对话中发现多维度信息,包括心情、立场、各种细节的意见,并且根据不同业务疾速切换业务场景。
逻辑推理体如今引荐话术的缘由,赞扬、预警的缘由这种因果分析才能。
数据分析体如今对数据更细致且自动化的分析,减少技术人员和业务人员的数据层面上的操作;
可控性方面,赤兔大模型在道德、伦理、安全、风格、偏好上对齐,对话或话术生成时满足基本安全需求。另外让模型知道应该处理的知识范畴、知识边界,从而避免自在对话潜在的安全风险和资源耗费;
投产比方面,大模型弱小才能来源于大规模,而大规模需求大投入,合理的投产比是客户采取方案的底层逻辑。所以明白能否一切场景都需求大模型,AI 底座上,没有摒弃小模型,大小模型相配合完成对下层才能的输入。机制上合理调动分配,比如有的环节大模型靠后完成线下或离线的工作,有的环节大模型调动指挥小模型完成。
(3)大模型运用:
基于赤兔大模型,容联云发布了生成式运用“容犀 Copilot”。
容犀 Copilot具有三大核心才能:大模型话术、智能知识库、会话洞察。
大模型话术:容犀Copilot 后台一键疾速对海量历史会话数据停止核对挑选,挑选出更佳话术并生成金牌话术,兼顾质与量的同时,发掘出客户高频关注的成绩,从成绩中洞悉业务痛点;
智能知识库:可以协助企业从零末尾、低成本地疾速构建话术库,包括了解文档知识、知识快搜、智能问答等,大幅提升构建效率;
会话洞察:高效便捷洞察每一通会话沟通状况,分析客户诉求,精准诊断成绩并优化。回归实践业务本身,容犀 Copilot 深化金融行业细分场景,打造场景化客服助手,譬如分期挽留助手、荐卡挽留助手、赞扬安抚助手等,实时辅助疾速洞察客户需求,引荐更佳应对话术,诊断客户心情变化,提示措辞及留意事项。
容犀 Copilot 产品运用场景
(, 下载次数: 0)


案例五:蜜度—文修大模型
(1)大模型简介:
文修大模型是蜜度推出的一款聚焦于智能校正范畴的大言语模型,基于蜜度在校正范畴的知识和阅历积累,为政务单位、旧事媒体、企业单位、学校机构、出版机构等专业用户提供更贴合运用场景的校正服务。
文修大模型具有校正才能强、速度快、婚配度高三大特点,更好地处理垂直行业的成绩。
(2)大模型优势:
数字化时代,内容创作与传播速度惊人,信息准确无误地传达给公众尤为重要,蜜度文修大模型经过优秀的校正才能、高效的处理速度和高度的婚配度应对变局。校正才能方面,文修大模型以拼写错误、语义错误、语法错误为基础,以内容差错、常识校正差错、内容风险辨认三大类校正类型,27 类细分类型为校正标准,有效满足出版行业、旧事行业的“三审三校”的校正规范和实践业务需求,提供诸如广告法检测、常识校正等更为片面的校正服务;校正速度方面,文修大模型几秒钟就能校正完一篇千字文章,几分钟即可校正一本 10 万字书稿。其疾速校正的背后是实真实在的“学习才能”,文修大模型能迅速将人们短工夫内难以学习消化的内容,转变成本身的校正才能,完成疾速输入;婚配度方面,蜜度服务政府部门、媒体单位十余年,数十款智能运用产品及处理方案,覆盖政务部门、出版单位多个办公环节及场景,拥有成熟的流程服务,在洞察用户需求和运用场景方面拥有深沉的阅历。
(3)大模型运用:
文修大模型满足政务单位、旧事媒体、企业单位、学校机构、出版机构的多行业场景运用需求。
政务单位范畴,赋能各级政务部门校正流程智能化,提供文字材料的内容错敏校正、修正提示和文本润饰等服务,全力保障内容的准确性及严谨性,支持内网环境下校正,满足更高保密需求;
旧事媒体范畴,文修大模型深化旧事媒体工作的各个环节,对多模态内容停止多类错敏校正,协助疾速定位错误并高亮显示,让内容愈加规范严谨,有效维护官方账号的公信力;同时提供文本润饰服务,提高出稿速度,保障旧事时效性;
企业单位范畴,全流程切入企业办公场景,从内容纠错、提升文本质量等多方位出发,优化宣发内容,提高文案吸引力,助力营销效果分明提升;
学校机构范畴,针对学校机构的宣传材料、新媒体稿件、科研报告、学术论文等内容停止片面校审,有效降低文字错误率,保障学术严谨性。
经过 AI 润饰功能助力文章、报告、材料的起草、优化工作,有助于进一步提升学校传播力、影响力;出版机构范畴,提供专业、便捷、高效的内容筛查及文字质量把关服务,协助各出版机构高效处理多言语文本,降低内容差错概率,保障内容的规范性、准确性。
案例六:用友—YonGPT 大模型
(1)大模型简介:
YonGPT 是用友基于数字和智能技术服务企业和公共组织数智化的企业服务大模型。YonGPT 在企业服务范畴的运用次要集中在 4 个方向:智能化的业务运营、自然化的人机交互、智慧化的知识生成、语义化的运用生成。
YonGPT 企业服务大模型全体架构图
(, 下载次数: 0)


(2)大模型优势:
用友人工智能研发团队基于大规模的商业运用数据,结合企业运用场景和范畴阅历,标记了大量的企业服务语料数据,构成丰富的企业服务大模型训练素材,并将业务知识与范畴阅历融入企业服务大模型,确保了 YonGPT 的专业性、适用性及抢先性。
同时 YonGPT 经过上下文记忆、知识库表索引、Prompt 工程、Agent执行、通用工具集等扩大大模型的存储记忆、适配运用和调度执行才能,构成体系化的企业服务大模型。YonGPT 还优化了企业服务大模型的训练效率和成本,集成了丰富的开发工具和优化算法,经过自有的数据管理、大模型精调、大模型评价优化、大模型推理和插件服务等功能,为大模型的构建和服务提供波动且有效的支撑。
(3)大模型运用:
用友企业服务大模型 YonGPT 围绕四个方向推进模型训练和产品效果优化,提供深化到客户业务前端的全价值链、全场景的泛在智能和群体智能运用。
在智能化业务运营方面:YonGPT 经过弱小的数据分析和预测才能,深化洞察企业运营、辨认潜在的业务风险和机会,并提供智能化的处理方案,从而提高运营决策程度和业务运营效率;
在自然化人机交互方面:YonGPT 经过弱小的自然言语处理技术和了解才能,使能企业运用和服务与用户停止自但是流利的对话交流,以“人”为本的方式完成不同运用的调用、衔接、组装,更自然、高效地完成工作;
在智慧化知识生成方面:YonGPT 经过从海量数据和信息中提取、整合知识,生成新的、有价值的知识内容,涵盖了行业处理方案、专业范畴知识分享,助力企业和用户片面应用本身知识的储备和积累,促进知识的传播和运用;
在语义化运用生成方面:YonGPT 经过对用户需求、企业业务和数据特征的了解,可以自动生成具有语义化才能的运用程序,全方位提升企业个性化运用服务的创建效率。
此外 YonGPT 在智能化场景服务中完成四个服务:企业支出/利税运营智能分析,可以实时掌控运营状况、疾速洞察成绩所在、精准预测企业效益、有效预见应对变化;
智能生单,交融了丰富的供应链阅历,经过“交互革新式”订单生成助手,完成疾速智能生单,提高企业效能;
智能招聘,协助企业疾速精准辨认定位目的人才,从海量简历池中发现人才,经过 AI 互动优化应聘体验,完成选人、用人的精准决策;
智能大搜,提供“沉浸式”搜索新体验,加速企业知识的价值化服务,并洞察用户需求、完成搜推一体,让知识赋能业务和组织。
案例七: “写易”智能创作引擎
(1)大模型简介:
“写易”智能创作引擎是人民网推出的垂类写作大模型,依托自主研发的主流价值观大模型针对写作场景训练而成。“写易”智能创作引擎合适党政党媒、央企国企、学校医院等有日常阅读需求和写作需求的群体,提供专业威望、系统全体、持续更新的数智服务,从而更好地启示创作者的写作灵感。
“写易”智能创作引擎产品架构
(, 下载次数: 0)


(2)大模型优势:
“写易”智能创作引擎深化发掘用户需求,构建了“随查”“随写”“随审”的交互体验, 具有创作高效、安全准确、内容丰富的特点。
其次要功能有:高效的智能创作引擎:“写易”智能创作引擎依托于超过 25 万条的威望主流语料库,创新性地完成了基于检索加强的辅助生成才能。可经过标题自动生成优质核心内容,同时结合标题与观点等上下文信息,为用户生成相关性更强、准确性更高的文章素材,从而分明提升写作效率;
专业的涉政内容审校:
1.原文援用检测:检测文天分否援用了重要讲话、重要政策文件,分析援用的规范性,同时给出原文的出处等溯源信息。
2.规范表述审校:对指导人重要讲话、党和国家严重政策重要文件等文本停止规范性检测。
3.人物信息审校:对文本中出现的人物姓名及职务信息等停止订正检测。
4.关键信息审核:检测文本中有标志性、代表性的严重事情、重要人物、重要敏感信息等内容。
5.基础纠错:对文本中的错别字检测、标点符号错误检测,包括中文、英文拼写、成对标点、特殊数字与符号等错误;
内容丰富的写作素材知识库:依托人民网和人民日报,装备弱小的材料库,系统化整理信息,按照工夫、内容、方式、图文音频等多维度停止分类汇总。及时同步《人民日报》每日的精选文章,实时提炼更新当日最优标题、最美佳句、最优词语等内容,为用户提供新颖的写作素材。
(3)大模型运用:
“写易”智能创作引擎,服务于以国资央企、党政机关、事业单位、党媒党网、地方融媒体、教育系统、医疗系统等为重点的全行业客户,满足客户在不同场景中的定制化高效写作需求。
“写易”智能创作引擎可结合客户数据库停止定制,详细而言,人民网以行业客户数据库语料为核心,《人民日报》内容为辅助,为客户定制化训练“写易”智能创作言语大模型,协助提高写作才能、积累写作素材、规范写作格式。在写作过程中还可以为标题撰写、修辞运用、援用诗文和网言网语等提供丰富素材,协助创作者启示灵感、提供思绪,从而自动、高效地生成符合客户写作场景的高质量文章素材,为客户提供全维、全时、全域的智能化服务,助力工作总效率大幅提升。
2.5 中国 AI 端云结合大模型典型案例
案例八:vivo—蓝心大模型
(1)大模型简介:
蓝心大模型是行业首个在手机端运转的开源自研大模型,也是更合适中文用户的中文开源大模型,其包含十亿、百亿、千亿三个参数量级,共 5 款自研大模型(10 亿、70 亿、700 亿、1300 亿和 1750 亿)。
随着参数提升,蓝心大模型逐渐具有文本总结、言语了解、文本创作、知识问答、角色扮演、复杂逻辑推理、复【杂义务编排等才能。基于蓝心大模型才能,vivo 开发出蓝心小 V 和蓝心千询两款手机端产品。
vivo 蓝心大模型矩阵
(, 下载次数: 0)


(2)大模型优势:
1)矩阵化优势
vivo 大模型矩阵具有不同参数量级、多种部署方式,可运用于不同运用场景,在满足用户手机体验的同时,优化大模型推理功能以及端侧部署时占用的手机内存、功耗。
10 亿参数的蓝心大模型(1B),是面向端侧场景打造的专业文本大模型,具有本地化的文本总结、图片风格化才能,适用于需求疾速本地化摘要、生图的场景;
70 亿参数的蓝心大模型(7B),是面向手机打造的端云两用模型,有良好的上下文关联才能和义务拆解才能,在言语了解、文本创作等场景下表现优秀。蓝心大模型 7B 也是手机行业首家开源的大模型,完成 AI 普惠;
700亿参数的蓝心大模型(70B),是 vivo 面向云端服务的主力模型,在角色扮演、知识问答等场景下表现优秀,既有智能涌现,也能兼顾成本和功能。
面向复杂义务,vivo 也推出了两款千亿参数模型,1300 亿和 1750 亿大模型 ,仰仗更丰富的知识量提供愈加专业的智能体验。
2)端侧优势
蓝心大模型 1B 和蓝心大模型 7B 可在手机端运转,展现了出词快、内存低、全天候、真安全的弱小端侧运转优势。
出词快:vivo 对手机端上的 1B 模型优化,测试出字速度极限可达 60 字每秒,远超人眼约 10-20 字每秒的阅读需求;
内存低:vivo 优化模型在手机端的内存占用成绩, 蓝心大模型 1B 和蓝心大模型 7B分别只需占用 1.3G 和 3.8G 手机内存。
全天候:将蓝心大模型置于终端设备上可以减多数据延迟,并可以满足例如出差飞机、高铁等无网弱网场景下的大模型运用需求,使得一些运用可以全天候正常运转。
真安全:vivo 完成端侧内容安全过滤模型,优化输入语料和大模型生成内容的合规性成绩,端侧大模型有助于在本地处理数据构成闭环,减少了敏感信息经过网络传输的风险,为大模型运用场景落地移动终端提供安全基石。
3)算法优势
蓝心大模型具有三大算法优势:弱小的基础才能、精准的指令跟随以及正确的价值取向。
首先,弱小的基础才能是大模型的根基。
在预训练阶段,vivo 应用最前沿的 Transformer 架构,改良留意力机制、地位编码等关键模块,采用混合精度训练以及梯度缩放策略延长训练周期。
其次,精准的指令跟随是大模型与用户交互的核心。
vivo 对于微调采用“target only loss”方法,并经过聚类分析对指令停止顺应性处理,以更好地确保模型的平衡性。
第三,正确的价值取向是大模型的灵魂。
在强化学习阶段, vivo 建立了 300 余名专业人员组成的审核团队,制定了 200 余项的安全审查机制,对模型的输入停止筛查和标注。同时,vivo 采用离线采样策略和双重奖励模型等策略,在安全性上有分明提升。
(3)大模型运用:
1)蓝心小 V蓝心小 V 是 OriginOS 4 上搭载的一款全局智能辅助功能,支持超能语义搜索、超能问答、超能写作、超能创图、超能智慧交互。
超能语义搜索:运用自然言语即可搜索手机中的照片、文档、日程等信息;超能问答:根据用户上传的文档,疾速提供文档总结,也可根据文档内容疾速问答,还可以是知识百科开放式问答;
超能写作:基于用户的要求,结合 AI 才能给用户生成文本,如润饰、扩写、总结、格式文本等;
超能创图:1、文生图和图生图:基于用户文字描画或上传图片,生成目的图片。2、AI 路人消弭(路人隐身):上传包含路人的图片,经过对话消弭路人,生成更为纯净的图片;
超能智慧交互:1、智能识屏服务功能:一键辨认屏幕上的文本、网页链接,提取有效信息;2、超直觉化的交互方式:交互更多元,语音、文字、点击、拖拽、悬浮方式,互动更轻松。
2)蓝心千询
vivo 基于蓝心大模型打造的全天侯 AI 公家小帮手——蓝心千询,覆盖 AI对话和 AI 灵感两大核心运用场景。蓝心千询是手机行业首个大模型公开版收费APP。
AI 对话模块,蓝心千询支持“超能问答”以及“超能创图”两大功能,用户可以经过 AI 对话停止文本问答、开放问答或是基于文档的问答,以高效获取信息、知识。另外,无论写诗、AI 作画、创作歌词、撰写标题/活动方案,蓝心千询皆可胜任。
AI 灵感模块,蓝心千询可以提供社交媒体文案创作、PPT 大纲生成、中英文本互译等功能,还设置有穿搭建议等风趣的灵感工具。灵感广场设置有不同场景下的灵感技能卡片,覆盖工作、学习生活中的创作场景。蓝心千询将基于卡片语境疾速生成对应文案,为用户的工作、学习、生活提供广泛灵感支持。
第三章 大浪淘沙:中国 AI 大模型产业发展所面临的应战
3.1 大模型产业遭遇算力瓶颈
随着 AI 大模型规模呈现指数级增长,训练大模型越发依赖高功能 AI 芯片。
AI 大模型的训练速度、产出质量,都和算力直接相关,对于 GPT 这种大言语模型(LLM)来说,算力的要求更高,也决议了模型的“智商”。目前次要以英伟达的 A100、H100 为代表的高功能 AI 芯片运用到主流 AI 大模型的训练过程。
以ChatGPT 为例,微软 Azure 云服务为其提供了 1 万枚英伟达 A100 GPU,这个算力也正是国内云计算技术人士共识的 AI 大模型门槛。
但是国内拥有 1 万枚 GPU 的企业很少,而且单枚 GPU 普遍弱于英伟达 A100。由于英伟达 A100 及以上功能 GPU被列入管制清单,目前中国企业能获取的替代品为英伟达 A800,但是 A800 也存在缺货和溢价的状况。
从我国自研 AI 芯片来看,中国本土的高功能芯片龙头以华为海思、寒武纪、地平线、昆仑芯等为代表。
我国正在高功能芯片范畴加大投入并获得极大停顿,部分处理方案正替代英伟达成为一些大厂的选择。
但国产芯片功能目前仍与国际顶尖程度存在一定差距。总体而言,国内 AI 高功能芯片市场受出口限制和国内技术瓶颈的双重影响,大模型产业发展遭到算力层面的一些制约。
3.2 主流大模型架构仍存在诸多局限
当前,主流 AI 大模型所运用的 Transformer 架构存在耗费算力资源大、占用内存储量多等局限性。
首先,Transformer 架构耗费的算力资源普遍较大。传统 Transformer 架构由于算法特性,计算量会随着上下文长度的添加呈平方级上升。假如用户输入的上下文添加 32 倍,计算量能够会添加 1000 倍以上。
其次,基于 Transformer 架构的大模型对存储设备的要求也更高。在训练过程中需求在内存中存储参数的当前值、梯度以及其他优化器形态。模型的参数越多,所需的计算就越多,需求的存储空间就越大。如 1000 亿个参数的 Transformer模型,存储这些参数就需求 400GB 的空间。
3.3 高质量的训练数据集仍需扩展
国内的 AI 大模型数据次要来自互联网、电商、社交、搜索等渠道,存在数据类型不片面,信息可信度不高等成绩。
全体来看,我国可用于大模型训练的中文数据库体量严重不足。如悟道语料库,其包括文本、图文和对话数据集,最大的仅 5TB,其中开源的文本部分仅为 200GB。另外一个开源的中文本数据集CLUECorps 为 100G。相比之下,GPT-3 的训练数据量,以英语为主,达到 45TB。
此外,国内大模型的数据还缺乏多数据源的调用,可供大模型训练的有效数据源呈现碎片化分散形态,如微信公众号的文章仅在搜狗引擎支持调用,而多数大模型如智谱清言在联网搜集数据时无法直接调用微信公众号文章。
当前,政府部门的威望数据、大型企业掌握的行业或外部数据通常不对外公开。以阿里巴巴的“通义千问”大模型为例,训练数据来自公开来源的混合数据,中文语料次要来自知乎、百度百科、百度知道等公开网络数据,来源于政府及企业数据较少。将来,仍需构建高质量的 AI 大模型训练数据集,不断扩大数据源提高数据质量。
3.4 大模型爆款运用尚未出现
自 ChatGPT iOS 版本发布近十个月以来,该运用不断在下载量、用户支出和会话时长方面牢牢占据生成式人工智能运用下载量榜单前三名的地位。
GPT4.0推出后,已支持语音输入和输入,可以了解用户的基本自然言语语音指令并停止回应,也可以将生成的文本以语音方式播放出来。
此外,OpenAI 于 2024 年 1 月上线包含超 300 万个运用的 GPT 商店 GPTs。GPTs 的运用被划分为“写作”“效率”“研讨和分析”“编程”“教育”和“生活方式”等类目。
如抢手运用 Consensus可以从 2 亿篇学术论文中停止搜索,并获得迷信的答案;Grimoire 可以在用户填写基本信息后提供所需的 HTML、CSS 和 JavaScript 代码,创建网站(或其他)的编程运用。
相比而言,国内的 AI 大模型产业至今没有出现爆款级运用,缘由在于尚未找到商业化思绪,缺乏满足客户需求的个性化运用。我国大模型产业要推出爆款级运用,势必要在运用范畴做深做细,让每一个用户都可以充分享遭到大模型所带来的真正便利。
第四章 天阔云高:中国 AI 大模型产业趋向展望
4.1 AI 云侧与端侧大模型满足不同需求,C 端用户将成为端侧的次要客群
我国云侧大模型百花齐放数量众多,以百度文心一言、阿里通义千问、科大讯飞星火、腾讯混元等为代表。弱小的算力和海量的训练数据库,支撑大言语模型高参数,云侧大模型可以提供言语了解、知识问答、数学推理、代码生成等才能。
一方面,面向 C 端个人用户,云侧大模型提供智能问答、文本生成、图片生成、视频生成等功能。
另一方面,面向 B 端企业用户,云侧大模型变革企业传统业务形式,提供营销、客服、会议记录、文本翻译、预算管理等个性化服务。
端侧大模型具有成本低、移动性强、数据安全等优势,次要运用在手机、PC等终端设备上。
端侧大模型次要面向 C 端用户,重塑传统个人设备的运用方式和习气,提供手机文档搜索、智能识屏、图像创作、生活助手、出行助手等专属服务。成本方面,根据云侧大模型每次调用成本、用户数、用户运用频率不同,云侧大模型服务器每年成本可达数亿或数十亿,高昂的服务器支出成为各大厂商发展大模型的妨碍。
将大模型端侧化,能把一部分云端计算转移给终端,从而大大降低云端服务器成本。安全方面,由于端侧大模型数据保存在本地,个人数据不需求上传云端,个人隐私数据愈加安全。丰富的运用场景、较低的模型成本、安全的隐私保护,使得将来大模型端侧化能够成为趋向。
瑞银估计生成式 AI 智能手机出货量将从 2023 年的 5000 万部增长到 2027 年的 5.83 亿部,到 2027 年支出将达 5130 亿美元。将来面向广大 C 端用户的端侧大模型市场前景广阔。
4.2 AI 大模型趋于通用化与公用化,垂直行业将是大模型的主战场
通用大模型具有参数规模大、泛化才能强、多义务学习才能优等特点。通用大模型参数规模较大,达到数百亿甚至上千亿参数。经过大规模数据训练,通用大模型能学习捕捉复杂规律和特征,对未见过的数据做出预测。
通用大模型能了解学习多种义务,如文本总结、对话问答、逻辑推理等。通用大模型得益于大规模预训练和微调范式,可完成多范畴义务,并具有多模态(包括文字、图像、语音、视频)了解和生成才能。
行业大模型适用于金融、政务、医疗等特定行业和范畴,更好处理相关行业的特定义务。详细而言,金融大模型能协助金融企业评价信誉风险;政务大模型提供政务问答、公文撰写润饰、内容审核;医疗大模型为医生和患者提供影像诊疗、手术评价、导诊服务。
与通用大模型相比,行业大模型具有专业性强、数据安全性高等特点,将来大模型真正的价值体如今更多行业及企业的运用落地层面。
一方面,行业大模型将通用大模型用于构成多范畴才能的资源集中于特定范畴,模型参数相对较小,对于企业落地而言具有分明的成本优势。
另一方面,行业大模型结合企业或机构外部数据,为 B 端用户的实践运营场景提供服务,能愈加表现模型对于机构的降本增效作用。
4.3 AI 大模型将广泛开源,小型开发者可调用大模型才能提升开发效率
将来,大模型开源将成为趋向,一方面能降低大模型开发者的运用门槛,另一方面也能提高算法的透明度和可信度。
从详细停顿来看,2022年8月,清华大学开源中英双语预训练模型 GLM-130B,运用通用模型算法停止预训练。2023年6月,百川智能发布开源可商用大规模预训练言语模型 Baichuan-7B,支持中英双语。2023年10月,智谱AI 开源ChatGLM3系列模型。2023年11月,vivo开源70亿参数的大模型,向广大开发者提供了获取大模型技术的渠道。2023年12月,阿里云开源 Qwen-72B、Qwen-1.8B 和Qwen-AudioQwen大模型。随着大模型逐渐开源,
将进一步助推AI大模型产业的创新发展。小型开发者经过调用大模型才能,大幅提升编程效率,进一步推进 AI 运用落地。
一方面,小型开发者可基于大模型停止项目、运用以及插件等开发工作,不再局限于算力资源、无需停止复杂的模型训练、调参,轻松完成运用落地。
另一方面,小型开发者应用大模型技术提升开发效率,经过在代码工具中集成大模型才能,辅助完成部分反复性工作,为开发人员提供量身定制的代码建议,还可以自动检测代码中的 Bug,并生成相应的测试用例,延长工程师开发流程中的编码和纠错工夫。
4.4 AI 高功能芯片不断晋级,AI 大模型产业生态体系将不断完善
在大模型场景下,AI 高功能芯片次要用于大模型的训练环节,芯片功能的强弱直接影响大模型的功能和表现。
在全球 AI 高功能芯片市场中,英伟达的芯片产品采用最前沿半导体工艺和创新 GPU 架构保持行业的抢先地位。目前,英伟达的 A100 芯片在主流 AI 大模型训练中占据重要市场份额,H100 虽功能微弱但难以获取。AI 高功能芯片将来将不断迭代晋级,持续推进大模型功能和才能的提升。
在国内,AI 高功能芯片近年来发展速度加快。其中,华为昇腾次要包括310 和 910 两款主力芯片,其中昇腾 910 采用了 7nm 工艺,最高可提供 256 TFLOPS的 FP16 计算才能,其能效比内行业中处于抢先程度。寒武纪是中国具有代表性的另一本土 AI 芯片厂商,公司先后推出了思元 290 和思元 370 芯片及相应的云端智能加速卡系列产品、训练零件
将来,随着全球 AI 高功能芯片不断迭代晋级,也将持续推进大模型功能和才能的提升。
AI 大模型将加快新质消费力发展,助力我国经济社会高质量发展
AI 大模型可以创造新价值、顺应新产业、重塑新动能,是加快发展新质消费力的关键要素。
AI 大模型作为当后人工智能范畴的重要技术,是孕育新质消费力的沃土。新质消费力是创新起主导作用,摆脱传统经济增长方式、消费力发展途径,具有高科技、高效能、高质量特征,符合新发展理念的先进消费力质态,其由技术革命性打破、消费要素创新性配置、产业深度转型晋级而催生。
以休息者、休息材料、休息对象及其优化组合的跃升为基本外延,以全要素消费率大幅提升为核心标志。AI 大模型作为完成新质消费力发展的重要手腕,可以推进多个范畴的智能化晋级,提高消费效率、降低消费成本、提升产业竞争力。
随着中国经济进入高质量发展阶段,AI 大模型在催生新产业、新形式、新动能方面展现出宏大潜力,不只支撑了经济社会的高质量发展,也符合《国家创新驱动发展战略纲要》所强调的创新驱动和产业晋级要求。
我国众多产业对于高质量发展的需求,将为大模型的落地运用提供场景支撑。随着人工智能技术的不断晋级,大模型产业化运用也成为能够。以 vivo 为代表的科技企业发布的大模型为消费生活提供更多便利,带动商业形式创新,牵引产业晋级,令人们生活愈加美妙。
面对将来,我国需进一步加强资源与研发力气的统筹,强化大模型在发展中的场景牵引作用,促进经济社会的高质量发展,以完成大模型技术的高质量运用打破,驱动实体经济的蝶变和产业变革。
读者福利:假如大家对大模型感兴味,这套大模型学习材料一定对你有用
对于0基础小白入门:
假如你是零基础小白,想疾速入门大模型是可以思索的。
一方面是学习工夫相对较短,学习内容更片面更集中。
二方面是可以根据这些材料规划好学习计划和方向。
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
😝有需求的小伙伴,可以保存图片到wx扫描二v码收费支付【保证100%收费】🆓

(, 下载次数: 0)


👉AI大模型学习道路汇总👈

大模型学习道路图,全体分为7个大的阶段:(全套教程文末支付哈)

(, 下载次数: 0)

第一阶段: 从大模型系统设计动手,讲解大模型的次要方法;
第二阶段: 在经过大模型提示词工程从Prompts角度动手更好发挥模型的作用;
第三阶段: 大模型平台运用开发借助阿里云PAI平台构建电商范畴虚拟试衣系统;
第四阶段: 大模型知识库运用开发以LangChain框架为例,构建物盛行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新批发、新媒体范畴构建合适当前范畴大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台运用与开发为主,经过星火大模型,文心大模型等成熟大模型构建大模型行业运用。



👉大模型实战案例👈

光学实际是没用的,要学会跟着一同做,要动手实操,才能将本人的所学运用到实践当中去,这时分可以搞点实战案例来学习。
(, 下载次数: 0)


👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中教师的思绪,从基础到深化,还是很容易入门的。

(, 下载次数: 0)

(, 下载次数: 0)


👉学会后的播种:👈

• 基于大模型全栈工程完成(前端、后端、产品经理、设计、数据分析等),经过这门课可获得不同才能;
• 可以应用大模型处理相关实践项目需求: 大数据时代,越来越多的企业和机构需求处理海量数据,应用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型运用开发技能,可以让程序员更好地应对实践项目需求;
• 基于大模型和企业数据AI运用开发,完成大模型实际、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据预备、数据蒸馏、大模型部署)一站式掌握;
• 可以完成时下抢手大模型垂直范畴模型训练才能,提高程序员的编码才能: 大模型运用开发需求掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码才能和分析才能,让程序员愈加纯熟地编写高质量的代码。
👉获取方式:

😝有需求的小伙伴,可以保存图片到wx扫描二v码收费支付【保证100%收费】🆓






欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5