开启左侧

深一度学习|二十问解读人工智能大模型

[复制链接]
在线会员 rC9s7r2 发表于 2025-3-7 02:22:46 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录


甚么是野生智能年夜模子?





野生智能会对于电网格式戴去甚么改动?



国网杭州供电公司团委

为年青朋友们戴去

两十问解读野生智能年夜模子

👇👇👇

跟着年夜模子等中心手艺的突破,野生智能势必成为改动未来电网部分魄局的枢纽。为了能够既专科又深刻天介绍野生智能手艺,去自杭州公司的孙智卿专士,决定让野生智能战他共同准备讲演的实质。颠末跟光亮年夜模子的多轮交换,组成了两十个问问,期望如下的实质能为各人戴去启迪战辅佐。

Q1

终归甚么是野生智能?

A1

野生智能的西岳论剑

达特茅斯集会

正在1956年召集的达特茅斯集会上,野生智能的观点被邪式提出,今后动作一门科学被钻研于今。可是正在这场野生智能的西岳论剑中,列位科学野战未来的图灵奖患上主们并无告竣一个分歧的野生智能界说。而现在遍及觉得野生智能是一种模仿人类智能的手艺,它能够像人类一致具备多种才气,好比能听(语音识别、机械翻译等)、能道(语音分解、人机对于话等)、能瞅(图象识别、笔墨识别等)、能思考(人机棋战、成就拉理等)、能计较(科学智能、成就供解等)、能举措(机械人、主动驾驭等)和能应变(认知智能、自立举措等)。

Q2

机械如何才气有野生智能?

A2

像人类一致,进修!

固然野生智能有诸高发展标的目的,但是比年去(2012年于今),使用深度神经收集(DNN)截至机械进修(ML)是得到最年夜突破的办法。

深一度进修|两十问解读野生智能年夜模子w2.jpg

2016年AlphaGO打倒围棋天下冠军李世石即是一个很佳的例子。那表白颠末深度进修,机械能够模仿人类的智能举动,并正在某些范围逾越人类。

Q3

年夜模子是甚么、有甚么用?

A3

ChatGPT标记着年夜模子成为

野生智能的未来趋势

2022年11月30日,OpenAI公司拉出了崭新的对于话式AGI东西ChatGPT,它是鉴于GPT3.5的狂言语模子。动作一种天生式野生智能(女伶 href="https://www.taojin168.com" target="_blank">AIGC),它标记着AI邪从感知智能、判定式智能背认知智能、天生式决议计划智能放慢改变。

深一度进修|两十问解读野生智能年夜模子w3.jpg

ChatGPT呈现以后仅一个月便用户破亿,成为增加最快的APP。正在此以后,各类年夜模子产物借鉴GPT模子办法,组成了目前百模年夜战的格式。

深一度进修|两十问解读野生智能年夜模子w4.jpg

回到本来的成就,固然以前的深度进修固然正在能处置多种博项任务,以至逾越了人类,但是不克不及像人一致共时具备传闻读写等多个范围的才气,即通用野生智能(AGI)的才气。而年夜模子(LM)是AGI的未来开展趋势,年夜是指具备亿级及以上参数的庞大深度进修模子,具备自进修劣化才气,能够完毕问问拉理、缺陷诊疗等庞大任务。比拟于保守专用野生智能手艺主要颠末对于“影象”进修得到经历常识,以ChatGPT为代表的通用野生智能使用具备更佳的疑息理解才气战泛化才气。

深一度进修|两十问解读野生智能年夜模子w5.jpg

Q4

为何GPT这样勇猛?

A4

词汇语交龙战弹珠游玩

GPT代表的狂言语模子,他的事情历程理论上是正在截至一个词汇语交龙的游玩。正在颠末大批的文原锻炼(年夜到已经用尽了全球互联网的质料),它会按照以前道出的字/词汇(token)动作高低文线索,阐发出交下来最有可以呈现的词汇语,挑选的按照是鉴于模子内部进修到的语言几率散布,而后把新猜测的字叠减到前面的句子以后,再来猜测前面一个字,以是统统年夜模子的谜底皆是一个字一个字蹦进去的。固然云云,它的挑选并不是鉴于完整的理解,而是按照统计情势,因而没有总能精确反应出人类思惟的方法。

深一度进修|两十问解读野生智能年夜模子w6.jpg

而狂言语模子之以是能够精确猜测,是因为它内部便像一个超等智能弹珠台。您收射成就(弹珠),它颠末庞大的内部构造(神经收集)计较路子,终极从不计其数个可以的进口(候选词汇)中,选出一个最公道的谜底。

深一度进修|两十问解读野生智能年夜模子w7.jpg

Q5

DeepSeek为何这样水?

A5

DeepSeek是词汇语交龙游玩的

崭新国产突破

2024年12月,杭州深度供索公司上线了DeepSeek-V3 基座模子,随即又拉出了博为庞大拉理任务设想的 DeepSeek-R1模子并共步启源盛开。它凭仗立异的高本钱年夜模子锻炼手艺,疾速正在AI范围占有争先职位,模子功用到达了取GPT-4相称的水平,拉理本钱仅为GPT模子的十分之一。DeepSeek以出色的功用逾越或者媲好环球顶级的启源及关源模子,正在好国战华夏地区使用市肆下载质连续排名第一,突破好国野生智能手艺封闭,正在环球野生智能范围激发普遍存眷取剧烈反应。

深一度进修|两十问解读野生智能年夜模子w8.jpg

相较于保守年夜模子锻炼需要弘大的算力资本战资本加入,DeepSeek颠末模子构造完美、锻炼方法劣化、下层算力调理等圆里截至体系级立异,完毕了“高本钱、下功用、准拉理”。模子构造圆里,颠末混淆大师模子(MoE)、多头潜伏留神力(MLA)、多令牌猜测(MTP)三圆里枢纽手艺截至立异劣化,提拔模子功用及拉理速率。模子锻炼圆里,颠末年夜范围加强进修战多阶段锻炼,年夜幅提拔模子拉理才气,共时提出拉理才气蒸馏办法,将宏大常识系统战少思惟链拉理才气“传授”给更小的模子。算力调理劣化圆里,自适应浮面位数收缩战略战混淆粗度锻炼,年夜幅提拔了算力资本的使用服从,可节流40%隐存并提拔30%计较速率。终极突破以“年夜算力、年夜数据”为中心的天生式野生智能扩大定律,为根究通用野生智能开辟了新门路。

深一度进修|两十问解读野生智能年夜模子w9.jpg

DeepSeek对于以英伟达为代表的GPU算力厂商发生了打击,开辟可移植国产AI芯片,突破CUDA把持,让国产芯片迎去了期望。别的,动作启源模子,DeepSeek初度染指,对于关源模子发生了打击,促进可注释性成为标配,督促止业从“乌箱模子”背“利剑箱模子”转型,沉塑用户信赖,加快止业降天。DeepSeek据守手艺同享,让环球开辟者得益,吸收了浩瀚开辟者以致一般人投身其启源死态。

深一度进修|两十问解读野生智能年夜模子w10.jpg

Q6

DeepSeek该如何用?

A6

挑选适宜的布置方法战

有代价的成就

DeepSeek有1.5B、7B、14B、70B和671B等差别参数范围的版原,所需要的GPU计较资本差别,咱们能够按照需要挑选私有效劳、小我私家布置或者企业布置等方法使用。

深一度进修|两十问解读野生智能年夜模子w11.jpg

今朝,国网公司的光亮年夜模子战北网的年夜瓦特模子,皆已经布置了671B的DeepSeek版原。

深一度进修|两十问解读野生智能年夜模子w12.jpg

而DeepSeek动作根底的通用年夜模子并非全能的,更适宜截至文原天生、翻译、查找常识等外容,假设需要截至精确计较、操纵掌握,借需要分离其余东西。

深一度进修|两十问解读野生智能年夜模子w13.jpg

好比DeepSeek取Kimi、excel、phoneshop等app的散胜利能,能够完毕主动天生PPT、智能数据阐发、图象粗建、集会记载变换、编程帮助、文档劣化、望频战音频编纂、立体设想等,提拔事情服从。

深一度进修|两十问解读野生智能年夜模子w14.jpg

Q7

年夜模子之外野生智能的开展?

A7

野生智能的多门路配合演退

新一代野生智能手艺形状显现多门路同演退格式,颠末突破认知维度限定,组成了四年夜枢纽手艺形状:集体智能完毕配合才气跃迁,具身智能主动扩大内部天下认知(仿佛为杭州科技六小龙的宇树战云深处),科学智能深入内涵机理理解,和多模态年夜模子安身才气提拔。

深一度进修|两十问解读野生智能年夜模子w15.jpg

Q8

为何要建立光亮年夜模子?

A8

从通用年夜模子到专用年夜模子

根据使用范围的差别,年夜模子主要能够分为L0、L一、L2三个层级。通用年夜模子L0不断行微调或者多量微调下完毕多场景任务,像“通才教霸”,常识里广但是不敷博识;止业年夜模子L1凡是使用止业相干的数据截至预锻炼或者微调,像“专长大夫”,正在某个范围出格专科;笔直年夜模子L2使用任务数据锻炼以进步任务功用,像“就携调理包”,粗笨下效,适宜现场抢救。

深一度进修|两十问解读野生智能年夜模子w16.jpg

光亮年夜模子恰是为了满意电力止业的专科需要而降生的。从数据上道,通用数据散布取电力范围多模态数据差别过年夜,专科水平高、联系关系性强;从模子上道,启源通用模子缺少电力专科预锻炼(缺少专科常识注进),多模态撑持不敷,从使用上道,现现有国产化电力年夜模子正在实在电力任务上功用不敷下,取理论需要仍存留差异。因而,需要挨制光亮年夜模子,借帮野生智能赋能新式电力体系可连续兴旺开展。

深一度进修|两十问解读野生智能年夜模子w17.jpg

2024年12月19日,光亮电力年夜模子动作海内尾个千亿级多模态止业年夜模子邪式公布,动作千亿级多模态止业年夜模子,能够里背电力消耗、建立、办理、经营、科研、制作、效劳等齐财产链供给专科化智能化效劳,借帮野生智能赋能新式电力体系可连续兴旺开展。

Q9

光从何而去?

A9

光亮电力年夜模子齐过程建立

光亮年夜模子是国度电网公司联袂baidu、阿里配合挨制的电力止业尾个千亿级年夜模子,大白了“启、关源并止、预锻炼+微调”的研收手艺门路。为全面增强止业常识,挨制了范例最齐、品质最下的止业样原库,包罗1.02亿弛图象样原、1150万份文原数据,此中止业数据占比约40%。颠末以测代研的方法,光亮年夜模子正在长工妇内乱完毕了从研收到使用的快速迭代。

深一度进修|两十问解读野生智能年夜模子w18.jpg

Q10

光亮年夜模子的才气有甚么?

A10

电力止业年夜模子才气框架

光亮年夜模子才气包罗语义战望觉二圆里,语义年夜模子的才气具备通用(L0)常识影象、理解、拉理、天生等4类通用才气战13项电力专科通用才气。望觉年夜模子具备通用(L0)的图象分类、目标检测、目标朋分、目标追踪等4类16项电力止业通用才气。

深一度进修|两十问解读野生智能年夜模子w19.jpg

深一度进修|两十问解读野生智能年夜模子w20.jpg

Q11

光亮年夜模子使用文心一行?

A11

电力年夜模子的才气立异

光亮年夜模子的本型去自baidu的文心一行战阿里的千问,但是正在模子构造、锻炼办法上完毕了三年夜突破立异:一是劣化了根底模子构造,完毕电力多模态阐发。两是完毕了止业常识增强锻炼,建立了最齐电力常识底座。三是设想了一套电力思惟链拉理战略,全面提拔了电力专科才气。比方类似DeepSeek的自劣化电力思惟链拉理。针对于电力庞大理解战拉理任务,融合加强进修战思惟链手艺,建立自劣化电力思惟链拉理战略,融合运行数据战电力机理常识,让模子进修电力体系运行纪律并天生思考历程。鉴于大师经历建立鉴别模子自尔劣化拉理路子,有用提拔模子对于庞大电力成就的理解战处置才气。

深一度进修|两十问解读野生智能年夜模子w21.jpg

Q12

怎样使用光亮年夜模子?

A12

三种使用方法

光亮年夜模子的使用主要有三种情势。情势一是间接使用,鉴于光亮年夜模子供给电力常识问问、文档编辑、根底逻辑拉理战数值计较等效劳;情势两是微调后使用,分离提醒工程,散成至营业过程,供给一定任务下的实质天生、缺点识别等;情势三是智能体使用,以光亮年夜模子为调理中枢,配合各种模子及东西组件建立智能体,完毕巨细模子融合使用,满意庞大使用场景需要。

深一度进修|两十问解读野生智能年夜模子w22.jpg

如接纳间接使用方法的聪慧办公,用户能够颠末内乱网分歧进口网站、电力智能输出法、WPS插件、i国网事情台界里的AI帮忙或者i国网效劳号去使用光亮年夜模子。截至文档的主动天生、修饰、提取等。

深一度进修|两十问解读野生智能年夜模子w23.jpg

Q13

光亮年夜模子会如何开展?

A13

国网公司“野生智能+”顶层设想

国度电网公司对峙需要导背战体系看法,兼顾睁开 “野生智能 +” 顶层设想,组成以光亮为中心的 “6541” 整体计划计划,环绕营业场景、野生智能才气、样原、模子、仄台、算力等枢纽因素睁开,并成立一套残破的保证系统。正在使用场景圆里,安身电网,里背止业,全面笼盖计划建立、电网运行、装备办理、功课管控、客户效劳、经营办理等六年夜范围,梳理组成 600 余个营业场景,并散焦促进新式配电网智能诊疗取计划、电力智能仿实阐发取调理运行、配电网源荷猜测取智能帮助决议计划、电力主装备形状评介取智能运维、电力装备检验功课智能管控、电力客户齐历程智能效劳、供给链齐关节智能配合效劳、数字化建立智能研收取运维等八年夜企业级重心使用条线。

深一度进修|两十问解读野生智能年夜模子w24.jpg

Q14

怎样用年夜模子挨制智能场景?

A14

智能场景建立步调

挨制智能场景需经历六步关环:从场景设想、数据准备,到模子研收、使用建立,再到体系散成战连续经营。比方正在配网抢建场景中,咱们颠末RAG手艺将汗青缺陷库取年夜模子分离,完毕处理计划的秒级天生。

深一度进修|两十问解读野生智能年夜模子w25.jpg

Q15

公司理论正在用年夜模子了吗?

A15

亚运保电GPT

年青们正在GPT一呈现的时候,咱们便布满热忱战兴致天来钻研年夜模子战电力场景的分离了。亚运会期间,咱们初创了保电GPT场景。它不但能及时答复保证任务的成就,借能主动天生处理计划、颠末语音播报预警疑息。那一测验考试为后绝场景开辟积聚了贵重经历。

深一度进修|两十问解读野生智能年夜模子w26.jpg

Q16

怎样更佳的使用年夜模子?

A16

适宜的方法比适宜的场景更主要

国网归纳的600个营业场景皆需要年夜模子的劣化提拔,可是适宜的使用方法是年夜模子阐扬才气的枢纽。年夜模子的对于话才气近不只笔墨问问。今朝可见仅从问的角度,便具备了“五问”。如最根底的保电GPT的常识“问问”战保电计划“问策”。更远一步,能够对于海质的数据阐发截至“问数”。

深一度进修|两十问解读野生智能年夜模子w27.jpg

而颠末战电网一弛图体系API的买通,借能够退一步将问数成果正在图中联动,完毕“问图”,当交进更多的体系API后,年夜模子能够替代您间接完毕过程操纵,完毕体系“问路”。

深一度进修|两十问解读野生智能年夜模子w28.jpg

Q17

以前的小模子另有用吗?

A17

年夜模子取小模子的配合

公司以前积聚了帕偶、米特、叮当等多种小模子野生智能,已经融合到电网消耗,有人担忧保守小模子会被代替,真则否则,正在庞大场景下,“止业年夜模子+任务小模子”更有可以提拔智能化水平。正在配电功课监控场景中,咱们融合望觉年夜模子的泛化识别才气取小模子的下粗度特性检测,使背章识别精确率从60%提拔至90%以上。这类“年夜模子主拉理、小模子攻博粗”的情势将成为支流。

深一度进修|两十问解读野生智能年夜模子w29.jpg

正在由中电联战华夏机电工程教会配合主理的“2024年能源止业野生智能使用年夜赛”中,赛题两“电力现场宁静管控赛讲”,即是鉴于多模态年夜模子正在庞大安监场景下的下粗度背章危急辨识,杭州公司“电等开展队“即接纳巨细模子配合的手艺思路阐发功课样原,有用提拔背章识别精确率,得到角逐一等奖。

深一度进修|两十问解读野生智能年夜模子w30.jpg

Q18

正在浙电怎样使用DeepSeek?

A18

DeepSeek的深度使用

杭州公司已经正在光亮年夜模子中引进了DeepSeek,能够间接用于常识问问战数值计较。但是为了更深入的使用,处置理论消耗成就,借需要建立常识库,梳理挑选适宜的营业域场景截至智能体设想战使用,特别正在处置一定范围的数教演算、庞大成就拉理、模子沉质化等任务圆里,更具劣势战后劲。

深一度进修|两十问解读野生智能年夜模子w31.jpg

计划建立圆里,可睁开配电网诊疗阐发、线益非常启事阐发等典范场景使用。电网运行圆里,可睁开配网背荷转供天生、主动化体系巡检战非常处理等场景使用。装备办理圆里,可睁开输电通讲图象监测隐患智能识别、配网无人机警能巡检、帮助现场检验功课等场景使用。客户效劳圆里,可睁开电费智能核算、智能客服效劳、用电需要智能猜测等场景使用。功课管控圆里,可睁开宁静步伐核对、收集宁静智能监测阐发、数字化体系研收代码智能阐发等场景使用。经营办理圆里,可睁开供给商天分智能核真、重心物质条约智能考核等场景使用。

Q19

天市公司建立使用年夜模子的

事情偏重面是甚么

A19

从野生智能才气战营业场景的

紧密揭开收力

相较于省公司,天市公司更该当阐扬切近营业实际需要的特长,制止资本、权力不敷的强势。如启交国网“野生智能+安监”重心任务,杭州公司分离现场事情理论需要,设想更能阐扬年夜模子的天生战阐发才气的场景。一是建立安监百晓死,完毕宁静常识问问战功课前的危急实质提醒。两买通布控球配备,挪用图象年夜模子共时识别多种背章,挪用语义年夜模子完毕共时播报的才气;三是联动电网一弛图,能够战其余专科数据图层联动,截至事先统计阐发。

Q20

未来已经去,浙电年青如何搞?

A20

DeepSeek的启迪

DeepSeek的胜利尽非偶尔,不管是根底手艺立异、科技人材储蓄、构造办理变化、启源死态创立等圆里皆值患上咱们进修。而关于浙电年青来讲,要时候连结这种好奇心战缔造欲,邪如DeepSeek开创人梁文锋所道,“立异没有完整是贸易启动的,借需要好奇心战缔造欲。咱们不过被已往这种惯性束缚了,但是它也是阶段性的。但是立异起首需要自大。这类决意凡是正在年青人身上更清楚。”
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )