职贝云数AI新零售门户
标题:
AI大模型让机器人集体“退化”,具身智能时代要来了?
[打印本页]
作者:
A1PZT7rw
时间:
2025-2-27 10:51
标题:
AI大模型让机器人集体“退化”,具身智能时代要来了?
最近一段工夫以来,国产AI大模型DeepSeek火爆全网。同时,谷歌、特斯拉等科技巨头,也在AI大模型范畴不断新陈代谢,推进AI技术迈向更高程度。而在AI大模型疾速发展的当下,机器人范畴也繁华非凡。近日,国内外各大机器人厂商纷纷在大模型与机器人交融的方面“大秀肌肉”,标志着机器人朝着“具身智能”又迈出了重要一步。 - 文章信息 -
本文由e-works编辑部杨培原创发布。
从国外的Figure AI、IX,到国内的中控技术、均普智能、优必选、普渡机器人、浪潮机器人等,纷纷公布了在自研大模型、接入DeepSeek大模型以及具身智能机器人研讨方面的重要停顿,一场激烈的具身智能机器人竞赛已然拉开帷幕。
01国外巨头,各显神通
在人形机器人范畴,美国Figure AI公司无疑是明星企业之一。在2月初官宣与OpenAI“分手”之后,2月20日晚Figure AI便带着“从未在人形机器人身上见过的东西”——用于通用人形机器人控制的视觉-言语-动作(VLA)模型Helix重磅登场。据引见,Helix集视觉感知、言语了解和动作控制于一体,完成了上半身35个自在度的协调控制,具有零样本泛化才能,可处理数千种生疏物体,还支持多机器人协作,两台人形机器人能共享模型完成复杂义务。
在Figure AI发布演示视频中,由Helix驱动的两台机器人经过接受人类语音指令,无需任何预编程或物体特定训练,便能协同完成物体分类与收纳工作。值一提的是,Helix是首个运转在嵌入式低功耗GPU上的VLA模型,这也为其疾速投入商业部署奠定了基础。
(, 下载次数: 0)
上传
点击文件名下载附件
Figure AI发布的Helix模型(来源:Figure AI)
挪威人形机器人厂商1X Technologies最新发布的第二代家用机器人NEO Gamma异样亮点突出。NEO Gamma人形机器人基于初代产品NEO迭代晋级,在硬件、AI和外观设计等方面都停止了优化。在AI方面,1X Technologies经过训练视觉操作模型,使得机器人可以在不同场景中拾取各种对象,包括此前训练时从未接触的对象。NEO Gamma还应用了经过训练的神经网络,可直接根据原始传感器数据来预测远程操控动作,并集成了自研的大言语模型(LLM),可完成与用户的自然对话和肢体言语互动。
(, 下载次数: 0)
上传
点击文件名下载附件
来源:1X Technologies
从演示视频来看,在家庭环境里,NEO Gamma会自动为正在商榷事情的人类烧热水并端上杯子;看到墙上的挂画歪了会自动摆正并向人类点头确认。此外,晾衣服、清洁地板、擦窗户、取快递等工作处理起来也得心应手。
(, 下载次数: 0)
上传
点击文件名下载附件
NEO Gamma人形机器人运用场景演示
(来源:1X Technologies)
02国内厂商,不甘逞强
与国外厂商聚焦于自研AI大模型不同,国内厂商则将目光投向了爆火的DeepSeek,并纷纷公布了在机器人接入DeepSeek大模型方面的重要停顿。
这其中,中控技术于2月18日发布音讯称,其作为第一大股东投资入股的浙江人形机器人创新中心已在自主研发的领航者2号NAVIAI及即将发布的第三代人形机器人上完成DeepSeek-R1测试。测试表明,DeepSeek-R1的深度推理和复杂逻辑分析才能为人形机器人提供了弱小的技术支撑。将来,第三代人形机器人还将进一步接入DeepSeek的多模态模型Janus Pro,加强环境感知和人机交互才能,并计划于本年度在某大型石化企业实验室的高风险作业场景中完成AI驱动的具身智能仿活力器人的落地运用。
(, 下载次数: 0)
上传
点击文件名下载附件
人形机器人“领航者2号NAVIAI”(来源:中控技术)
优必选也针对开源推理大模型DeepSeek-R1,在人形机器人运用场景中停止了验证。测试结果显示,经过多模态才能扩展的DeepSeek-R1可以让人形机器人在执行义务前结合看到的场景和接收到的指令停止思索验证,零样本推理程度与调优后的同级别大模型推理程度相当。优必选将基于DeepSeek-R1研发适用于人形机器人的多模态具身推理大模型,预期在真实场景的数据调优后,功能表现将会进一步提升,赋能人形机器人在工业场景的运用。
2月20日,浪潮智能终端宣布旗下浪潮机器人已成功接入DeepSeek,使得机器人具有了弱小的语义了解才能。机器人不再仅仅局限于对指令字面意思的了解,而是可以深化发掘用户的真实意图。
均普智能已在具身智能的研发及运用范畴接入DeepSeek模型,下一步计划将DeepSeek模型引入人形机器人训练中。
普渡机器人宣布已正式接入DeepSeek满血版模型,首批搭载该模型的贝拉Pro机器人已在部分商超落地测试,后续将逐渐推行至其他机型及场景。
(, 下载次数: 0)
上传
点击文件名下载附件
首批搭载DeepSeek满血版的贝拉Pro机器人
已在部分商超落地测试
(来源:普渡机器人)
优宝特机器人已在自主研发的“行者泰山”R2人形机器人部署了DeepSeek大模型,相比R1更具有情感辨认功能,能与人类停止自然对话并调理语气,从而提升了用户体验。
此外,北京大学结合香港科技大学团队基于自研全模态框架Align-Anything,将纯文本模态的Deepseek R1系列模型拓展至图文模态,推出了多模态版DeepSeek-R1(即Align-DS-V),可用于机器人控制。美格智能正基于自研的AIMO智能体及DeepSeek-R1模型的基础才能,开发面向工业智能化、座舱智能体、智能无人机、机器人等范畴的AI Agent运用。
03大模型让机器人“智商”飙升
具身智能机器人,是当前机器人技术演进的重要方向。简单来讲,“具身智能”是赋予AI“身体”,使其可以像人类一样与环境停止感知和交互,具有自主决策和举动才能,并可以从阅历反馈中完成智能增长和举动自顺应。其核心是经过在物理和数字世界中的学习和退化,完成了解世界、互动交互并在真实世界中完成义务的目的。而AI大模型,正是开启具身智能这扇大门的关键钥匙。
机器人作为“具身智能”的重要载体,经过融入AI大模型技术,不只打破了依赖预设程序执行特定义务的局限,更推进其向“类人智能与交互”加速退化。从各大机器人厂商公布的重要停顿来看,AI大模型在推进机器人迈向具身智能方面的关键价值,次要体如今以下几个方面:
🔵 一是赋予了机器人精准了解与高效交互才能。AI大模型弱小的自然言语处理才能,让机器人可以“听懂”人类的各类复杂指令,无论是日常的生活咨询,还是专业范畴的成绩,都能疾速给出精准回答,从而大大提高了交互才能与效率。尤其是VLA模型,更是使得机器人可以以更自然、直观的方式与人类交互,精准了解人类的言语、动作和手势等所表达的意图,并做出合适的回应。
🔵 二是赋予了机器人自主决策才能。AI大模型仰仗弱小的数据分析和处理才能以及杰出的学习和推理才能,使得机器人在面对复杂多变的理想场景时,可以整合机器人搭载的各种传感器所搜集到的环境信息,包括视觉、听觉、触觉等多维度数据,实时感知环境变化,疾速分析各种状况,并自主地制定举动策略和决策。例如,接入DeepSeek大模型的机器人,可以在复杂环境中完成自主途径规划、导航和操作。
(, 下载次数: 0)
上传
点击文件名下载附件
基于分层场景图谱导航技术和DeepSeek大模型
完成语义搜索和自主导航
(来源:浪潮机器人)
🔵 三是赋予了机器人学习与泛化才能。AI大模型使得机器人在面对新场景时,能根据已有知识和学习阅历,疾速了解场景特征并做出应对。即便面对生疏状况,机器人也能基于已有的知识储备停止推理和判别,提升了机器人在不同范畴和场景下的泛化才能。例如,在Figure AI和1X公布的严重停顿中,都强调了机器人能拾取在训练中从未接触过的物体,这就得益于大模型所赋予的学习和泛化才能。而且,大模型赋能下的机器人就像个勤劳好学的先生,可以经过在线学习和强化学习等,越学越聪明。
04前路漫漫,仍应战重重
但是,虽然AI大模型与机器人的交融,为机器人的智能化带来有限能够,但要完成真正的具身智能机器人,仍有不少“拦路虎”需求处理。
🔵 首先,模型的计算复杂度、数据安全性和决策可解释性等成绩仍需处理。大模型的训练需求大量的数据和算力,导致算力成本和训练成本高昂。显然,此次Figure AI发布可运转在低功耗嵌入式GPU上的Helix多模态模型,以及国内厂商介入deepseek-R1这一以弱小的推理才能和极高性价比著称的大模型,提供了为降低算力和训练成本的新思绪、新途径,但目前都尚处于早期研发和测实验证阶段,间隔大规模运用还有差距,需求进一步优化硬件与模型的适配,以充分发挥其功能并降低成本。
在数据安全性方面,则需规避数据搜集存储与传输、模型训练与更新以及模型运用等环节的隐私侵犯、数据泄露、恶意攻击等风险。而在决策可解释性方面,大模型产生的幻觉能够使得机器人输入不符合实践或无逻辑的结果,导致其决策根据难以捉摸。
🔵 其次,如何完成小样本学习和持续学习也是重要应战。具身智能机器人需求在真实环境中执行复杂义务,但获取高质量数据的难度极大。对适用于机器人的大模型而言,目前开发所需求的物理数据比大模型所需求的互联网数据愈加短缺,这直接限制了机器人在复杂场景中的运用才能。在持续学习方面,则面临着灾难性遗忘、义务干扰及缺乏评价机制等成绩。这使得机器人在学习新义务时能够会遗忘旧知识,或因义务干扰而出现错误决策,且难以设计一个有效的评价机制来准确衡量机器人的学习效果和功能。
🔵 此外,具身智能强调“大脑-身体-环境”三位一体,它的完成不只仅依赖于大模型、深度学习、机器学习等算法智能,也依赖于本体与环境的智能交互,如对外界信息的获取与了解、对本身举动的规划与决策、对义务的下达和对复杂环境的顺应,以及在与环境的不断交互过程中,完成可持续的智能退化与提升。因此,如何完成视觉、触觉、听觉、嗅觉等多模态信息的智能感知,如何完成全身智能与协调控制等,也是完成机器人智能化的关键所在。多模态感知能让机器人更片面地了解周围环境,而全身智能与协调控制则关乎机器人举动的有效性与顺应性。
不过,国内外厂商近期纷纷在自研大模型、接入DeepSeek大模型及推进机器人迈向具身智能方面获得的重要停顿,标志着具身智能机器人的研讨已进入新的阶段。虽然目前还面临诸多应战,但置信随着技术的不断提高和创新,这些应战有望逐渐得到处理。或许在不远的将来,具身智能机器人真能如科幻电影中归纳的那般,成为人类消费生活的得力助手和智慧伙伴。
(, 下载次数: 0)
上传
点击文件名下载附件
(, 下载次数: 0)
上传
点击文件名下载附件
▼ 点击下方阅读原文疾速在线报名专业实训
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)
Powered by Discuz! X3.5