2025年7月26-29日,以“智能时代 同球共济”为主题的世界人工智能大会(WAIC2025)在上海举行,具身智能作为“AI如何走出屏幕”的现实命题备受关注。本次大会涵盖40余款大模型、60余款智能机器人,以及80余款“全球首发”或“中国首秀”的新品,规模创历届之最。与上届大会相比,具身智能在技术方面从单模型向多模态跃迁,产品泛化能力和垂直应用均有提升,标准稳步建立,生态不断优化,但此次大会也暴露出具身智能仍面临:数据基础不佳、产业卡点淤塞、标准仍不健全的问题。我宜丰富训练数据,规范数据安全;突破脑、肢卡点,完善标准,力争成为全球产业主导者。
大会关于具身智能的变化分析
(一)技术能力持续演进。一是多模态融合成为主流。2024大会上,具身智能技术焦点还是以单一感知和单一任务为主。2025年,具身智能技术向视觉、语言、触觉等多源信息感知整合演进,能够实现对复杂、动态环境理解与实时响应。如商汤科技展出的多模态交互“具身智能大脑”,能让傅利叶GRx机器人通过融合图像、视频、语音和文本等信息理解环境,进行思考与表达。二是在机器人感知、控制与决策等关键技术环节不断突破。如深谋科技重点展示新一代人形机器人“美猴王”五大核心技术突破,包括业界独创的OmniSense声表面波感知系统、脑电控制方案Mindmover、国内首个“弹起”压电式六维力传感器、具类人动态视觉理解能力的6D姿态视觉伺服系统等。
(二)产品由“可展示”走向“可应用”。一是智能水平持续跃升。2024年展品以语音交互和基础动作控制为主,多数仿人机器人仍处于概念验证阶段。2025年大批产品搭载VLA(视觉-语言-动作)模型,具备复杂指令理解、环境感知与动作协调能力,智能化程度显著提升。如特斯拉人形机器人Tesla Bot不仅能够完成清洁桌面、吸尘、拉窗帘等基础任务,还能执行精细化抓取、焊接、装卸等复杂任务。二是产品形态及应用场景加速拓展。2024年展品大多聚焦于家庭清洁等单一任务执行场景。2025年展品涵盖人形机器人、工业机械臂、物流机器人等多种类型,应用场景也扩展至多个行业。如国地中心首发的全尺寸通用青龙V3.0人形机器人,具备36自由度和3m/s直膝行走能力,广泛应用于安保巡逻与特种作业等复杂场景。赛博格机器人能够在高危、高负荷环境中执行工具切换、电网测试等任务。
(三)协同创新生态及资本助推进一步深化。一是产学研各创新主体加速融合。大会期间,智元机器人正式发布“智元灵渠 OS”开源计划,通过开源模式携手产业界共同构建具身智能操作系统生态,解决当前机器人操作系统碎片化、适配成本高、智能体服务难协同等行业痛点。二是产业资本加速涌入。2025年上半年,我国具身智能行业的投资事件共计91起,已经超过2024年全年的77起,总投资金额达到110.37亿元。具身智能明星公司宇树科技于今年6月完成C轮融资,估值超100亿,由中国移动旗下基金、腾讯、锦秋基金、阿里等共同领投。
具身智能产业发展仍面临三大挑战
(一)数据基础不佳,导致产业基底不稳。一是具身智能训练数据缺口大。具身智能需要上亿条训练数据方能达到完全自主水平,但现有公开数据集最大仅在百万量级,需通过软件仿真模拟、真实数据采集等方式补充训练数据,但两种方案各有不足:一方面,仿真数据的保真度有限,难以满足复杂任务需求。斯坦福大学研究表明,仿真数据训练简单任务的成功率可达80%,但训练复杂任务时成功率仅40%。另一方面,真实数据的采集成本高昂。例如,据国地中心测算,特斯拉为使具身智能机器人胜任工厂工作,需花费至少5亿美元采集数据。二是具身智能仍存数据隐私安全风险。具身智能为满足多样化任务需求,需持续采集环境信息、运动轨迹等数据,信息获取呈现全息化、持续化特征,但普遍缺乏有效的筛选、脱敏与授权机制。一旦设备操作系统异常或遭受网络攻击,极易引发敏感数据大规模泄露。如MIT研究团队发现Roomba J7系列机器人在构建地图过程中自动采集接触人员的图像,涉及敏感场景且未经用户知情同意便将数据上传用于训练第三方AI模型。
(二)关键环节仍有卡顿,导致产业发展受限。一是具身智能关键技术仍待突破。“大脑”方面,对物理世界的深度感知与适应能力不足。我国大模型在空间感知、复杂现实环境认知能力等方面仍处于起步阶段,难以满足具身智能与三维现实世界交互的需求。“小脑”方面,全球小脑对动作控制的成功率还未达产业化落地水平。根据高盛研究显示,在操控层面,国际领先的技术成熟度为40%,而中国仅为20%。二是核心零部件精度不足。在高端具身智能,特别是人形机器人高精度零部件方面仍需依赖进口。四肢部分,决定关节精准度的行星滚柱丝杠,国外企业占80%市场份额,我国面临较高的加工工艺壁垒。传感器部分,六维力矩传感器和扭矩传感器,美国均占最大市场份额,且技术全面、成熟。动力部分,影响动力传输的无框力矩电机由美国科尔摩根、德国威腾斯坦等主导。
(三)具身智能的标准体系尚未完善,制约产业协同发展效率。一是具身智能系统性标准制定进程缓慢。虽然2025年4月我国已发布《人形机器人标准体系框架》,确立了基础共性、关键技术、部组件、整机与系统和应用等五大维度的标准架构,但具体细分标准的制定进展缓慢,目前仅零散出台了《腿式机器人性能及试验方法》《人形机器人数据集数据标注》等个别标准,关键的数据采集、运动控制、接口规范等标准仍处于缺失状态。二是规范缺失制约跨品牌机器人协同作业。由于硬件接口、通信协议、数据格式、操作系统等缺乏统一规范,可复用的通用组件和开发工具不足,多数科技公司被迫各自从零搭建基础设施,造成技术路线碎片化,严重制约产业生态协同发展。例如宇树科技基于开源ROS框架开发了实时操作系统(RTOS),而优必选则采用自研的ROSA系统,两者的底层通信协议、接口标准和开发工具链互不兼容。
多举并用,突破具身智能产业发展初期困境
一是丰富训练数据,完善算力体系。一方面强化高质量数据采集,推动场景化数据积累。另一方面健全数据处理规范体系,防范隐私泄露风险;二是突破脑肢传动技术,优化供应链。一方面提升研发能力,实现端到端突破;另一方面复用同类产业制造能力,扩大零部件性价比优势。三是完善隐私安全法律体系。一方面借鉴地方及成熟领域的标准,完善国家级具身智能标准体系;另一方面二是以示范试点推动关键场景标准落地,促进产业生态协同发展
2025年世界人工智能大会让我们共同见证了具身智能领域的非凡进展,从人形机器人的灵敏动作到数字孪生技术的无缝衔接,再到多模态感知的突破性应用,具身智能正以前所未有的速度改变我们的世界。各种市场数据表明,具身智能正以惊人速度增长,亚太地区尤为突出。展望未来,具身智能将通过更强大的算力、完善的法律体系和全球合作,开启智能化社会新篇章。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
海报生成中...
海艺AI的模型系统在国际市场上广受好评,目前站内累计模型数超过80万个,涵盖写实、二次元、插画、设计、摄影、风格化图像等多类型应用场景,基本覆盖所有主流创作风格。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。