人工智能社区Hugging Face近日推出4.5亿参数的开源机器人模型SmolVLA,该模型主打轻量化和高普适性,可在MacBook Pro等消费级硬件上运行,显著降低了开发者入门门槛。
当前,机器人模型普遍采用“视觉-语言-行动”(VLA)架构,但训练成本高昂且多为闭源。SmolVLA通过优化模型结构,结合Transformer与flow-matching解码器,并采用四项关键技术提升效率,包括减少视觉Token数量和轻量化视觉编码器等。
Hugging Face表示,尽管训练数据仅包含不到3万个任务记录,SmolVLA在模拟环境和真实场景中的表现媲美甚至超越大型模型。此外,其异步推理架构增强了机器人在动态环境中的响应能力。
该模型已在Hugging Face平台开源,配套训练方法亦公开于GitHub,为通用机器人智能体研究提供了更易获取的工具。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
海报生成中...
海艺AI的模型系统在国际市场上广受好评,目前站内累计模型数超过80万个,涵盖写实、二次元、插画、设计、摄影、风格化图像等多类型应用场景,基本覆盖所有主流创作风格。
IDC今日发布的《全球智能家居清洁机器人设备市场季度跟踪报告,2025年第二季度》显示,上半年全球智能家居清洁机器人市场出货1,2万台,同比增长33%,显示出品类强劲的市场需求。