从“寒王”到工业富联,还有这些公司收获AI红利魅族1999元AI眼镜新品!深扒3代产品进化史,魅族的野心暴露了腾讯会议AI功能用户量同比增长超150%向上而行:飞碟汽车的品牌升维与价值远征智慧网球新体验!MAXHUB X7四足机器人成黄埔国际网球公开赛最受关注“工作人员”OPPO Find X9系列全球首发自研1nit明眸护眼屏:显示超越iPhone 成本极高阿里妈妈发布万相台AI无界:新流量新节奏之下的双11,AI是经营唯一解方洪波迎战雷军,祭出两大Agent五菱新能源发布全新品牌“埃尚”,首款车型A100C即将上市阿里与微信合作再升级?淘宝小程序或重回微信闭环交易QuestMobile 2025年8月AI应用行业月度报告:移动端应用用户规模达到6.45亿浙江华业2025上半年营收利润双增,下游需求与技术创新成关键支撑纵横G700亮相迪拜哈利法塔,豪华越野开启全球化新篇章高通钱堃:携手伙伴营造有利于创新的知识产权保护氛围脉脉:AI领域平均月薪达61475元 “搜索算法”岗位人才紧缺岚图新时代旗舰SUV官图发布:轴距3120mm 800V平台+5C超充OPPO周意保:Find X9 Pro将成行业首个“真2亿”手机李想:理想i6不同于Model Y和小米YU7 是第三种风格的五座纯电SUV金蝶国际收购云之家控股权 加速企业数字化服务布局乐刷支付斩获2025外滩大会美国运通“支付场景共创奖”
  • 首页 > 云计算频道 > 大模型

    GPT-4o能玩《黑神话》!精英怪胜率超人类,无强化学习纯大模型方案

    2024年09月23日 09:27:48 来源:量子位公众号

      AI玩黑神话,第一个精英怪牯护院轻松拿捏啊。

      有方向感,视角也没有问题。

      躲闪劈棍很丝滑。

      甚至在打鸦香客和牯护院时,AI的胜率已经超过人类。

      而且是完全使用大模型玩,没有使用强化学习

      阿里巴巴的研究人员们提出了一个新型VARP(视觉动作角色扮演)智能体框架。

      它能直接将游戏截图作为输入,通过视觉语言模型推理,最终生成Python代码形式的动作,以此来操作游戏。

      以玩《黑神话·悟空》为例,该智能体在90%简单和中等水平战斗场景中取胜。

      GPT-4o、Claude3.5都来迎战

      研究人员以《黑神话·悟空》为研究平台,一共定义了12个任务,75%与战斗有关。

      他们构建了一个人类操作数据集,包含键鼠操作和游戏截图,一共1000条有效数据。

      每个操作都是由原子命令的各种组合组成的序列。原子命令包括轻攻、闪避、重攻击、回血等。

      然后,他们提出了VARP智能体框架。

      主要包含动作规划系统和人类引导轨迹系统。

      其中动作规划系统由情境库、动作库和人类引导库组成,利用 VLMs 进行动作推理和生成,引入分解特定任务的辅助模块和自我优化的动作生成模块。

      人类引导轨迹系统利用人类操作数据改进智能体性能,对于困难任务,通过查询人类引导库获取相似截图和操作,生成新的人类引导动作。

      同时VARP还包含3个库:情景库、动作库和人工引导库。

      这些库中存储了agent自我学习和人类指导的内容,可以进行检索和更新。

      动作库中,“def new_func_a()”表示动作计划系统生成的新动作,“def new_func_h()”表示人导轨迹系统生成的动作。”def pre_func()”代表预定义的动作。

      动作案例研究和相应的游戏截图。第一行和第二行中的操作是预定义的函数。第三行动作由人工制导轨迹系统生成。

      SOAG会在玩家角色与敌人的每次战斗互动后总结第四行和第五行中的新动作,并将其存储在动作库中。

      框架分别使用了GPT-4o(2024-0513版本)、Claude3.5Sonnet和Gemini1.5Pro。

      对比人类和AI的表现结果,可以看到小怪部分AI们的表现达到人类玩家水平。

      到了牯护院时,Claude3.5Sonnet败下阵来,GPT-4o胜率最高。

      但是对于新手玩家普遍头疼的幽魂,AI们也都束手无策了。

      另外研究还提到,由于VLMs推理速度受到限制,是无法实时输入每一帧画面的。它只能间隔输入关键帧,这也会导致AI在一些情况下错过boss攻击的关键信息。

      以及由于游戏中没有明确的道路引导且存在很多空气墙,在没有人类引导下,智能体也不能自己找到正确的路线。

      如上研究来自阿里团队,一共有5位作者。

      后续相关代码和数据集有发布计划,感兴趣的童鞋可以蹲下。

      One More Thing

      AI打游戏并不是一个新鲜事了,比如AI基于强化学习方法打《星际争霸II》已经可以击败人类职业高手。

      利用强化学习方案,往往需要输入大量对局。商汤此前训练的DI-star(监督学习+强化学习),就用了“16万场录像”和“1亿局对战”。

      但是纯大模型也能打游戏,还是很出乎意料的。在本项研究中,数据集中的有效数据为1000条。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    海报生成中...

    最新新闻

    热门新闻

    即时

    全球顶级AI创作社区回归!海艺AI国内首发“全民娱乐化创作

    海艺AI的模型系统在国际市场上广受好评,目前站内累计模型数超过80万个,涵盖写实、二次元、插画、设计、摄影、风格化图像等多类型应用场景,基本覆盖所有主流创作风格。

    新闻

    市场占比高达35.8%,阿里云引领中国AI云增长

    9月9日,国际权威市场调研机构英富曼(Omdia)发布了《中国AI云市场,1H25》报告。中国AI云市场阿里云占比8%位列第一。

    企业IT

    “三位一体”数据保护体系,筑牢企业出海安全“生命

    戴尔科技一直致力于通过“三位一体”数据保护体系,为中国企业的数据安全“保驾护航”。

    3C消费

    雅马哈推出两款高端头戴耳机YH-4000与YH-C3000

    雅马哈昨日宣布推出两款头戴式耳机,分别是平板振膜的YH-4000和动圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清洁机器人出货量同比暴

    IDC今日发布的《全球智能家居清洁机器人设备市场季度跟踪报告,2025年第二季度》显示,上半年全球智能家居清洁机器人市场出货1,2万台,同比增长33%,显示出品类强劲的市场需求。