最新新闻：

来京东618用“京补合约”下单手机低至1折起 iPhone 16仅需1579元看龙舟赛事、4折起购3C数码京东“3C数码国补中国行”落地佛山同款iPhone京东比美团、天猫便宜200元全国可用的消费券还有谁不知道？京东618只剩不到1周苹果500元消费券领券攻略看完直接收藏半年观察：彩电线下市场，三星索尼华为卡萨帝谁擎高端大旗？销量环比降50%，重组后知豆月均不足2000辆比亚迪汽车1-5月再夺销冠海外增长超112%OpenAI Codex 人工智能编程工具推出新功能：可一次生成多个方案安钛克推出迷你框架式开放机箱Performance Exo 创维EV6车型新增“闪现版 +”上市：800伏架构、CLTC续航520 公里 TrendForce：2025年OLED显示器面板出货量将达到 340 万片，同比增长69%雷军官宣！多款新品齐发，小米YU7月底登场！硬控川普的「磁吸」充电宝：要么超薄有线化，要么大容量桌面化人均看手机7小时！手机厂商死磕护眼，是智商税还是真有疗效？安吉尔印尼战略启动——全球领先净水科技，启航万岛之国 618狂欢节福利拉满天猫华硕官旗天选6 Pro国补好价到手6399.2元起 Twopan推出“最小带指纹闪存盘”Nano SSD 三星为Galaxy可穿戴新品造势，夏季发布会有望7月举行技嘉“M27UP”27英寸显示器国行首销：FHD 320Hz / 4K 160Hz双模+双5W扬声器消息称尼康 Zf 全画幅相机将新增银色版，有望今年第三季度前发布

推理AI模型基准测试成本激增:评估一个或需近3000美元

2025年04月11日 15:13:49 来源：AIbase基地

　　根据第三方AI测试机构Artificial Analysis的数据，评估OpenAI的o1推理模型在七种流行基准测试上需花费2，767.05美元，而其非推理模型GPT-4o仅需108.85美元。这一显著差异引发了关于AI评估可持续性和透明度的讨论。

　　推理模型，即能够逐步"思考"问题解决方案的AI系统，虽然在特定领域表现出色，但其基准测试成本远高于传统模型。Artificial Analysis评估约十几个推理模型总计花费了5，200美元，几乎是分析80多个非推理模型花费(2，400美元)的两倍。

　　成本差异主要源于推理模型生成的大量标记。例如，o1在测试中生成了超过4400万个标记，约为GPT-4o的八倍。随着基准测试越来越复杂，评估现实世界任务的能力，加上顶级模型每单位标记成本的上涨(如OpenAI的o1-pro每百万输出标记收费600美元)，独立验证这些模型性能变得极其昂贵。

　　尽管一些AI实验室为基准测试机构提供免费或补贴访问，但专家担忧这可能损害评估的客观性。General Reasoning的CEO Ross Taylor质疑:"从科学角度看，如果你发表了一个没人能用相同模型复制的结果，那它还能算是科学吗?"

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

[No. ]
分享到微信

即时

第十四代英特尔@酷睿™处理器：性能飞跃，重塑计算新

第十四代英特尔® 酷睿™ 处理器(代号Raptor Lake S Refresh)采用了先进的Intel 7制程工艺。

九章云极智能科技论坛全览：为AI加速

九章智算云Alaya NeW Cloud 2.0发布会

新闻

明火炊具市场：三季度健康属性贯穿全类目

奥维云网(AVC)推总数据显示，2024年1-9月明火炊具线上零售额94.2亿元，同比增加3.1%，其中抖音渠道表现优异，同比有14%的涨幅，传统电商略有下滑，同比降低2.3%。

企业IT

重庆创新公积金应用，“区块链+政务服务”显成效

“以前都要去窗口办，一套流程下来都要半个月了，现在方便多了!”打开“重庆公积金”微信小程序，按照提示流程提交相关材料，仅几秒钟，重庆市民曾某的账户就打进了21600元。

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器，高能实力，创

华硕ProArt创艺27 Pro PA279CRV显示器，凭借其优秀的性能配置和精准的色彩呈现能力，为您的创作工作带来实质性的帮助，双十一期间低至2799元，性价比很高，简直是创作者们的首选。

研究

中国信通院罗松：深度解读《工业互联网标识解析体系

9月14日，2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。

专题

返回主页 ┊ 关于我们 ┊ 内容联系 ┊ 联系我们 ┊ 免责声明 ┊ 原创新闻 ┊ 门户版

Copyright www.citnews.com.cn 中文科技资讯 2009-2025 all rights reserved

关键词：CITNews|Citnews中文科技资讯|中文科技资讯网|科技资讯网|中国科技资讯|中国科技新闻网|中国科技资讯网|快科技|新科技|中文科技数码头条号|中文移动新媒体

京ICP备18037198号-1 京公网安备 11010502041587号