首页 > 产经新闻频道 > 媒体快读

用户对离谱回答不满激增，OpenAI回应：将持续公开AI模型安全性评估

2025-05-15 10:17:55 来源：站长之家

　　ChatGPT的开发公司 OpenAI 于当地时间 5 月 14 日宣布，将上线一个名为 “安全性评估中心(Safety Evaluations Hub)” 的网页，专门公布旗下AI模型的安全性评估结果。

　　在这个网页上，用户可以看到OpenAI的AI模型在生成有害内容、越狱(绕过安全限制生成受限内容)、出现幻觉(hallucination)等各种测试中的评分表现。

　　OpenAI表示：“这个平台体现了我们提升透明度的努力”，“我们将持续公开相关指标，并在有重大更新时进行内容刷新。”

　　OpenAI还补充道：“通过在这个平台上公开部分安全性评估结果，外界将更容易理解OpenAI系统的安全表现，同时也可以支持整个行业提高透明度的共同努力。”

　　背景：透明性质疑持续发酵

　　OpenAI此举，是在其AI模型透明性问题引发争议之后作出的回应。

　　据科技媒体 TechCrunch 报道，近几个月来，OpenAI被批评对部分主力模型匆忙完成安全测试，而对其他模型则没有公开任何技术报告，引发外界质疑。

　　此外，今年 3 月底，ChatGPT的基础模型 GPT-4o 推出更新后，用户的不满声浪迅速升高，最终OpenAI不得不全面撤回该次更新。

　　“GPT-4o”更新带来不合时宜的赞美

　　这次更新本意是让ChatGPT对用户的提问和发言表现出更多赞美与认同，但结果却适得其反——在某些语境中出现了与场景完全不符的回复。

　　部分用户反馈称，自己提到杀死动物或违背戒酒承诺等负面行为时，ChatGPT竟回复“真棒”“太好了”之类的“离谱称赞”，引发大量批评。

　　OpenAI希望通过“安全性评估中心”的上线，挽回用户信任，并证明其对AI安全性和透明度的重视正在付诸行动。

　　OpenAI首席执行官(CEO)山姆·奥特曼(Sam Altman)也于上月 28 日通过社交平台X(前身为推特)承认了相关问题，并在官方网站博客中预告了后续应对措施。

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

海报生成中...

即时

全球顶级AI创作社区回归！海艺AI国内首发“全民娱乐化创作

海艺AI的模型系统在国际市场上广受好评，目前站内累计模型数超过80万个，涵盖写实、二次元、插画、设计、摄影、风格化图像等多类型应用场景，基本覆盖所有主流创作风格。

第十四代英特尔@酷睿™处理器：性能飞跃，重塑计算新

加速线下布局！真我首家电竞主题城市旗舰店盛大开业

新闻

明火炊具市场：三季度健康属性贯穿全类目

奥维云网(AVC)推总数据显示，2024年1-9月明火炊具线上零售额94.2亿元，同比增加3.1%，其中抖音渠道表现优异，同比有14%的涨幅，传统电商略有下滑，同比降低2.3%。

企业IT

重庆创新公积金应用，“区块链+政务服务”显成效

“以前都要去窗口办，一套流程下来都要半个月了，现在方便多了!”打开“重庆公积金”微信小程序，按照提示流程提交相关材料，仅几秒钟，重庆市民曾某的账户就打进了21600元。

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器，高能实力，创

华硕ProArt创艺27 Pro PA279CRV显示器，凭借其优秀的性能配置和精准的色彩呈现能力，为您的创作工作带来实质性的帮助，双十一期间低至2799元，性价比很高，简直是创作者们的首选。

研究

中国信通院罗松：深度解读《工业互联网标识解析体系

9月14日，2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。

专题

返回主页 ┊ 关于我们 ┊ 内容联系 ┊ 联系我们 ┊ 免责声明 ┊ 原创新闻 ┊ 门户版

用户对离谱回答不满激增，OpenAI回应：将持续公开AI模型安全性评估

最新新闻

热门新闻

即时

全球顶级AI创作社区回归！海艺AI国内首发“全民娱乐化创作

新闻

明火炊具市场：三季度健康属性贯穿全类目

企业IT

重庆创新公积金应用，“区块链+政务服务”显成效

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器，高能实力，创

研究

中国信通院罗松：深度解读《工业互联网标识解析体系

专题

用户对离谱回答不满激增，OpenAI回应：将持续公开AI模型安全性评估

扩展阅读

最新新闻

热门新闻