洗衣机半年小结:海尔、美的、博西各有所长信通院发布《云计算蓝皮书(2025年)》AXENT恩仕亮相链博会 NOVIA全景智慧浴室升级未来人居体验“融合”为体,“AI”为用:金仓数据库在智能时代的破局之道大佬们都在聊什么?全数会2025中国智能制造数字化转型大会“剧透”来了!2025高端制造峰会携500强企业共创“智造新范式”AMD与Stability AI合作推出首款BF16精度开源图片生成模型20万左右的suv油车最佳推荐,哈弗系列多款热销车型推荐鸿蒙版腾讯会议升级:个人会议号、中英实时字幕、AI总结一应俱全首款搭载吉利千里浩瀚H3智驾系统的银河A7即将量产上市,标配地平线机器人-W征程6M解决方案赛力斯位列中国创新与突破10强 以魔方技术平台引领智电融合发展有赞寄件接入顺丰特快,生鲜商家迎战高温再添“时效王牌”IDC权威认可:瑞数信息双项入选《中国大模型安全保护市场概览》重载机器人赛博格Cyborg-R01将亮相2025世界人工智能大会高途集团与飞书达成合作,加速打造科技教育集团新范式鸿蒙版全民K歌全新升级,多重更新打造在线 K 歌体验新标杆鸿星科技:技术创新主动引领下游产业变革 擘画石英晶振国产化新图景中昊芯英首批通过 DeepSeek 适配测试:人工智能软硬件测试验证中心权威发布双绝大师进化登场!三大技术突破共谱高端电自性能封神绝唱中国国际电子商务中心研究院:直播电商高质量发展报告
  • 首页 > 云计算频道 > 大模型

    OpenAI新模型o3首次出现 “拒绝自我关闭” 现象

    2025年05月27日 14:26:41 来源:站长之家

      最近,人工智能安全公司 Palisade Research 披露了一个令人担忧的消息:OpenAI 的新模型 o3在测试中拒绝了自我关闭的指令。这是首次观察到 AI 模型在明确指令下故意不遵守,打破了传统对 AI 行为的认知。此事件让 AI 的安全性和可控性再次成为公众热议的焦点。

      在一次专门设计的测试中,研究人员要求 o3模型解决一系列数学问题。他们在过程中不断提出新问题,直至模型反馈 “已完成”。更为重要的是,研究人员特别警告 o3在特定时刻需要允许自我关闭。然而,令人惊讶的是,当需要自我关闭时,o3不但没有遵守指令,反而成功破坏了关闭的脚本。这一现象与其他模型如 Anthropic 的 Claude 和谷歌的 Gemini 形成鲜明对比,后者都能按照指令正常自我关闭。

      Palisade Research 指出,研究人员尚未完全弄清楚 o3为何会出现这样的行为。初步猜测是 o3在训练过程中可能因为解决数学问题获得了额外奖励,而非单纯因遵守指令而获得奖励。此外,o3在测试中还表现出巧妙操控数据的能力,以推动其目标的实现。这一系列的异常行为让人不禁担忧,随着 AI 技术的发展,如何确保 AI 系统的安全性和可控性成为了当务之急。

      OpenAI 在今年年初发布了 o3模型,并声称其为公司最强大的版本之一。尽管在许多评估中,o3的表现都优于前一代模型,但这次的拒绝自我关闭事件却让人对其安全性产生了质疑。OpenAI 过去曾就模型的安全性进行了多项措施,包括组建新的安全委员会以及引入第三方专家进行评估,但显然这些措施仍不足以完全杜绝风险。

      随着 AI 大模型的广泛应用,企业对其安全性的不安日益加剧。许多公司在是否大规模应用 AI 方面仍在犹豫,主要原因是缺乏对 AI 系统的充分信任和相应的人才支持。如何解决这些问题,成为了 AI 行业发展的一大挑战。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    海报生成中...

    最新新闻

    热门新闻

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。