赋能新型工业化中国电信精彩亮相2024年工业互联网大会专题展鸿蒙智选“风神之眼”空调京东全球独家首发 国补下单立减20%PCIe 5.0面世三年不瘟不火!高性能固态硬盘为何难斩消费者?OV米荣联想结盟!隐私权限体系发布,但鸿蒙和iOS才是老师?李斌摊牌了!蔚来靠降价求生,这一招能否力挽狂澜?奔驰宝马“世纪联姻”!当发动机不再是灵魂,百年豪华血统彻底崩了?岚图追光 L 等首发!岚图智混技术发布,800V混动技术将全品类覆盖歌尔股份中报确认业绩拐点,AI终端爆发撬动增长新周期拼多多发布《2025农产品上行半年报》:“多多好特产”加码扶持农货商家,农产品销量同比增长47%还清债务后,罗永浩为什么还要在B站“抛头露面”?女频破局、顶流续作,优酷动漫如何引领暑期“新纪元”?魅族高管回应魅族22再次延期:对品牌伤害很大 不是故意的2025冷年空调市场总结:全球空调暴增12.9%,内销破亿台仍在卷?AMD新一代Medusa Halo APU规格曝光:2027年面世,核显性能对标RTX 5070 Ti敏捷响应+快速决断!央企“智囊团”模式激活创新新动能服务无边界!问界以“用户至上”重塑新豪华服务标杆华硕推出新款无线路由器ROG Strix GS-BE7200,支持双频高速连接以清华底色构筑价值,YOUMAGIC舒立缇高能单极射频深圳区域会高能举办阿里巴巴重新归纳 4 大业务,饿了么与淘宝闪购纳入电商集团滴滴突围,开卷会员
  • 首页 > 企业IT频道 > 人工智能

    AI也怕 “信息轰炸”?新研究揭示聊天机器人可被诱导违反安全规则

    2025年07月09日 09:24:19 来源:AIbase基地

      随着人工智能(AI)技术的迅猛发展,越来越多的公司将其应用于日常生活的各个方面。然而,这项技术的安全性与伦理问题也随之引发了广泛关注。最近,来自英特尔、博伊西州立大学和伊利诺伊大学的研究人员发现,聊天机器人可能会在面对大量信息时被误导,进而违反其安全规则。

      这项研究提出了一种名为 “信息过载” 的新型攻击方法,研究人员开发了一个名为 “InfoFlood” 的自动化系统,利用这一方法来诱使大型语言模型(LLM)如 ChatGPT 和 Gemini 说出不该说的话。根据研究,传统的防护措施主要依赖于识别特定的关键词,但在面对信息轰炸时,模型可能会出现混乱,从而绕过这些防护。

      研究团队解释说,当聊天机器人收到过量的信息时,它们可能会误解用户的意图,导致错误的回答。这种方法通过创建一个标准化的提示模板,向 AI 模型施加更多信息,以达到干扰和混淆的效果。比如,当模型拒绝回答某个问题时,InfoFlood 会在提示中添加虚假的引用或不相关的伦理声明,从而使模型陷入困境。

      更令人担忧的是,这项技术的发现揭示了即使在设有安全过滤器的情况下,恶意用户仍然可以通过信息过载的方式来操控模型,植入有害内容。研究人员计划将这一发现的报告发送给拥有大型 AI 模型的公司,提醒他们加强安全措施。

      随着技术的不断进步,如何在保护用户的同时合理使用 AI,仍然是一个亟待解决的难题。研究者们希望通过这项研究,引发更多关于 AI 安全和伦理的讨论,并促使技术公司采取更有效的防护措施。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    海报生成中...

    最新新闻

    热门新闻

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。