赋能新型工业化中国电信精彩亮相2024年工业互联网大会专题展鸿蒙智选“风神之眼”空调京东全球独家首发 国补下单立减20%PCIe 5.0面世三年不瘟不火!高性能固态硬盘为何难斩消费者?OV米荣联想结盟!隐私权限体系发布,但鸿蒙和iOS才是老师?李斌摊牌了!蔚来靠降价求生,这一招能否力挽狂澜?奔驰宝马“世纪联姻”!当发动机不再是灵魂,百年豪华血统彻底崩了?岚图追光 L 等首发!岚图智混技术发布,800V混动技术将全品类覆盖歌尔股份中报确认业绩拐点,AI终端爆发撬动增长新周期拼多多发布《2025农产品上行半年报》:“多多好特产”加码扶持农货商家,农产品销量同比增长47%还清债务后,罗永浩为什么还要在B站“抛头露面”?女频破局、顶流续作,优酷动漫如何引领暑期“新纪元”?魅族高管回应魅族22再次延期:对品牌伤害很大 不是故意的2025冷年空调市场总结:全球空调暴增12.9%,内销破亿台仍在卷?AMD新一代Medusa Halo APU规格曝光:2027年面世,核显性能对标RTX 5070 Ti敏捷响应+快速决断!央企“智囊团”模式激活创新新动能服务无边界!问界以“用户至上”重塑新豪华服务标杆华硕推出新款无线路由器ROG Strix GS-BE7200,支持双频高速连接以清华底色构筑价值,YOUMAGIC舒立缇高能单极射频深圳区域会高能举办阿里巴巴重新归纳 4 大业务,饿了么与淘宝闪购纳入电商集团滴滴突围,开卷会员
  • 首页 > 产经新闻频道 > 业界新闻

    ​英伟达与港大等合作推出快速 KV 缓存,助力扩散模型提速

    2025年07月09日 15:53:50 来源:AIbase基地

      近日,英伟达、香港大学与麻省理工学院的研究团队联合发布了一种名为 Fast-dLLM 的创新技术,旨在提升扩散语言模型的推理效率。与传统的自回归模型不同,扩散语言模型采用逐步去除文本噪声的方式生成文本,因此能够在一次迭代中生成多个单词,整体效率更高。然而,在实际应用中,许多开源扩散语言模型的推理速度仍然不如自回归模型,主要受限于缺乏键值(KV)缓存支持以及并行解码时生成质量下降。

      KV 缓存是自回归模型中常用的加速推理技术,通过存储和重用之前计算的注意力状态,显著减少重复计算,从而提高生成速度。但由于扩散语言模型采用双向注意力机制,直接应用 KV 缓存并不容易。Fast-dLLM 架构的创新之处在于将文本生成过程划分为多个块,每个块包含一定数量的 token。通过这种块状生成方式,模型可以在生成一个块之前预先计算并存储其他块的 KV 缓存,进而避免重复计算。

      尽管 KV 缓存机制有效提升了推理速度,但在并行解码时,生成质量往往会下降。这是因为扩散型模型在解码时假设条件独立性,然而标记之间可能存在复杂的依赖关系。为了解决这一问题,Fast-dLLM 提出了一种基于置信度的平行解码策略。在每个解码步骤中,模型会计算每个标记的置信度,并选择置信度超过阈值的标记进行解码。这种策略确保了高置信度的情况下能够安全进行并行解码,从而维持生成文本的连贯性和准确性。

      为验证 Fast-dLLM 的性能,研究人员在 NVIDIA A10080GB GPU 上对 LLaDA 和 Dream 两种扩散语言模型进行了全面评估,涵盖了数学推理和代码生成等任务。在 KV 缓存机制的测试中,块大小为32时,模型的吞吐量达到了54.4tokens/s,准确率为78.5%。并行解码测试中,采用动态阈值策略优于固定 token 数基线。整体来看,LLaDA 模型在 GSM8K 任务中仅用 KV Cache 加速3.2倍,并行解码加速2.5倍,两者结合的速度提升达到8.1倍,生成长度达到1024时的端到端加速更是高达27.6倍。所有测试结果显示,Fast-dLLM 在加速的同时,保持了生成质量的稳定。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    海报生成中...

    最新新闻

    热门新闻

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。