2025第二届越野车&SUV新能源化与智能化发展大会圆满召开中国联通正式发布抗量子安全手机:可选华为Mate 70系列小米Civi 5 Pro机身7.45mm:配备6000mAh电池信任的进阶:LEI与vLEI协同推进跨境支付体系变革赋能企业级移动应用 CFCA FIDO+提升安全与体验谷歌 CEO 皮查伊自曝:曾认真考虑过收购 Netflix,差点就成了三星展示 Dynamic Drive-Thru 解决方案:55 英寸屏幕 + AI 语音,革新餐饮体验京东发言人:网传的《京东外卖专家纪要:约谈不改变竞争策略》为造谣复合多态机器人“UP”上架首旅如家平台 深化合作共筑酒店数智化新高度来京东先人一步下单OPPO Reno14 最快发布会第二天到手新机每晚8点打开京东苹果会场领1200元以旧换新券 iPhone 16全系可用超划算华硕ProArt携一站式创意解决方案亮相P&E展,拍出人生照片像呼吸一样简单!芯粒技术:新一代软件定义汽车的关键所在PC均价大涨11%!AI加速下沉,厂商冲高端的机会来了?卖疯了!收割中国小孩的智能手表,有哪些芯片机会苹果 AI 太落伍?他们需要从对手那里“复制”这三个功能选购520好礼就来京东3C数码“疯狂星期一” 汉印拍立得到手价520元美的小家电业务再换帅 20年元老离职折射出小家电行业困境2025动感地带AI+高校创智计划元宇宙启航群创光电展示Micro LED创新显示技术 2025第二届越野车&SUV新能源化与智能化发展大会圆满召开中国联通正式发布抗量子安全手机:可选华为Mate 70系列小米Civi 5 Pro机身7.45mm:配备6000mAh电池信任的进阶:LEI与vLEI协同推进跨境支付体系变革赋能企业级移动应用 CFCA FIDO+提升安全与体验谷歌 CEO 皮查伊自曝:曾认真考虑过收购 Netflix,差点就成了三星展示 Dynamic Drive-Thru 解决方案:55 英寸屏幕 + AI 语音,革新餐饮体验京东发言人:网传的《京东外卖专家纪要:约谈不改变竞争策略》为造谣复合多态机器人“UP”上架首旅如家平台 深化合作共筑酒店数智化新高度来京东先人一步下单OPPO Reno14 最快发布会第二天到手新机每晚8点打开京东苹果会场领1200元以旧换新券 iPhone 16全系可用超划算华硕ProArt携一站式创意解决方案亮相P&E展,拍出人生照片像呼吸一样简单!芯粒技术:新一代软件定义汽车的关键所在PC均价大涨11%!AI加速下沉,厂商冲高端的机会来了?卖疯了!收割中国小孩的智能手表,有哪些芯片机会苹果 AI 太落伍?他们需要从对手那里“复制”这三个功能选购520好礼就来京东3C数码“疯狂星期一” 汉印拍立得到手价520元美的小家电业务再换帅 20年元老离职折射出小家电行业困境2025动感地带AI+高校创智计划元宇宙启航群创光电展示Micro LED创新显示技术
  • 首页 > 云计算频道 > 大模型

    微软开发新型大模型压缩方法SliceGPT

    2024年01月29日 17:05:56   来源:站长之家

      1月29日 消息:SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT,可以在保持99%,99%,和90%零样本任务性能的同时,将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数(包括嵌入)。

      这意味着使用SLICE GPT的模型可以在更少的GPU上运行,并且运行速度更快,无需任何额外的代码优化。在24GB的消费级GPU上,将LLAMA2-70B的总计算量减少到密集模型的64%;在40GB的A100GPU上减少到66%。

      SLICE GPT的主要特点包括解决了大语言模型在存储和计算资源上的高需求问题,并提供了一种有效减轻这些资源需求的方法,同时保持或仅轻微牺牲模型性能,这对于推广大型模型的应用和降低运行成本具有重要意义。

      具体来说,SLICE GPT能够减少大型语言模型的尺寸,通过在不损失显著性能的前提下,减少模型参数数量,SLICE GPT能够减少大型语言模型的尺寸。它还能提高模型在硬件上的运行效率,减少了所需的计算资源,并且能够在去除一定比例的模型参数的同时,保持模型的性能。此外,SLICE GPT不仅适用于特定的模型或架构,它的方法可以广泛应用于各种变换器网络模型。

      SLICE GPT的工作原理基于一种新的后训练稀疏化方案,通过两个关键步骤来减少大型语言模型的计算和内存需求。首先是替换权重矩阵,通过将模型中的每个权重矩阵替换为一个更小的(密集的)矩阵来减少网络的嵌入维度,有效地缩减了模型的大小。

      其次是维持计算不变性,SLICE GPT引入了变换器网络中的“计算不变性”概念,通过特定的变换操作,改变权重矩阵的形状,而不改变其在模型中的功能和影响,从而达到减少模型参数的目的,同时保持模型的性能。这种方法的核心优势在于,它允许模型在去除一定比例的参数后,仍然能够保持接近原始模型的性能,适用于资源受限的设备上部署大型模型,比如普通的个人电脑或者移动设备。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    vivo携手首届商学院戈壁友谊赛,以专业影像见证无畏征途

    2025年5月4日,首届商学院戈壁友谊赛于甘肃省酒泉市圆满举办。在这场4天121公里的戈壁征途中,vivo作为战略合作伙伴,为赛事提供手机、智能穿戴设备及定制影像服务,以技术赋能助力参赛选手与观众记录戈壁之上的热血奔赴,共同探索科技进步、商业文明与自然共生的未来路径。

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。