Check Point Research 发布 2025 年第二季度品牌钓鱼攻击趋势报告信通院:我国云计算市场规模突破8000亿元格力车规级芯片:三项国际认证在握,国产之光闪耀大华问数智能体一体机通过中国信通院'大模型驱动的智能数据分析工具'专项测试软通计算机入选2025中国信创PC十大市场影响力品牌数字化转型解密:AI赋能下的食品零售业创新之道WAIC 2025:开普勒大黄蜂挑战8小时直播圆满收官,引领具身智能商业化新征程人形机器人赛道:赛博格20kg“举起”全球天花板京东发布“灯塔计划+”,推出激励、商机、权益三大升级苏州绿色动脉:九识智能如何用无人车编织低碳物流网络WAIC 2025 | SHIXP将与PPIO共建分布式智算枢纽平台PTC携手NVIDIA Omniverse,加速AI基础设施与复杂产品的设计与仿真虹软旗下PSAI新功能上线:2天极速交付电商视觉成品,AI商拍再进阶理想邀请乘龙卡车直播对撞 东风柳汽:理想撞卡车视频严重侵权高温空调选购指南,TCL空调小蓝翼C7新风空调解锁“清凉安睡”秘籍中式珠宝品牌,正在“拿捏”买手串的年轻人联想moto razr 60冰钻限定版手机渲染图曝光 全球首款珠宝小折叠三星Galaxy Tab S11系列存储及配色曝光,Plus机型或遭取消高通官宣:小米将首发骁龙8 Elite 2半年销量已超去年全年!小鹏7月交付新车36717台 同比暴涨2倍多
  • 首页 > 云计算频道 > 云计算

    昇腾算力赋能视频生成革命 浙江大学团队攻克长时一致性难题

    2025年07月31日 14:54:24 来源:CITNews中文科技资讯

      随着以 Sora 为代表的视频生成模型技术的演进,长视频生成领域在维持长时序内容一致性以及平衡生成质量与计算资源效率方面面临挑战。浙江大学 鲲鹏昇腾科教创新卓越中心计算机学院研究员朱霖潮团队基于此课题持续深耕并取得重要进展。依托昇腾AI基础软硬件平台,该团队提出的技术方案有效提升了长视频内容一致性,同时显著优化了视频生成过程中的计算效率。

      针对长序列视觉指令生成的核心技术难题,项目团队成功研发首个无需训练的长序列视觉指令生成框架LIGER,实现了历史提示和视觉记忆机制,以及基于DDIM反演的记忆校准技术。依托昇腾的编码加速能力,通过对每个步骤的图像特征进行采样和存储,捕捉前序步骤中的关键视觉信息,并将其注入到自注意力机制中,确保步骤间的视觉连贯性。同时,通过自反思机制纠正图像中的属性错误、逻辑错误、对象冗余和身份不一致等问题,使用多种图像编辑工具进行精确修正。该系统在长序列任务中展现出优异的逻辑连贯性和对象属性准确性,显著提升了视觉指令的理解性和实用性。

      在计算效率方面,项目团队提出了基于昇腾平台优化的引导式渐进蒸馏方法,通过在线教师引导、渐进式蒸馏和高频细节保护三项关键技术,成功加速了视频扩散模型的生成过程。该方法让教师模型实时优化学生模型的中间预测以创建自适应训练目标,通过多阶段训练逐步增加步长将复杂轨迹学习分解为可管理的任务,并引入频域损失函数保持视频精细细节。在保持视频高质量输出基础上,该方法实现8倍加速。

      该项目创新性地将大语言模型推理能力与视频生成技术相结合,为多模态交互研究开辟了新方向。目前,研究成果已成功入选人工智能顶级会议ICLR 2025,获得国际学术界的高度认可。项目构建的包含569个任务的评估数据集,为后续研究提供了重要基准。

      未来,浙江大学 鲲鹏昇腾科教创新卓越中心将依托昇腾AI基础软硬件平台,持续深化产学研协同创新,着力突破多模态生成技术的核心瓶颈,构建自主创新、技术领先的多模态生成技术生态体系,并为国家人工智能战略与数字经济发展储备核心创新力量。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    海报生成中...

    [No.S132]

    最新新闻

    热门新闻

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。