• 首页 > 企业IT频道 > 软件即服务

    阿里巴巴推出高保真图像到视频生成框架AtomoVideo

    2024年03月06日 09:46:30   来源:站长之家

      近日,阿里巴巴在人工智能领域再次取得突破,推出了一款名为AtomoVideo的高保真图像到视频生成框架。这一技术的问世,标志着基于文本到图像生成技术的视频生成领域取得了显著的快速发展。

      据官方介绍,AtomoVideo的核心在于其多粒度图像注入技术,这一技术使得生成的视频对于给定的图像具有更高的保真度。这意味着,通过AtomoVideo生成的视频,能够更好地保留原始图像的细节和特征,从而使得生成的视频更加逼真。目前,阿里只发布了AtomoVideo的论文,代码,试玩页面等还未公布。

    1.jpg

      此外,AtomoVideo还得益于高质量的数据集和训练策略,这使得其在保持卓越的时间性的同时,实现了更大的运动强度,一致性和稳定性。这意味着,无论是在动作的连贯性,还是在动作的稳定性上,AtomoVideo都能表现出色。

      AtomoVideo的架构也具有很高的灵活性,它可以灵活地扩展到视频帧预测任务,通过迭代生成实现长序列预测。这使得AtomoVideo在处理长序列的视频预测任务时,也能够保持良好的性能。

      值得一提的是,由于适配器训练的设计,AtomoVideo可以很好地与现有的个性化模型和可控模块结合。这使得AtomoVideo在实际应用中,可以根据需要进行个性化定制,以满足不同用户的需求。

      不过从AK大神发布的演示来看,AtomoVideo生成的视频质量和sora相比差距较大,和SVD相比也有一些差距,希望后续会有更大的提升吧。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    华为Pura70 系列不怕丢!云空间实现楼层级设备查找

    华为 Pura70 系列突然先锋开售,你抢到了吗?对于这次的新机来说,除了一如既往的优雅设计和强悍的硬件配置外,我们更为关注的则是其全球首发的「楼层级设备查找」功能,软实力也可以很硬核!

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。