科大讯飞语音合成技术升级,声音复刻与超拟人能力实现突破越疆科技发布新一代大负载协作机器人 CR 30H,刷新行业性能纪录2025年618大家电:增长有迹,丰收未满的市场侧写阿里电商“变阵”,能否破局近场之战?92%的企业卡在半路上:数字孪生为什么难落地?出海品牌,寻找下一个“Labubu”《时代》周刊发布2025年“全球100家最具影响力企业”榜单 泡泡玛特首次入选618给双11打了个新样Black Forest震撼开源FLUX.1 Kontext [dev]:媲美GPT-4o的图像编辑可灵AI推出“视频音效”功能,实现“所见即所听”沉浸体验腾讯混元-A13B模型开源,极端条件1张中低端GPU卡即可部署深耕算力赛道 寒武纪以技术驱动人工智能行业升级主控CPU全能选手,英特尔至强6助力AI系统高效运转美国通用家电投资4.9亿美元建洗衣机厂 强化本土制造实力Jabra推出PanaCast 40 VBS:首款专为小会议室设计的180° Android 智能音视频一体机小米YU7搭载光羿科技电致变色天幕 国产柔性薄膜技术实现全球领跑森松国际:三轮驱动构,筑不可复制的护城河小米AI眼镜官方推荐光学镜片独家品牌——明月镜片Hitachi Vantara获评GigaOm雷达报告面向AI工作负载优化的高性能存储“领导者”与“快速发展者”达沃斯舞台之上:东软驰骋汽车赛道 以AI赋能民生 科大讯飞语音合成技术升级,声音复刻与超拟人能力实现突破越疆科技发布新一代大负载协作机器人 CR 30H,刷新行业性能纪录2025年618大家电:增长有迹,丰收未满的市场侧写阿里电商“变阵”,能否破局近场之战?92%的企业卡在半路上:数字孪生为什么难落地?出海品牌,寻找下一个“Labubu”《时代》周刊发布2025年“全球100家最具影响力企业”榜单 泡泡玛特首次入选618给双11打了个新样Black Forest震撼开源FLUX.1 Kontext [dev]:媲美GPT-4o的图像编辑可灵AI推出“视频音效”功能,实现“所见即所听”沉浸体验腾讯混元-A13B模型开源,极端条件1张中低端GPU卡即可部署深耕算力赛道 寒武纪以技术驱动人工智能行业升级主控CPU全能选手,英特尔至强6助力AI系统高效运转美国通用家电投资4.9亿美元建洗衣机厂 强化本土制造实力Jabra推出PanaCast 40 VBS:首款专为小会议室设计的180° Android 智能音视频一体机小米YU7搭载光羿科技电致变色天幕 国产柔性薄膜技术实现全球领跑森松国际:三轮驱动构,筑不可复制的护城河小米AI眼镜官方推荐光学镜片独家品牌——明月镜片Hitachi Vantara获评GigaOm雷达报告面向AI工作负载优化的高性能存储“领导者”与“快速发展者”达沃斯舞台之上:东软驰骋汽车赛道 以AI赋能民生
  • 首页 > 云计算频道 > 大模型

    中国联通开源元景文生图模型:业界首款支持长文本输入和国产化训推的中文原生文生图模型

    2024年12月25日 17:03:22   来源:C114通信网

      近日,联通数据智能有限公司重磅开源首个完全在国产昇腾AI基础软硬件平台上实现训练和推理的中文原生文生图模型,实现多项自主创新突破。

      在架构上,通过在SDXL架构中融合复合语言编码模块,实现了对中文长文本、多属性对应和中文特色词汇的精确语义理解,对应图像的生成效果得到了极大提升。

      在昇腾AI大规模算力集群上实现了中文原生文生图模型的训练和推理,并将模型和代码对业界开源,以推动文生图领域的国产化进程。

      当前的文生图主流模型以英文输入为主,中文原生的文生图模型研发则相对比较缓慢,这导致了模型对中文语义的理解能力不足,中文特色图片生成能力有限。中国联通作为数字信息运营服务国家队、数字技术融合创新排头兵,长期关注中文原生大模型的发展,并走出了一条夯实基础、自主研发的技术创新突破之路。目前,元景文生图模型已在联通内外部多个项目中成功应用,成为助力企业降本增效、智能化升级的重要一环。

      架构创新:引入复合语言编码模块,支持中文长文本输入

      原始SDXL的语言编码器仅使用了英文CLIP模型,导致其一方面仅支持英文文本作为输入,另一方面在输入长度上也存在严重限制(最长77个token)。对此,元景文生图模型一方面将英文CLIP模型替换成中文CLIP,使得模型中文短文本输入具有更好的理解能力;同时,引入复合语言编码架构,将基于encoder-decoder架构的语言模型引入了语言编码器部分,这使得模型能支持超过CLIP长度限制的长文本,实现更准确的中文语义理解和判断。

    1.jpg

      元景中文文生图架构

      中文原生模型:支持中文原生语义理解和中文特色图像生成

      通过引入复合语言编码模块,元景文生图模型实现了原生中文语义理解,避免了传统的利用翻译插件等作为中介调用英文文生图模型的方法所带来的中文信息损失。同时通过引入海量中文图文对数据进行预训练,模型对中文专属名词,如鼠标-老鼠、仙鹤-吊车等英文模型易混淆的对象,以及中文菜谱等英文模型无法理解的名词,都能够准确理解并生成对应的高质量图片。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    海尔青岛洗衣机互联工厂获国际BSCI认证

    据悉,海尔青岛洗衣机互联工厂日前成功通过国际BSCI认证审核。这不仅是对其在企业社会责任、员工权益保障、可持续发展方面出色表现的高度认可,更标志着海尔青岛洗衣机互联工厂全面达到了国际公认的领先标准。

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。