来京东618用“京补合约”下单手机低至1折起 iPhone 16仅需1579元看龙舟赛事、4折起购3C数码 京东“3C数码国补中国行”落地佛山同款iPhone京东比美团、天猫便宜200元 全国可用的消费券还有谁不知道?京东618只剩不到1周 苹果500元消费券领券攻略看完直接收藏半年观察:彩电线下市场,三星索尼华为卡萨帝谁擎高端大旗?销量环比降50%,重组后知豆月均不足2000辆比亚迪汽车1-5月再夺销冠 海外增长超112%OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案安钛克推出迷你框架式开放机箱Performance Exo创维EV6车型新增“闪现版 +”上市:800伏架构、CLTC续航520 公里TrendForce:2025年OLED显示器面板出货量将达到 340 万片,同比增长69%雷军官宣!多款新品齐发,小米YU7月底登场!硬控川普的「磁吸」充电宝:要么超薄有线化,要么大容量桌面化人均看手机7小时!手机厂商死磕护眼,是智商税还是真有疗效?安吉尔印尼战略启动——全球领先净水科技,启航万岛之国618狂欢节福利拉满 天猫华硕官旗天选6 Pro国补好价到手6399.2元起Twopan推出“最小带指纹闪存盘”Nano SSD三星为Galaxy可穿戴新品造势,夏季发布会有望7月举行技嘉“M27UP”27英寸显示器国行首销:FHD 320Hz / 4K 160Hz双模+双5W扬声器消息称尼康 Zf 全画幅相机将新增银色版,有望今年第三季度前发布
  • 首页 > 产经新闻频道 > 业界新闻

    蚂蚁集团和inclusionAI联合推Ming-Omni:首个开源版多模态GPT-4o

    2025年06月16日 16:39:25   来源:AIbase基地

      近日,Inclusion AI 与 蚂蚁集团联合推出了一款名为 “Ming-Omni” 的先进多模态模型,标志着智能技术的新突破。Ming-Omni 能够处理图像、文本、音频及视频,为多种应用提供强大支持,其功能不仅涵盖语音和图像生成,还具备多模态输入的融合处理能力。

      ** 全面的多模态处理能力 **

      Ming-Omni 的设计中采用了专用编码器来提取不同模态的标记(tokens),这些标记经过 “Ling” 模块(即混合专家架构,MoE)进行处理,后者配备了新提议的模态特定路由器。这样一来,Ming-Omni 便能够高效地处理和融合多模态输入,支持多种任务而无需额外的模型、特定任务的微调或结构重组。

      ** 语音与图像生成的革新 **

      与传统多模态模型相比,Ming-Omni 的一个显著亮点在于其支持音频和图像生成。通过集成先进的音频解码器,Ming-Omni 能够生成自然流畅的语音。同时,其使用的高质量图像生成模型 “Ming-Lite-Uni” 则确保了图像生成的精细度。此外,该模型还能够进行上下文感知的对话、文本转语音转换和多样的图像编辑,充分展示了其在多个领域的应用潜力。

      ** 流畅的语音与文本转换 **

      Ming-Omni 在语言处理方面的能力同样引人注目。其具备对方言的理解和语音克隆功能,可以将输入的文本转换为多种方言的语音输出,展现了其强大的语言适应性。例如,用户可以输入不同的方言句子,模型将能够理解并以相应方言进行回应,提升了人机交互的自然性和灵活性。

      ** 开放源代码,促进研究与开发 **

      值得一提的是,Ming-Omni 是目前已知的首个在模态支持上与 GPT-4o 匹敌的开源模型。Inclusion AI 和 Ant Group 承诺将所有代码和模型权重公开,旨在激励社区的进一步研究与开发,推动多模态智能技术的不断进步。

      Ming-Omni 的发布不仅为多模态智能领域注入了新的活力,也为各类应用提供了更多可能性。随着技术的不断演进,期待 Ming-Omni 能够在未来的智能交互中发挥更大的作用。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。