董明珠京东直播再次刷新销售纪录 格力全天成交额超2亿洞察 2025:中国单相远程费控微电网智能电能表市场规模及竞争格局苹果WWDC开幕 外媒热议:AI王炸跳票 美学设计成主角Nordic Semiconductor nRF9151 蜂窝物联网模组通过日本NTT DOCOMO LTE-M 网络使用验证三星三折叠手机量产在即,准备硬刚华为Mate XT?新西兰运营商Spark推迟3G网络关闭时间明阳电气获"旋转输送电设备"专利 创新技术解决粉尘二次扩散难题小红书《五大影像功能洞察图鉴》首发爱立信与Telstra联合推出三频FDD Massive MIMO无线产品AI医疗的黄金赛道,大厂卷疯了抖音集团加速微短剧内容建设英伟达与港大共同推出新型视觉注意力机制 实现了计算效率的显著提升开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟DeepSeek R1- 0528 在OpenRouter支持本地工具调用美团王兴详解AI布局:No Code平台免费开放,1680个应用已上线截胡骁龙8 Elite 2!曝天玑9500提前发:联发科最强Soc金士顿官方更新三款 XS 系列移动固态硬盘的外观设计赋能HPC未来:MiTAC神雲科技在ISC高性能计算大会2025上展示先进服务器平台美商海盗船发布紧凑型游戏主机One i600,搭载英伟达RTX 5080显卡和英特尔酷睿Ultra 9 285K处理器浅层水光疗法:EPM技术能否终结‘针头注射’的恐惧? 董明珠京东直播再次刷新销售纪录 格力全天成交额超2亿洞察 2025:中国单相远程费控微电网智能电能表市场规模及竞争格局苹果WWDC开幕 外媒热议:AI王炸跳票 美学设计成主角Nordic Semiconductor nRF9151 蜂窝物联网模组通过日本NTT DOCOMO LTE-M 网络使用验证三星三折叠手机量产在即,准备硬刚华为Mate XT?新西兰运营商Spark推迟3G网络关闭时间明阳电气获"旋转输送电设备"专利 创新技术解决粉尘二次扩散难题小红书《五大影像功能洞察图鉴》首发爱立信与Telstra联合推出三频FDD Massive MIMO无线产品AI医疗的黄金赛道,大厂卷疯了抖音集团加速微短剧内容建设英伟达与港大共同推出新型视觉注意力机制 实现了计算效率的显著提升开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟DeepSeek R1- 0528 在OpenRouter支持本地工具调用美团王兴详解AI布局:No Code平台免费开放,1680个应用已上线截胡骁龙8 Elite 2!曝天玑9500提前发:联发科最强Soc金士顿官方更新三款 XS 系列移动固态硬盘的外观设计赋能HPC未来:MiTAC神雲科技在ISC高性能计算大会2025上展示先进服务器平台美商海盗船发布紧凑型游戏主机One i600,搭载英伟达RTX 5080显卡和英特尔酷睿Ultra 9 285K处理器浅层水光疗法:EPM技术能否终结‘针头注射’的恐惧?
  • 首页 > 云计算频道 > 大模型

    亚马逊开发出有史以来最大的文本转语音模型,展现“涌现能力”

    2024年02月18日 16:09:53   来源:IT之家

      亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。

      近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。然而,人工智能也在逐步融入其他主流应用领域。在这个新项目中,研究人员尝试通过增加参数数量和扩充训练数据集来提升文本转语音应用的能力。

      据IT之家了解,这个名为“可扩展流式文本转语音模型”(BASE TTS)的新模型拥有 9.8 亿个参数,并使用 10 万小时的录音(来自公共网站)进行训练,其中大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例,使其能够正确发音一些常见的表达,例如“au contraire” 和 “adios, amigo”。

      亚马逊团队还测试了使用较小数据集的模型,希望能从中发现人工智能领域所说的“涌现能力”。这种能力是指人工智能应用,无论是大型语言模型还是文本转语音模型,突然突破到更高智能水平的现象。他们发现,对于文本转语音应用而言,这种飞跃发生在参数量达到 1.5 亿的中型数据集上。

      研究人员还指出,这种飞跃涉及一系列语言属性,例如使用复合名词、表达情感、使用外语词、应用语音学和标点符号以及正确强调句子中的关键词等能力。

      研究团队表示,出于对潜在滥用风险的担忧,BASE TTS 将不会向公众开放,他们计划将其作为学习应用,并期望将学到的知识应用于改善文本转语音应用的整体音质。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。