京东Joy Inside联手商汤元萝卜 AI下棋“家教”正式上线开源共建智启未来 开源鸿蒙开发者大会2025成功举办微博管理员回应推出“黑粉”标识:纯属 P 图,站内无此标识挑战英伟达垄断地位:和硕展示基于 AMD MI350X 的 1177 PFLOP 级 AI 机架Sensor Tower 报告 4 月全球手游收入:《王者荣耀》强势上升四位,重回榜首微软为 Mesa 3D 图形堆栈贡献超 6 万行代码,推出全新 Gallium3D 前端除 Mac Studio 外,苹果曾考虑将 M3 Ultra芯片应用到 MacBook Pro 中从华为智能电动DriveONE运动域看新能源汽车行业发展困境与破局之道埃克塞尔集团携手孝南区共绘算力经济新蓝图——“数智创新 算力未来”主题活动助推区域高质量发展中国企业管理,迈入AI时代当 “度电续航” 成为硬指标:华为智能电动DriveONE如何重塑新能源汽车评价体系?华为智能电动DriveONE:重新定义新能源汽车的续航与安全湖北消费者来京东购3C数码 享国补多重补贴 还有至多500元加补福利埃夫特与华为云携手推进具身智能领域合作AMD发布RX 9060 XT显卡 回应8GB显存争议5月26日京东3C数码“疯狂星期一”再上线 名著图书7折抢玄戒O1发布前小米手机芯片供应情况:联发科与高通“唱主角”,紫光展锐占2%UFCS 2.0标准发布!OPPO、vivo、华为、荣耀在一起:快充互授权联想推出国内首个轮胎AI质检智能体方案,破解行业痛点2025无创水光品牌排行榜 京东Joy Inside联手商汤元萝卜 AI下棋“家教”正式上线开源共建智启未来 开源鸿蒙开发者大会2025成功举办微博管理员回应推出“黑粉”标识:纯属 P 图,站内无此标识挑战英伟达垄断地位:和硕展示基于 AMD MI350X 的 1177 PFLOP 级 AI 机架Sensor Tower 报告 4 月全球手游收入:《王者荣耀》强势上升四位,重回榜首微软为 Mesa 3D 图形堆栈贡献超 6 万行代码,推出全新 Gallium3D 前端除 Mac Studio 外,苹果曾考虑将 M3 Ultra芯片应用到 MacBook Pro 中从华为智能电动DriveONE运动域看新能源汽车行业发展困境与破局之道埃克塞尔集团携手孝南区共绘算力经济新蓝图——“数智创新 算力未来”主题活动助推区域高质量发展中国企业管理,迈入AI时代当 “度电续航” 成为硬指标:华为智能电动DriveONE如何重塑新能源汽车评价体系?华为智能电动DriveONE:重新定义新能源汽车的续航与安全湖北消费者来京东购3C数码 享国补多重补贴 还有至多500元加补福利埃夫特与华为云携手推进具身智能领域合作AMD发布RX 9060 XT显卡 回应8GB显存争议5月26日京东3C数码“疯狂星期一”再上线 名著图书7折抢玄戒O1发布前小米手机芯片供应情况:联发科与高通“唱主角”,紫光展锐占2%UFCS 2.0标准发布!OPPO、vivo、华为、荣耀在一起:快充互授权联想推出国内首个轮胎AI质检智能体方案,破解行业痛点2025无创水光品牌排行榜
  • 首页 > 云计算频道 > 大模型

    亚马逊开发出有史以来最大的文本转语音模型,展现“涌现能力”

    2024年02月18日 16:09:53   来源:IT之家

      亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。

      近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。然而,人工智能也在逐步融入其他主流应用领域。在这个新项目中,研究人员尝试通过增加参数数量和扩充训练数据集来提升文本转语音应用的能力。

      据IT之家了解,这个名为“可扩展流式文本转语音模型”(BASE TTS)的新模型拥有 9.8 亿个参数,并使用 10 万小时的录音(来自公共网站)进行训练,其中大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例,使其能够正确发音一些常见的表达,例如“au contraire” 和 “adios, amigo”。

      亚马逊团队还测试了使用较小数据集的模型,希望能从中发现人工智能领域所说的“涌现能力”。这种能力是指人工智能应用,无论是大型语言模型还是文本转语音模型,突然突破到更高智能水平的现象。他们发现,对于文本转语音应用而言,这种飞跃发生在参数量达到 1.5 亿的中型数据集上。

      研究人员还指出,这种飞跃涉及一系列语言属性,例如使用复合名词、表达情感、使用外语词、应用语音学和标点符号以及正确强调句子中的关键词等能力。

      研究团队表示,出于对潜在滥用风险的担忧,BASE TTS 将不会向公众开放,他们计划将其作为学习应用,并期望将学到的知识应用于改善文本转语音应用的整体音质。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    vivo携手首届商学院戈壁友谊赛,以专业影像见证无畏征途

    2025年5月4日,首届商学院戈壁友谊赛于甘肃省酒泉市圆满举办。在这场4天121公里的戈壁征途中,vivo作为战略合作伙伴,为赛事提供手机、智能穿戴设备及定制影像服务,以技术赋能助力参赛选手与观众记录戈壁之上的热血奔赴,共同探索科技进步、商业文明与自然共生的未来路径。

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。