• 首页 > 科技频道 > 科技新闻

    谷歌赋予机器更像人类声音 听起来更自然舒适

    2018年03月28日 11:10:11   来源:网易科技

      3月28日消息,据VentureBeat报道,谷歌旗下Google Brain和机器感知团队的成员今天在博客文章中宣布,谷歌研究人员已经找到了让机器生成更自然、更像人类语音的方法,使它们的声音更有表现力。

      今天早些时候,谷歌发布了其Cloud Text-to-Speech服务的测试版本,为客户提供谷歌助手Google Assistant使用的相同语音合成技术。谷歌Cloud Text-to-Speech由DeepMind的WaveNet支持,后者也可以用来生成听起来更自然的声音。

      今天推出的Cloud Text-to-Speech服务和研究方法,可以用来为使用语音控制或语音计算的设备、应用程序或数字服务带来更自然的声音。

      在最近发表的两篇关于如何模仿语音中的重音或语调的文章中,都提到了让机器声音听起来更像人类的新方法,符合语音学韵律的规律。这两份论文中提及的技术都是在Tacotron 2上建立的,这是去年12月首次亮相的人工智能系统,它使用被训练的神经网络模仿人类语言。

      虽然Tacotron在最初的800人测试中听起来像是人类的声音,但它无法模仿在压力条件下的人类声音或说话者的自然语调。在Tacotron联合创始人Yuxuan Wang领导的研究中,通过将人类语音记录片段嵌入其中实现了压力水平下的语音生成。

      研究人员在博客文章中说:“这种嵌入捕捉声音特征的方式独立于语音信息和说话者的特殊特征,这些特征包括压力、语调和时机等。在推理时,我们可以使用这种嵌入方式来进行韵律转换,生成完全不同的说话者声音,同时模仿引用者的语音韵律。”

      第二篇论文是由Skerry-Ryan撰写的,它使用无监督训练来识别语音模式并模仿某些语言风格。

      第一种韵律转换方法依赖于模仿长度和结构相似句子的语音;第二篇论文中使用的语言风格转换方法是,不需要模仿录制的音调或相似长度的语音,从而将演讲风格转移为愤怒或活泼的语气。

      Yuxuan Wang和Skerry-Ryan都表示:“这是前景十分乐观的研究,因为它为语音交互设计师们使用他们自己的声音定制语音合成铺平了道路。”

      除了谷歌的Cloud Text-to-Speech服务和语音识别服务之外,更有表现力的语音技术还可以带来更人性化的Google Assistant。摆脱单调的无音域声音似乎是科技巨头们追求的策略之一,比如Alexa、Siri和Google Assistant。

      去年,Siri得到了更有表现力的声音。4月份,Alexa为语音应用程序开发人员提供了SSML标签,以提高个人助理的语音能力,比如停顿、耳语或类似“砰”或“Bada bing”的表情。SSML也已向Google Assistant开发者开放。

      来源:XXX(非中文科技资讯)的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

      中文科技资讯倡导尊重与保护知识产权。如发现本站文章存在版权问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至news@citnews.com.cn,我们将及时沟通与处理。

    [责任编辑: CIT01]
    分享到微信

    即时探行数字人注册免费试用

    第三代骁龙8s平台,“恰逢其时”的“新生代旗舰”之选

    日前,高通举办新品发布会,推出了骁龙8旗舰移动平台诞生以来的第一款新生代旗舰平台:第三代骁龙8s,这是高通对骁龙旗舰移动平台的一次层级扩展,同时意味着广大消费者未来在旗舰手机市场也将会有更多丰富的选择。

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。