• 首页 > 产经频道 > 业界新闻

    达摩院公布语音AI四大进展,实现理论、技术、应用全链路突破

    2019年09月26日 18:59:56   来源:中文科技资讯

      9月26日,达摩院在杭州云栖大会公布2019年阿里语音AI四大进展,在语音AI的理论、技术、应用等整个链路均有突破。y70中文科技资讯

      当日,阿里巴巴在杭州云栖大会上首次公布人工智能调用规模:每天调用超1万亿次,服务全球10亿人,日处理图像10亿张、视频120万小时、语音55万小时及自然语言5千亿句,已经成为中国最大的人工智能公司。y70中文科技资讯

      达摩院语音实验室负责人鄢志杰介绍,今年以来实现了四大技术进展:声学信号处理理论、语音合成技术、语音自学习平台及通用语音交互方案。y70中文科技资讯

      语音AI团队提出了声学信号处理的理论创新——指向性差分麦克风阵列,用“应用指向性麦克风阵列”替代传统的全向型麦克风,使得阿里AI能够实现超大型空间内的远距离清晰收音。y70中文科技资讯

      不久前,达摩院发布了自研的新一代KAN-TTS语音合成技术,把语音合成与真人录音的相似度提升到95%以上,并将声音定制成本降低10倍以上、周期压缩3倍以上。y70中文科技资讯

      阿里云语音自学习平台升级到了2.0版本,全面开放自学习优化手段,人人都能自主定制语音模型,目前平台已经服务超过2.6万个场景。同时,达摩院推出了通用语音交互方案,提供端云接入、全方位服务、可定制的一站式解决方案。y70中文科技资讯

      “达摩院的AI就是大家的AI,达摩院要把语音技术能力做得高一点,但把技术到产业落地的门槛做得低一点。”鄢志杰表示,达摩院最先进的AI技术全都“零时差上云”,通过阿里云对外输出服务。y70中文科技资讯

      他打开阿里云官网,现场演示了“开箱即用”的语音合成服务:假设要定制一套给小朋友说故事的声音,先在页面上选择合适的声音,然后输入任意文本,比如“欢迎大家来到云栖大会,我长大了也要到达摩院当一个扫地僧”,马上,语音AI就用奶声奶气的合成童声念出了这句话。y70中文科技资讯

      来源:XXX(非中文科技资讯)的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

      如发现本站文章存在问题,提供版权疑问、身份证明、版权证明、联系方式等发邮件至news@citnews.com.cn。

    [上传用户: S021]
    分享到微信

    推荐

    工信部:携号转网管理规定12月1日起施行

    11月11日讯,工信部印发《携号转网服务管理规定》,规定自2019年12月1日起施行。规定要求电信业务经营者在提供携号转网服务过程中,不得为携号转网用户设置专项资费方案和营销方案,不得采取拦截、限制等技术手段影响携号转网用户的通信服务质量等。

    新闻

    《2019年全球电子商务数据报告》重磅发布

    11月5日,第二届中国国际进口博览会在上海开幕。对许多外国企业来说,参加进博会意味着走上进入中国市场的“绿色通道”,而各大跨境电商平台在去年祭出采购大单之后,早已筹谋今年的“买买买”计划,继续担当进博会重要的采购力量,丰富消费者的购物车。

    互联网+

    拯救脱发、治愈癌症...医疗互联网越慢越好?

    事实上,这大概是中国互联网创业的本质:技术领域的一个概念、一段视频、一份PPT,都会让资本市场异常兴奋,大家都喜欢先奔跑起来,再寻找方向,如团购、外卖、共享单车、特供智能机,莫不如此,医疗互联网身处其中,自然也免不了沾染癫狂习气,只是医疗行业的特殊性不言而喻,或许,越慢越好!

    融合

    高尚大的人工智能背后:真的只是单调、枯燥和密集劳

    总得来说,人工智能有两个重要的支柱,一个是海量的数据、大大的数据;另一个则是高精度算法,显然,算法需要一小撮的天才来编辑和优化,而海量的大数据,除了机器本身的收集能力之外,还需要大量的人工操作,给相关的数据贴上固定的标签。