微软研究院 NUI 新进展:实时语音机器翻译

微软研究院 NUI 新进展:实时语音机器翻译

微软首席研究官 Rick Rashid 博士在天津举办的“21 世纪的计算 – 自然而然”会议上展示了他们实时语音机器翻译(属于 自然用户界面 NUI 的一部分)最新进展,相比之前的方法,新语音识别方法的错误率下降了 30%,7、8 个单词中仅有 1 例错误。Rashid 提到,”大约在两年前,微软研究院和多伦多大学的研究员取得了重要突破。通过一种被称为深度神经网络(Deep Neural Networks)的技术来实现个体差别、更好的语音识别。”

Rick Rashid 的演示中,他展示了整套系统如何在演讲的同时,识别并呈现出英文字幕,实时翻译成其他语言 – 演示的是简体中文,翻译并重组语句来实现同声传译。更惊人的是,几乎同步的语音朗读已经可以根据预录的约 1 小时的原英文朗读数据来生成相似语音语调的普通话。

下面就是 Rick Rashid 的演示,亮点从 7 分 30 秒开始,现场的翻译准确率极高,基本流畅:

事实上在今年 3 月 TechFest 2012 主旨演讲上,微软研究院已经演示过该技术,支持 26 种语言互译。或许你还记得微软未来愿景 2019新未来愿景

直达:微软中国官方商城 - 购买 Surface、Xbox 和配件促销

24 条评论
  • clske

    尽快投入应用吧

    2012 年 11 月 10 日 12:55 下午

  • zhongda959

    写的太好了,学习学习!

    2012 年 11 月 10 日 2:41 下午

  • 一堵墙

    技术越来越进步了

    2012 年 11 月 10 日 3:05 下午

  • humul

    非常棒的应用

    2012 年 11 月 10 日 5:09 下午

  • humul

    错了,非常棒的技术

    2012 年 11 月 10 日 5:09 下午

  • leetom

    “数年后,我们希望能够打破人们之间的语言障碍”,神了!

    2012 年 11 月 10 日 5:31 下午

  • 左手饭特稀

    专利一定要先伸请呀……

    2012 年 11 月 10 日 5:52 下午

  • TurnRight W.

    细致对比Microsoft、Google、Apple。我有一个比较形象的比喻Apple 研究的是如何把消费者钱包变成自己的Google 研究的是如何让自己变成钱包Microsoft 研究的是如何让钱包装下更多的钱

    2012 年 11 月 10 日 10:55 下午

  • wingice

    微软的实验室中有过很多领先的技术和概念产品,但是其中很少的被整合成为正式的产品推入市场。

    2012 年 11 月 11 日 6:13 上午

  • Allen

    苹果:只能我赚钱微软:大家一起赚钱谷歌:我帮大家赚钱

    2012 年 11 月 11 日 4:32 下午

  • Allen

    这个不怕,水果就是想抢,也没东西拿出来啊。

    2012 年 11 月 11 日 4:47 下午

  • uglyss

    希望能提供api啊...

    2012 年 11 月 12 日 8:18 上午

  • Paul

    希望这在以后,能够改变人们学外语的观念

    2012 年 11 月 12 日 8:21 上午

  • Picturepan2

    产品化的问题。微软研究院大部分项目定位的是未来 10 年的产品。

    2012 年 11 月 12 日 11:00 上午

  • 左手饭特稀

    说真的,不知道为什么,总感觉微软对于产品总是欠缺点什么……总感觉做事总是慢半拍的样子……

    2012 年 11 月 12 日 11:24 上午

  • wingice

    平板最早是微软推出的,但结果不好。平板直到苹果ipad后才有大发展。微软产品不是慢半拍就是太超前。

    2012 年 11 月 12 日 4:37 下午

  • dd

    这肯定是事先排练好的 经不起实际考验

    2013 年 01 月 27 日 10:55 下午

  • 416193694

    站在使用者的角度看,实在没什么创新,一个speech sdk+几个发声engine,加一套他们的语料库及翻译算法(站在使用者角度,他们这块做的的确不好),就可以发这个presentation了

    2013 年 04 月 29 日 6:19 下午

评论当前被关闭。