视频

微软研究院 NUI 新进展：实时语音机器翻译

2012 年 11 月 10 日, 11:29 上午 · Picturepan2

微软首席研究官 Rick Rashid 博士在天津举办的“21 世纪的计算 – 自然而然”会议上展示了他们实时语音机器翻译（属于自然用户界面 NUI 的一部分）最新进展，相比之前的方法，新语音识别方法的错误率下降了 30%，7、8 个单词中仅有 1 例错误。Rashid 提到，”大约在两年前，微软研究院和多伦多大学的研究员取得了重要突破。通过一种被称为深度神经网络（Deep Neural Networks）的技术来实现个体差别、更好的语音识别。”

在 Rick Rashid 的演示中，他展示了整套系统如何在演讲的同时，识别并呈现出英文字幕，实时翻译成其他语言 – 演示的是简体中文，翻译并重组语句来实现同声传译。更惊人的是，几乎同步的语音朗读已经可以根据预录的约 1 小时的原英文朗读数据来生成相似语音语调的普通话。

下面就是 Rick Rashid 的演示，亮点从 7 分 30 秒开始，现场的翻译准确率极高，基本流畅：

事实上在今年 3 月 TechFest 2012 主旨演讲上，微软研究院已经演示过该技术，支持 26 种语言互译。或许你还记得微软未来愿景 2019 和新未来愿景？

直达：微软中国官方商城 - 购买 Surface、Xbox 和配件促销

Microsoft Research Microsoft Translator NUI Speech Speech Platform Translator Translator Hub

24 条评论

clske

尽快投入应用吧

2012 年 11 月 10 日 12:55 下午
zhongda959

写的太好了，学习学习！

2012 年 11 月 10 日 2:41 下午
一堵墙

技术越来越进步了

2012 年 11 月 10 日 3:05 下午
humul

非常棒的应用

2012 年 11 月 10 日 5:09 下午
humul

错了，非常棒的技术

2012 年 11 月 10 日 5:09 下午
leetom

“数年后，我们希望能够打破人们之间的语言障碍”，神了！

2012 年 11 月 10 日 5:31 下午
左手饭特稀

专利一定要先伸请呀……

2012 年 11 月 10 日 5:52 下午
TurnRight W.

细致对比Microsoft、Google、Apple。我有一个比较形象的比喻Apple 研究的是如何把消费者钱包变成自己的Google 研究的是如何让自己变成钱包Microsoft 研究的是如何让钱包装下更多的钱

2012 年 11 月 10 日 10:55 下午
wingice

微软的实验室中有过很多领先的技术和概念产品，但是其中很少的被整合成为正式的产品推入市场。

2012 年 11 月 11 日 6:13 上午
Allen

苹果：只能我赚钱微软：大家一起赚钱谷歌：我帮大家赚钱

2012 年 11 月 11 日 4:32 下午
Allen

这个不怕，水果就是想抢，也没东西拿出来啊。

2012 年 11 月 11 日 4:47 下午
uglyss

希望能提供api啊...

2012 年 11 月 12 日 8:18 上午
Paul

希望这在以后，能够改变人们学外语的观念

2012 年 11 月 12 日 8:21 上午
Picturepan2

产品化的问题。微软研究院大部分项目定位的是未来 10 年的产品。

2012 年 11 月 12 日 11:00 上午
左手饭特稀

说真的，不知道为什么，总感觉微软对于产品总是欠缺点什么……总感觉做事总是慢半拍的样子……

2012 年 11 月 12 日 11:24 上午
wingice

平板最早是微软推出的，但结果不好。平板直到苹果ipad后才有大发展。微软产品不是慢半拍就是太超前。

2012 年 11 月 12 日 4:37 下午
dd

这肯定是事先排练好的经不起实际考验

2013 年 01 月 27 日 10:55 下午
416193694

站在使用者的角度看，实在没什么创新，一个speech sdk+几个发声engine，加一套他们的语料库及翻译算法（站在使用者角度，他们这块做的的确不好），就可以发这个presentation了

2013 年 04 月 29 日 6:19 下午

24 条评论

评论当前被关闭。