微软首席研究官 Rick Rashid 博士在天津举办的“21 世纪的计算 – 自然而然”会议上展示了他们实时语音机器翻译(属于 自然用户界面 NUI 的一部分)最新进展,相比之前的方法,新语音识别方法的错误率下降了 30%,7、8 个单词中仅有 1 例错误。Rashid 提到,”大约在两年前,微软研究院和多伦多大学的研究员取得了重要突破。通过一种被称为深度神经网络(Deep Neural Networks)的技术来实现个体差别、更好的语音识别。”
在 Rick Rashid 的演示中,他展示了整套系统如何在演讲的同时,识别并呈现出英文字幕,实时翻译成其他语言 – 演示的是简体中文,翻译并重组语句来实现同声传译。更惊人的是,几乎同步的语音朗读已经可以根据预录的约 1 小时的原英文朗读数据来生成相似语音语调的普通话。
下面就是 Rick Rashid 的演示,亮点从 7 分 30 秒开始,现场的翻译准确率极高,基本流畅:
事实上在今年 3 月 TechFest 2012 主旨演讲上,微软研究院已经演示过该技术,支持 26 种语言互译。或许你还记得微软未来愿景 2019 和新未来愿景?
24 条评论
clske
尽快投入应用吧
2012 年 11 月 10 日 12:55 下午
zhongda959
写的太好了,学习学习!
2012 年 11 月 10 日 2:41 下午
一堵墙
技术越来越进步了
2012 年 11 月 10 日 3:05 下午
humul
非常棒的应用
2012 年 11 月 10 日 5:09 下午
humul
错了,非常棒的技术
2012 年 11 月 10 日 5:09 下午
leetom
“数年后,我们希望能够打破人们之间的语言障碍”,神了!
2012 年 11 月 10 日 5:31 下午
左手饭特稀
专利一定要先伸请呀……
2012 年 11 月 10 日 5:52 下午
TurnRight W.
细致对比Microsoft、Google、Apple。我有一个比较形象的比喻Apple 研究的是如何把消费者钱包变成自己的Google 研究的是如何让自己变成钱包Microsoft 研究的是如何让钱包装下更多的钱
2012 年 11 月 10 日 10:55 下午
wingice
微软的实验室中有过很多领先的技术和概念产品,但是其中很少的被整合成为正式的产品推入市场。
2012 年 11 月 11 日 6:13 上午
Allen
苹果:只能我赚钱微软:大家一起赚钱谷歌:我帮大家赚钱
2012 年 11 月 11 日 4:32 下午
Allen
这个不怕,水果就是想抢,也没东西拿出来啊。
2012 年 11 月 11 日 4:47 下午
uglyss
希望能提供api啊...
2012 年 11 月 12 日 8:18 上午
Paul
希望这在以后,能够改变人们学外语的观念
2012 年 11 月 12 日 8:21 上午
Picturepan2
产品化的问题。微软研究院大部分项目定位的是未来 10 年的产品。
2012 年 11 月 12 日 11:00 上午
左手饭特稀
说真的,不知道为什么,总感觉微软对于产品总是欠缺点什么……总感觉做事总是慢半拍的样子……
2012 年 11 月 12 日 11:24 上午
wingice
平板最早是微软推出的,但结果不好。平板直到苹果ipad后才有大发展。微软产品不是慢半拍就是太超前。
2012 年 11 月 12 日 4:37 下午
dd
这肯定是事先排练好的 经不起实际考验
2013 年 01 月 27 日 10:55 下午
416193694
站在使用者的角度看,实在没什么创新,一个speech sdk+几个发声engine,加一套他们的语料库及翻译算法(站在使用者角度,他们这块做的的确不好),就可以发这个presentation了
2013 年 04 月 29 日 6:19 下午
评论当前被关闭。