24

微软研究院 NUI 新进展:实时语音机器翻译

微软研究院 NUI 新进展:实时语音机器翻译

微软首席研究官 Rick Rashid 博士在天津举办的“21 世纪的计算 – 自然而然”会议上展示了他们实时语音机器翻译(属于 自然用户界面 NUI 的一部分)最新进展,相比之前的方法,新语音识别方法的错误率下降了 30%,7、8 个单词中仅有 1 例错误。Rashid 提到,”大约在两年前,微软研究院和多伦多大学的研究员取得了重要突破。通过一种被称为深度神经网络(Deep Neural Networks)的技术来实现个体差别、更好的语音识别。”

Rick Rashid 的演示中,他展示了整套系统如何在演讲的同时,识别并呈现出英文字幕,实时翻译成其他语言 – 演示的是简体中文,翻译并重组语句来实现同声传译。更惊人的是,几乎同步的语音朗读已经可以根据预录的约 1 小时的原英文朗读数据来生成相似语音语调的普通话。

下面就是 Rick Rashid 的演示,亮点从 7 分 30 秒开始,现场的翻译准确率极高,基本流畅:

事实上在今年 3 月 TechFest 2012 主旨演讲上,微软研究院已经演示过该技术,支持 26 种语言互译。或许你还记得微软未来愿景 2019新未来愿景

24 条评论

发表评论

您正在使用 IE 6 浏览器访问本博客。简单几步,您就可以升级:Internet Explorer

X