9

机器翻译之进化,微软推出 Microsoft Translator Hub

机器翻译之进化,微软推出 Microsoft Translator Hub

如今微软机器翻译 Microsoft Translator 也已经可以像人类那样习得新的语言或术语。该部门的产品战略及市场总监 Vikram Dendi 宣布了新的 Microsoft Translator Hub – 它的出现或许能让我们对“经常使用,但又不完全相信”的机器翻译改观。

这款由 Azure 驱动的 Translator Hub 平台,使得人们(还包括企业、开发者、合作伙伴)不仅能翻译文字,更重要的是能够构建、训练独特的机器翻译系统,甚至是保护濒临灭绝的语种,比如从 11 年底开始的苗族语言项目 – 利用群体智慧来改善机器自动习得的翻译,并为更多人所用。

根据官方的信息,构建这一平台得追溯到 2010 年的海地地震:灾难发生之后,救援人员意识到他们有另外一项重大障碍,就是语言,当时没有一款机器翻译支持海地当地的语言。微软机器翻译团队在 5 天的不眠工作之后,率先推出了海地克里奥尔语的互译服务。他们认为,不应该等地震发生了才去支持小语种,应该有所改变 – 这促成了 Translator Hub 的出现。

关于 Translator Hub 的运作模式,可参考来自微软研究院更为技术化的资料,Translator Hub 的模式主要分为 4 阶段:

  • 建立项目,准备一系列关联文档,通常是一对对文档,相同内容的两种语言版本
  • 增加数据,尽可能多地提供完善的关联文档,Translator Hub 便可根据这些文档来分析语法、单词等
  • 创建模型,审核者可对系统自动习得的翻译进行纠错,进一步完善机器翻译,直到质量达标
  • 上线,一旦部署,该项目就能通过 Translator 常规的接口进行调用

这里还有一张微软研究院提供的 Translator Hub 架构图:

机器翻译之进化,微软推出 Microsoft Translator Hub

Microsoft Translator 现在每天正处理着数十亿单词的翻译,它的技术驱动着:Bing Translator、IE、Lync、Windows PhoneFacebook、Twitter 和近期 Yahoo! Babel Fish 等,可以算是微软又一项牛逼而又低调的技术,创新?从来都不是挂在嘴边的。(via Microsoft

9 条评论

发表评论

您正在使用 IE 6 浏览器访问本博客。简单几步,您就可以升级:Internet Explorer

X