Project Oxford 说话者识别和视频 API 上线公开预览

microsoft-project-oxford-speaker

微软上个月宣布的 Project Oxford 新 API 已经开始上线公开预览,包括说话者识别和视频 API,以及自定义识别智能服务,都是微软 Project Oxford 人工智能功能的一部分。

其中:

  • 说话者识别 API 提供了语音验证、说话者识别功能,前者可以用于身份验证,后者可以在一群说话者中识别说话个体
  • 视频 API 通过微软视频处理算法,能够脸部追踪、动作检测、视频稳定,主要来自 Microsoft Hyperlapse 技术
  • 自定义识别智能服务,适合在吵杂的环境,或者不标准语音的识别(比如非母语带严重口音的)

微软也提供了说话者识别 API 的一部分技术细节,感兴趣的同学可以直接跳转过去了解。(via Microsoft

直达:微软中国官方商城 - 购买 Surface、Xbox 和配件促销

2 条评论
  • 若柳

    终于看完了~~~

    2015 年 12 月 16 日 2:55 下午 回复

  • cathy

    芯片?这个功能怎样运行的好奇?

    2021 年 02 月 15 日 4:20 上午 回复

发表评论