资讯

Project Oxford 说话者识别和视频 API 上线公开预览

2015 年 12 月 15 日, 11:19 上午 · Picturepan2

微软上个月宣布的 Project Oxford 新 API 已经开始上线公开预览，包括说话者识别和视频 API，以及自定义识别智能服务，都是微软 Project Oxford 人工智能功能的一部分。

其中：

说话者识别 API 提供了语音验证、说话者识别功能，前者可以用于身份验证，后者可以在一群说话者中识别说话个体
视频 API 通过微软视频处理算法，能够脸部追踪、动作检测、视频稳定，主要来自 Microsoft Hyperlapse 技术
自定义识别智能服务，适合在吵杂的环境，或者不标准语音的识别（比如非母语带严重口音的）

微软也提供了说话者识别 API 的一部分技术细节，感兴趣的同学可以直接跳转过去了解。（via Microsoft）

直达：微软中国官方商城 - 购买 Surface、Xbox 和配件促销

AI API Developer Hyperlapse Microsoft Research Project Oxford Speech

2 条评论

若柳

终于看完了~~~

2015 年 12 月 16 日 2:55 下午回复
cathy

芯片？这个功能怎样运行的好奇？

2021 年 02 月 15 日 4:20 上午回复

发表评论