微软上个月宣布的 Project Oxford 新 API 已经开始上线公开预览,包括说话者识别和视频 API,以及自定义识别智能服务,都是微软 Project Oxford 人工智能功能的一部分。
其中:
- 说话者识别 API 提供了语音验证、说话者识别功能,前者可以用于身份验证,后者可以在一群说话者中识别说话个体
- 视频 API 通过微软视频处理算法,能够脸部追踪、动作检测、视频稳定,主要来自 Microsoft Hyperlapse 技术
- 自定义识别智能服务,适合在吵杂的环境,或者不标准语音的识别(比如非母语带严重口音的)
微软也提供了说话者识别 API 的一部分技术细节,感兴趣的同学可以直接跳转过去了解。(via Microsoft)
2 条评论
若柳
终于看完了~~~
2015 年 12 月 16 日 2:55 下午
cathy
芯片?这个功能怎样运行的好奇?
2021 年 02 月 15 日 4:20 上午
评论当前被关闭。