问题:什么是微软的Cognitive Services?
Cognitive Services可以理解为微软为AI开发者提供的配套工具和接口包,涉及了语音语义、垂类知识、网页检索、图像和视频处理及地址处理的能力。
这些Service简化bot的创建成本、扩充bot的能力范围。
能力列表如下:
- Language understanding
- Language Understanding Intelligent Service (LUIS)
- Text Analytics API:检测文本中情感、关键词、主题
- Bing Spell Check API:语法检测
- Linguistic Analysis API:文本拆分,词性标注
- Web Language Model (WebLM) API :字频分析和输入预测
- Knowledge extraction
- Entity Linking Intelligence Service:根据上下文标识文本的含义
- Recommendations API:基于数据提供个性化推荐
- Knowledge Exploration Service:搜索预测
- Academic Knowledge API:学术检索API
- QnA Maker:客服问答API
- Speech recognition and conversion:
- Bing Speech API:语音转文本、文本生成语音接口
- Custom Recognition Intelligent Service (CRIS):自建语音识别模型
- Speaker Recognition API:声纹识别
- Web search
- Web Search API:网页、图片、视频、新闻等检索接口
- Image Search API:图片检索接口
- Video Search API:视频检索接口
- News Search API:新闻检索接口
- Autosuggest API:检索关键词预填接口
- Image and video understanding
- Computer Vision API:图片内容识别及ORC
- Emotion API:识别图片中人物表情
- Face API:人脸识别及人脸分组
- Video API:视频面部跟踪、视频缩略图生成的视频相关接口
- Location control
- 地址处理接口,支持地址查找、验证、歧义处理,提供FB Messenger的位置选择对话框和开源代码的可定制对话框
这里体现了Project到Product的思路,将微软在bing等各个项目中的能力解耦出来,独立成开发者可调用的独立能力,不用开发者再造重复的轮子,对MS Bot Framework直接收益是降低了开发门槛,更利于开发者引入。
参考:https://docs.microsoft.com/en-us/bot-framework/cognitive-services-bot-intelligence-overview
系列目录:http://www.jianshu.com/p/efd0d0b90ddf
字典汇总:http://www.jianshu.com/p/6ff2604bbe6b
See you:)