技术新闻记录

2018
6.8
阿里巴巴达摩院机器智能实验室语音识别团队,推出开源语音识别模型——DFSMN(深层前馈序列记忆神经网络),开源patch file和部分demo。该模型将全球语音识别准确率纪录提升至96.04%(基于世界最大的免费语音识别数据库LibriSpeech)。研究人员进一步将深层前馈序列记忆神经网络和低帧率(LFR)技术相结合,构建LFR-DFSMN语音识别声学模型。比基于长短时记忆单元的双向循环神经网络(BLSTM)有显著的性能提升。
Kaldi是一个非常强大的语音识别工具库。
DFSMN run base Kaldi run base Python3

6.14
自然语言生成(NLG)
自然语言生成是研究使计算机具有人一样的表达和写作的功能。即能够根据一些关键信息及其在机器内部的表达形式,经过一个规划过程,来自动生成一段高质量的自然语言文本。

自然语言处理包括自然语言理解和自然语言生成。自然语言生成是人工智能和计算语言学的分支,相应的语言生成系统是基于语言信息处理的计算机模型,其工作过程与自然语言分析相反,是从抽象的概念层次开始,通过选择并执行一定的语义和语法规则来生成文本。

但在英国,人工智能的工作不是回答问题,而是根据数据来编写新闻报道。这个项目被称为RADAR(记者、数据和机器人)并依赖政府、地方当局和公共服务来公开数据集。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容