2020-04-01李宏毅深度学习与人类语言处理笔记1(DLHLP2020-note1)-overview

人类语言处理

人类语言很复杂

  • 包括文字和语音
  • 56%的语言没有文字
  • 1s就有16k个样本点,每个点有256个可能的取值
  • 语音和文字很复杂


    课程内容

    这里的model就是deep network。


    硬train一发

    硬train一发之后,focus近3年的进展。

课程内容简介

语音辨识系统(automatic speech recognition, ASR)

语音辨识中的模型

语音中的seq2seq和别的领域中不同。

语音合成(text-to-speech synthesis)

依然存在问题:在真实应用中,会出现问题。(在给单独的词时,google 小姐的破音)

语音分离(speech separation)

鸡尾酒会效应(cocktail party effect)
直接硬train一发就可以获不错的效果。
可以用来做变音器(voice conversion),例如柯南。


问题描述

Input audio, ouput class

  • speaker recognition
  • keyword spotting(e.g., wake up words)


    两类问题

文字生成 (Text generation )

BERT


BERT和他的朋友们

模型越来越大了。

文字生成可能的两种方式

输入输出同时是文字

输入输出同时是文字的应用

文法分析也可以看作文字到文字的应用

这部分内容,课程主要讲QA系统。

其他学习内容

  • Meta learning
    学习如何去学习。


  • 机器学习知识


    image.png
  • adversarial attack


    image.png
  • explainable AI


    image.png

李宏毅课程overview

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容