浅谈入门自然语言处理

大多数人学习一门新技术的做法是:从网上搜索一堆入门文章,收集从初级到高级的书单,下载各种各样的视频,生怕自己错过什么宝贵的资料,直到电脑硬盘都塞满了,就没有然后了。万事总有个开头,学习一门新技术,资料不在多,而在认真看完一本书,坚持看完一部完整的视频。

本文从两点来总结自己在入门自然语言处理的经验:

一:入门需要什么基础

二: 需要学习什么知识

一:入门需要什么基础

这是初学者都比较关注的问题,也是比较重要的问题。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。入门自然语言处理首先需要的基础就是数学基础,包括高等数学、线性代数、概率与数理统计等。另外需要编程基础,不管是什么语言的基础,语言是相通的,是解决问题的工具。如果你有两个基础,你就拥有了开启自然语言处理的大门钥匙了。

二:需要学习什么知识

1、Python基础

2、机器学习

3、深度学习

4、自然语言处理的理论基础

Python基础

如果你有其他编程基础,一个星期就能把Python相关的语法基础学会了,也不用花很多时间去更深入,以后要什么就学什么。另外,关于Python版本问题,建议学习Python3,因为Python2就会停止维护了,还有Python2的编码问题是一个难点,很多初学者都很难搞定这个问题。教程推荐:廖雪峰的Python3教程,书籍推荐:无,任何一本不厚的教程书。

机器学习

在深度学习之前,基于统计的自然语言处理是主流,借助机器学习的方法对自然语言进行处理。深度学习是机器学习的一个分支,在学习深度学习之前,应该学习机器学习,推荐吴恩达的机器学习视频、台大林轩田的机器学习基石视频,两者选一。

书籍推荐李航的《统计学习方法》和周志华的《机器学习》,李航的统计学习方法比较薄,但是口碑却不错,周志华的机器学习这本书有点厚,可以作为参考书进行查阅下。建议是先看视频,然后才看书。在学习机器学习理论的过程中,可以学习下Python的机器学习包sklearn,官网的教程和文档都是很详细的。理论和实践一定结合起来,这样学起来可以更加的深入。

深度学习

深度学习比较常用神经网络是多层感知机、卷积神经网络、循环神经网络。把这三个神经网络的理论搞懂。推荐吴恩达的深度学习视频。然后选择一个深度学习框架进行实践下。深度学习框架比较长用的有Tensorflow、Keras和Pytorch,Tensorflow比较是非常好的框架,但是却是非常的底层,文档乱,调试难,学习成本高,但是是因为谷歌的框架,用的人比较多。Keras官网教程和文档都比较齐全,简单易上手,搭建模型快速,对于科研狗来说是一个不错的选择。Pytorch社区强大,文档也齐全,简洁易懂的代码,快速实现神经网络。建议先入手Keras或者Pytorch,然后在Tensorflow,毕竟现在很多公司都在用Tensorflow,这些框架都不推荐书籍了,直接看官网教程和API和其他人写的网络博客,特别是Tensorflow版本更新比较快,没必要买书

自然语言处理的理论基础

推荐的书籍为宗成庆的《统计自然语言处理》第二版,本书全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。这本书有点厚,可以先粗略阅读下,整本书认真读下来还是要花很多时间的。

等有理论基础的时候,选个简单的方向,如文本分类和情感分析。用深度学习的方法对文本分类和情感分析进行实践,可以在Github上找到很多相关的开源代码。自然语言处理有很多研究方向,可以选一个自己感兴趣的方向进行研究,开始主要看这两年相关方向的综述论文,然后看一些经典的论文和最新论文

总结:认真看完一本书,坚持看完一部完整的视频,学完上面的东西,你就已经完全入门了。学技术是靠积累的,贵在坚持。

更多详细可以关注公众号:自然语言处理与深度学习技术【DeepNLP】

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,544评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,430评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,764评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,193评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,216评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,182评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,063评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,917评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,329评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,543评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,722评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,425评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,019评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,671评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,825评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,729评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,614评论 2 353

推荐阅读更多精彩内容