N元语法 最大似然估计 缺陷: 参数空间过大条件概率P(wn|w1,w2,…wn-1)无法估算 数据稀疏严重很多语料库中未出现的词组组合,得到的...
什么是Slot Filling? Slot Filling是自然语言理解中的一个基本问题,是对语言含义的简单化处理,它的思想类似于语言学中框架主...
原文链接:在这里 最近在对照着nltk.book学习NLTK库,虽然网络上有中文翻译版,但是似乎并没有搭配Python3的译本,所以还是想按照自...
引 应用语言学的期末Pre花了差不多一个月零零碎碎的时间完成了。最初的打算爬取网易、新浪、腾讯的国内新闻,再通过提取关键词,比较这三个网站社会新...
新闻爬虫1.1 抓取新闻内页 材料:Pycharm,Chrome开发人员工具,infoLite插件,bs4,request 在前面我们已经将新闻...
2017年第四周是 2017.1.30-2017.2.5本周的关键词是自荐信、家庭长谈、Tower轻量化学生工作指南、一个拖延以及两个种草。 自...
2017年第四周是 2017.1.23-2017.1.29本周的关键词是 爬虫、聚会和春节 爬虫 1月23日还未返乡,所以在家里学习了爬虫,跟着...
2017年第二周是2017.1.16-2017.1.22本周的关键词 爬虫、科目三和电影 爬虫 本来打算接着上次的看下去,但是还是决定先踏实地回...
新闻爬虫1.0 在列表页获取列表和时间 材料:Pycharm,Chrome开发人员工具,infoLite插件,bs4,request 安装包 使...