IP属地:广东
1.现有的分词工具包 由于中文文本词与词之间没有像英文那样有空格分隔,因此很多时候中文文本操作都涉及切词,因此我上网整理了一些中文分词工具。这些...
(代码文件链接见第六点) 1.实验目的 本次实验是为了掌握scrapy爬取层级网站信息的技巧。 2.实验要求 使用scrapy爬取Curlie网...
Scrapy爬虫 1.新建爬虫工程 scrapy startproject Spider(项目名字) 2.创建爬虫模块 在Spider文件夹中创...
《新数字秩序的革命》读书笔记 戴维·温伯格将世界的秩序分为三个层次。第一层次是事物本身,第二层次是关于信息的信息,也就是元信息,第三个层次是被彻...
大众点评页面结构分析 本次我选择的垂直搜索App是大众点评。搜索页面分析包括大众点评首页和搜索结果页的分析。 大众点评的首页包含的元素有用户当前...