感觉自己抓太慢,还是找了师弟帮忙,弄几个小朋友帮忙一起做!
生产了大约150个人的数据了!
发现微博抓取有这样的特征:
1.女性居多
2.要么没有照片,要么很多照片
3.花猫脸作为照片修饰非常常见
4.车模出现在大多数男性用户相册里
另外,购买了百度云盘VIP账号,用来向客户交付数据。
客户给我一个反馈:同一个人照片越多越好!
我还担心客户只要30张,这下利润点出来了!
修改爬虫很头痛!烦死我了!
感觉自己抓太慢,还是找了师弟帮忙,弄几个小朋友帮忙一起做!
生产了大约150个人的数据了!
发现微博抓取有这样的特征:
1.女性居多
2.要么没有照片,要么很多照片
3.花猫脸作为照片修饰非常常见
4.车模出现在大多数男性用户相册里
另外,购买了百度云盘VIP账号,用来向客户交付数据。
客户给我一个反馈:同一个人照片越多越好!
我还担心客户只要30张,这下利润点出来了!
修改爬虫很头痛!烦死我了!