小编理了那些蕴含价值数据的网站,大致分为以下几类
1、招聘类网站:前程无忧、智联招聘、拉勾等。
国内各大招聘网站,你可以批量爬取岗位数量、薪酬、职责、发布公司等数据。
2、房地产网站:58同城、链家、搜房、安居客、Q房网、房天下
■ 58同城
国内领先分类信息网站,上面有海量的数据都是公开可爬取的。以租房信息为例,可以爬取你想要的小区所有租房信息数据。
■ 链家
上面能爬取所有房源的信息,包括房子照片、价格、面积、户型、朝向、周边、地理位置等,只要网页公开显示的都可以爬取。
其他的房地产网站同样都能爬取到海量数据,在这不一一举例。
3、电商类网站:淘宝、天猫、京东、亚马逊
■ 淘宝、天猫、京东
可以爬取商品信息,包括图片、价格、标题、店铺名、地点、付款人数、库存、人气等数据。
可以爬取商品评分、评价文本、标签及数量、卖家图片、卖家用户名等数据
可以爬取长尾关键词
亚马逊
可以爬取商品信息,包括图片、价格、标题、店铺名、地点、付款人数、库存、ASIN码等数据。
4、自媒体网站:新榜、微博、搜狗微信
新榜
国内权威的新媒体数据平台,上面能爬取到各大公众号的活粉数、最近过10万+的文章,每篇文章的阅读数、好看数等数据。
微博
拥有超过2亿日活的社交平台,可以爬取各类社会、娱乐、文化大热点的评论文本,监控舆情,获取用户反馈。
还能爬取用户头像、标签属性、行业、院校等个人信息,制作广告精准投放人群包。
搜狗微信
可以爬取每个公众号最近发布的10文章内容,输出到你的内容聚合平台。
5、生活类网站:美团、大众点评
可爬取商铺信息、价位、星级、地点等信息。
6、搜索引擎:百度、搜狗
关键词搜索
地图搜索结果
可以爬取地图上的商铺信息,包括名称、价位、地址、图片等。
7、企业名录信息网站:天眼查、企查查
可以爬取到企业注册信息,包括行业、董事长、注册法人、注册资本等。
8、批发采购网站:1688
可以爬取批发商品的信息,包括到企业注册信息,包括行业、董事长、注册法人、注册资本等。
9、招投标网站
可以爬取获取最新的招投标的公告信息。