失信人抓取实践

失信人,也就是俗称的老赖,会认为是高风险或者低信用的用户,在很多业务场景下需要做好监控或行为限制。比如失信人卖货,捐款跑路的风险比普通人高,又比如失信人分期付款,可以怀疑不能按时还款的风险很高。

如何或者失信人信息呢,有这么几个途径

中国执行信息公开网

这是政府公开的数据,可以根据姓名、证件号查询,不过网址底部有声明,不得用于商业用途,也不得复制和传播。通过浏览器的debug模式,很容易拿到查询接口的http请求,但是这个http有失效机制,几分钟后就不能正确返回结果。

百度

在百度搜索“失信人”,搜索结果会显示可分页的失信人列表,也可以根据姓名和证件号精准查询。同样可以通过浏览器debug模式拿到接口的http请求。这里做了两种尝试

  • 全量抓取:可以逐页抓取,可以翻页到几千几万。刚开始有点小激动,以为全部都能抓到,后来才发现都是重复的,去重后只有几百个,没有应用价值。

  • 精准查询:传入姓名和证件号,可以很快查询到相关失信记录。尝试了多次且快速查询,查询仍然有效,没有封禁。

image.png

三方系统

在阿里云市场,可以找到很多提供失信人查询的三方接口,价格都不便宜,都是按次收费。咨询了几个卖家,都不提供批量导出的功能。

image.png

结论

最终结合我们的使用场景,我们考虑使用百度的精准查询,按需调用接口。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容