Go 爬取 51job 总结

51job 是几个静态页面,看起来爬取是没有什么难度的,但是没想到在解析页面的时候栽到沟里去了。因为JD页面是由HR定义的,后台编辑页面肯定是可以定义格式的,这就导致最后生成的JD html 不只是一种样式。

这就是目前遇到的BUG了。真实世界的情况是非常复杂的,写代码总结这种现象的规律,然后用代码把规律表达出来。总结规律的起点一定是做假设的。这些假设有的时候会证明是漏洞百出的,所以为了让代码更加健壮,必须对代码中的假设加以检验。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 176,161评论 25 709
  • 这一天,我开始仰望星空发现,星并不远,梦并不远,只要你踮起脚尖……——题记 2000年,他出生在马来西亚;2007...
    采梦女阅读 4,082评论 0 1
  • 又是一年年末,想着用些许文字总结归纳这一年。纠结又纠结,终究在深夜忍不住写下这些杂乱无序的句子。 一天一天,一年一...
    idoge阅读 1,472评论 0 0
  • 人生不如意之事十之八九,愿明天是个晴天,smile at life。
    天空之城有点蓝阅读 1,504评论 2 0

友情链接更多精彩内容