py爬虫一些零碎知识随走随记【未完,待续】

爬虫对于我这渣渣小白来说,是很漫长很漫长的,本篇主要记录一些容易遗漏的小点

【正则】: *.? 和 re.S

正则匹配

  • (*.?) 这三个标识符的组合标识匹配一切字符,皆可以用于过滤无用字符,又可以当做有用字符的提取
  • re.S (全拼:DOTALL): 点任意匹配模式,改变'.'的行为,说通俗点,这个放在正则匹配的后边,在爬取HTML的时候可以匹配到换行符,目前我就知道这点,后续更新
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容