爬虫对于我这渣渣小白来说,是很漫长很漫长的,本篇主要记录一些容易遗漏的小点
【正则】: *.? 和 re.S
正则匹配
- (*.?) 这三个标识符的组合标识匹配一切字符,皆可以用于过滤无用字符,又可以当做有用字符的提取
- re.S (全拼:DOTALL): 点任意匹配模式,改变'.'的行为,说通俗点,这个放在正则匹配的后边,在爬取HTML的时候可以匹配到换行符,目前我就知道这点,后续更新
爬虫对于我这渣渣小白来说,是很漫长很漫长的,本篇主要记录一些容易遗漏的小点
【正则】: *.? 和 re.S