抓数据时一定要记得在最后缀上个extract()[0];如图
如果不写extract(),爬到的数据是这样的:
写了之后是这样的:
此时发现好像是乱码,其实是Unicode编码过的;原文是汉语,如果想看原文的话,后面必须缀上[0],即extrate()[0]
存储中文到文件时可能会出现编码导致的乱码问题,此时import io 然后以utf8的方式打开文件就可以了;比如
io.open(filename,"w",encoding="utf8")
抓数据时一定要记得在最后缀上个extract()[0];如图
如果不写extract(),爬到的数据是这样的:
写了之后是这样的:
此时发现好像是乱码,其实是Unicode编码过的;原文是汉语,如果想看原文的话,后面必须缀上[0],即extrate()[0]
存储中文到文件时可能会出现编码导致的乱码问题,此时import io 然后以utf8的方式打开文件就可以了;比如
io.open(filename,"w",encoding="utf8")