1.在IO编程中使用open()打开文件操作
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes ...
出现这种问题的原因是打开的文件名,"C:\Users\Eric\Desktop\beeline.txt"
\U被系统默认为八位数的编码形式,因此Users不被识别,正确的写法为
open(r"C:\Users\Eric\Desktop\beeline.txt",enconding= 'utf-8')
在打开文件时很容易写错成文件所在的文件夹名"C:\Users\Eric\Desktop‘’,这时候会出错:PermissionError: [Errno 13] Permission denied:
这种情况只需要把文件名补上就行:"C:\Users\Eric\Desktop\beeline.tx''
2.python 安装Scrapy出错
在安装scrapy之前得安装vc++
由于自己的python版本可能不是最新的,而pip install 默认安装最新的lxml,导致出错:
[Getting “Could not find function xmlCheckVersion in library libxml2. Is libxml2 installed?” when installing lxml through pip]
lxml-3.6.4-cp36-cp36m-win32.whl is not a supported wheel on this platform.
因此可以去http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml下载python版本对应的所需的安装包,放在文件夹内安装
For Python 3.5 seems you need the 'install' command: pip.exe install C:\Users<user>\Downloads\lxml-3.6.4-cp35-cp35m-win_amd64.whl
'gbk' codec can't encode character '\xbb'的解决方法
import io
import sys
import urllib.request
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8') #改变标准输出的默认编码
res=urllib.request.urlopen('http://www.baidu.com')
htmlBytes=res.read()
print(htmlBytes.decode('utf-8'))