1.原报错代码
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('/Users/yangjitang/Downloads/地市级党委书记数据库(2000-10)2.csv',encoding='gbk')
print(data)
报错:
UnicodeDecodeError: 'gbk' codec can't decode byte 0x81 in position 20: incomplete multibyte sequence
更正:
# _*_ coding:utf-8 _*_
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('/Users/yangjitang/Downloads/地市级党委书记数据库(2000-10)2.csv',encoding='UTF-8')
print(data)
原因:
- 后面处理数据时没有转码,指定编码方式为
UTF-8
- 第一行没有编码设置(不是这个原因,第一行没有也可以)
GBK是中国标准,只在中国使用,并没有表示大多数其它国家的编码;而各国又陆续推出各自的编码标准,互不兼容,非常不利于全球化发展。于是后来国际组织发行了一个全球统一编码表,把全球各国文字都统一在一个编码标准里,名为Unicode。
2.原报错代码:
# _*_ coding:utf-8 _*_
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('/Users/yangjitang/Downloads/地市级党委书记数据库(2000-10)2.csv',encoding='UTF-8)
print(data)
报错提示:
SyntaxError: EOL while scanning string literal
EOL:End of Life 寿命终止
更正:注意encoding='UTF-8 '
3.大概流程:
- 将Excel表格另存,格式转化为csv格式
-
编写代码,加载数据
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('/Users/yangjitang/Downloads/地市级党委书记数据库(2000-10)2.csv',encoding='UTF-8')
print(data)
- 查看数据,分析处理
4.拼写报错:
AttributeError: Unknown property tick_lable
正确:tick_label
,label标签
5.报错
TypeError: 'list' object is not callable
--https://www.cnblogs.com/cnhkzyy/p/8833720.html
练习中:但如果不知道哪里定义的:
del list
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \U.
原因:https://www.cnblogs.com/hfdkd/p/7902530.html
或者将:路径由: C:\Users\中\Desktop\深圳罗湖二手房信息.csv
改为
C:/Users/中/Desktop/深圳罗湖二手房信息.csv'
也可。