分析初体验

1.原报错代码

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 

data = pd.read_csv('/Users/yangjitang/Downloads/地市级党委书记数据库(2000-10)2.csv',encoding='gbk')
print(data)

报错:

UnicodeDecodeError: 'gbk' codec can't decode byte 0x81 in position 20: incomplete multibyte sequence

更正:

# _*_ coding:utf-8 _*_
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 

data = pd.read_csv('/Users/yangjitang/Downloads/地市级党委书记数据库(2000-10)2.csv',encoding='UTF-8')
print(data)

原因:

  • 后面处理数据时没有转码,指定编码方式为UTF-8
  • 第一行没有编码设置(不是这个原因,第一行没有也可以)

GBK是中国标准,只在中国使用,并没有表示大多数其它国家的编码;而各国又陆续推出各自的编码标准,互不兼容,非常不利于全球化发展。于是后来国际组织发行了一个全球统一编码表,把全球各国文字都统一在一个编码标准里,名为Unicode。

2.原报错代码:

# _*_ coding:utf-8 _*_
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 

data = pd.read_csv('/Users/yangjitang/Downloads/地市级党委书记数据库(2000-10)2.csv',encoding='UTF-8)
print(data)

报错提示:

SyntaxError: EOL while scanning string literal

EOL:End of Life 寿命终止
更正:注意encoding='UTF-8 '

3.大概流程:

  • 将Excel表格另存,格式转化为csv格式
  • 编写代码,加载数据


    image.png
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 

data = pd.read_csv('/Users/yangjitang/Downloads/地市级党委书记数据库(2000-10)2.csv',encoding='UTF-8')
print(data)
  • 查看数据,分析处理

4.拼写报错:
AttributeError: Unknown property tick_lable
正确:tick_label,label标签

5.报错
TypeError: 'list' object is not callable
--https://www.cnblogs.com/cnhkzyy/p/8833720.html
练习中:但如果不知道哪里定义的:
del list

SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \U.

原因:https://www.cnblogs.com/hfdkd/p/7902530.html
或者将:路径由: C:\Users\中\Desktop\深圳罗湖二手房信息.csv改为
C:/Users/中/Desktop/深圳罗湖二手房信息.csv'也可。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。