1.用pandas进行 one-hot编码,pd.get_dummies()
2、Pandas 提供了一些选择的方法,这些选择的方法可以把数据切片,也可以把数据切块。下面我们简单介绍一下:
查看一列的一些基本统计信息:data.columnname.describe()
选择一列:data['columnname']
选择一列的前几行数据:data['columnsname'][:n]
选择多列:data[['column1','column2']]
Where 条件过滤:data[data['columnname'] >condition]
3、python 常见的数据结构之间的转换:
list <--> np.array : np.array(a) a.tolist()
list <--> pd.series series = pd.Series(list) list = series.tolist()
list <--> DataFrame dataframe = pd.DataFrame(list) list = dataframe.values.tolist()
dict --> list list= dict.values() list* = dict.keys()
dict <--> Series series = pd.Series(dict) dict = series.to_dict()
dict <--> DataFrame dataframe = pd.DataFrame(dict) dict = dataframe.to_dict()
np.array <--> Series series = pd.Series(np.array) np.array = series.values
np.array <--> dataframe dataframe= pd.Dataframe(np.array) np.array = dataframe.values
Series <--> DataFrame dataframe =pd.Dataframe(series) series = dataframe[0]