练习2-数据过滤与排序
探索2012欧洲杯数据
步骤1 - 导入必要的库
运行以下代码
import pandas as pd
步骤2 - 从以下地址导入数据集
运行以下代码
path2 = "D:/hailong/hailong_download/pandas_exercise/exercise_data/Euro2012_stats.csv" # Euro2012_stats.csv
步骤3 - 将数据集命名为euro12
运行以下代码
euro12 = pd.read_csv(path2)
euro12
输出结果
步骤4 只选取 Goals 这一列
运行以下代码
euro12.Goals
输出结果
步骤5 有多少球队参与了2012欧洲杯?
运行以下代码
euro12.shape[0]
输出结果:16
步骤6 该数据集中一共有多少列(columns)?
运行以下代码
euro12.info()
输出结果
步骤7 将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框
运行以下代码
discipline = euro12[['Team','Yellow Cards','Red Cards']]
discipline
输出结果
步骤8 对数据框discipline按照先Red Cards再Yellow Cards进行排序
运行以下代码
discipline.sort_values(['Red Cards','Yellow Cards'],ascending = False)
输出结果
步骤9 计算每个球队拿到的黄牌数的平均值
运行以下代码
round(discipline['Yellow Cards'].mean())
输出结果:7
步骤10 找到进球数Goals超过6的球队数据
运行以下代码
euro12[euro12.Goals > 6]
输出结果
步骤11 选取以字母G开头的球队数据
运行以下代码
euro12[euro12.Team.str.startswith('G')]
输出结果
步骤12 选取前7列
运行以下代码
euro12.iloc[:,0:7]
输出结果
步骤13 选取除了最后3列之外的全部列
运行以下代码
euro12.iloc[:,:-3]
输出结果
步骤14 找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)
运行以下代码
euro12.loc[euro12.Team.isin(['England','Italy','Russia']),['Team','Shooting Accuracy']]
输出结果