pandas 十套练习题

目录

练习1


1.导入必要的库


2.从如下地址导入数据集


3.将数据集存入一个名为chipo的数据框内


4.查看前10行内容


6.数据集有多少列


7.打印出全部列名字


8.数据集的索引是怎样的


9.被下单数最多商品(item)是什么?(*)


10. 在item_name这一列中,一共有多少种商品被下单?


11.在choice_description中,下单次数最多的商品是什么?


12.一共有多少商品被下单


13.将item_price转换为浮点数(*)


14.在该数据集对应的时期内,收入(revenue)是多少


15.在该数据集对应的时期内,一共有多少订单?


16.每一单(order)对应的平均总价是多少?


17.一共偶多少种不同的商品被售出


练习2


1.导入必要的库;2.从以下地址导入数据集;3.将数据集命名为euro12


4.只选取 Goals 这一列


5.有多少球队参与了2012欧洲杯


6.该数据集中一共有多少列(columns)?


7.将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框


8.对数据框discipline按照先Red Cards再Yellow Cards进行排序(*)


9.计算每个球队拿到的黄牌数的平均值


10.找到进球数Goals超过6的球队数据


11.选取以字母G开头的球队数据(*)


12.找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)(*)



练习3


1.导入必要的库 2.从以下地址导入数据3.将数据框命名为drinks


4. 哪个大陆(continent)平均消耗的啤酒(beer)更多?


5.打印出每个大陆(continent)的红酒消耗(wine_servings)的描述性统计值


6.打印出每个大陆每种酒类别的消耗平均值


7.打印出每个大陆每种酒类别的消耗中位数


8.打印出每个大陆对spirit饮品消耗的平均值,最大值和最小值(*)


练习4



1. 导入必要的库;2.从以下地址导入数据集 3.将数据框命名为crime


4.每一列(column)的数据类型是什么样的?


5.将Year的数据类型转换为 datetime64(*)


6.将列Year设置为数据框的索引


7. 删除名为Total的列


8.按照Year对数据框进行分组并求和 (跟原答案不一样,再研究)


9.何时是美国历史上生存最危险的年代?

idemax不能对日期型格式序列运营,改成int



练习5


1.导入必要的库;2.按照如下的元数据内容创建数据框3.将上述的数据框分别命名为data1, data2,data3


4.将data1和data2两个数据框按照行的维度进行合并,命名为all_data


5.将data1和data2两个数据框按照列的维度进行合并,命名为all_data_col(这题有点奇葩)


6.打印data3


7.按照subject_id的值对all_data和data3作合并


8.对data1和data2按照subject_id作连接


9.找到 data1 和 data2 合并之后的所有匹配结果


练习6

1. 导入必要的库;2.从以下地址导入数据;3.将数据作存储并且设置前三列为合适的索引


4.2061年?我们真的有这一年的数据?创建一个函数并用它去修复这个bug(*)


5.将日期设为索引,注意数据类型,应该是datetime64[ns](*)


6.对应每一个location,一共有多少数据值缺失(*)


7.对应每一个location,一共有多少完整的数据值(*)


8.对于全体数据,计算风速的平均值(*)


9.创建一个名为loc_stats的数据框去计算并存储每个location的风速最小值,最大值,平均值和标准差(*)


10.创建一个名为day_stats的数据框去计算并存储所有location的风速最小值,


11.对于每一个location,计算一月份的平均风速(*)


12.对于数据记录按照年为频率取样(*)



13.对于数据记录按照月为频率取样


练习7


1.导入必要的库;2.从以下地址导入数据;3.将数据框命名为titanic;4.将PassengerId设置为索引


5.绘制一个展示男女乘客比例的扇形图


6.绘制一个展示船票Fare, 与乘客年龄和性别的散点图


7.有多少人生还?


8.绘制一个展示船票价格的直方图


练习8

1.导入必要的库 2.创建一个数据字典 3.将数据字典存为一个名叫pokemon的数据框中


4.数据框的列排序是字母顺序,请重新修改为name, type, hp, evolution, pokedex这个顺序


5.添加一个列place; 6.查看每个列的数据类型


练习9

1.导入必要的库;2.数据集地址; 3.’读取数据并存为一个名叫apple的数据框;4.查看每一列的数据类型


5.将Date这个列转换为datetime类型(*)


6.将Date设置为索引(*)


7.有重复的日期吗?(*)


8.将index设置为升序(*)


9.找到每个月的最后一个交易日(business day)(*)


10.数据集中最早的日期和最晚的日期相差多少天?(*)


11.在数据中一共有多少个月?(*)


12.按照时间顺序可视化Adj Close值



练习10

1.导入必要的库;2.数据集地址;3.将数据集存成变量iris


4.创建数据框的列名称


5.数据框中有缺失值吗?


6.将列petal_length的第10到19行设置为缺失值


7.将缺失值全部替换为1.0(*)


8.删除列class


9.将数据框前三行设置为缺失值(*)


10.删除有缺失值的行(*)


11.重新设置索引(*)


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。