目录
练习1
1.导入必要的库
2.从如下地址导入数据集
3.将数据集存入一个名为chipo的数据框内
4.查看前10行内容
6.数据集有多少列
7.打印出全部列名字
8.数据集的索引是怎样的
9.被下单数最多商品(item)是什么?(*)
10. 在item_name这一列中,一共有多少种商品被下单?
11.在choice_description中,下单次数最多的商品是什么?
12.一共有多少商品被下单
13.将item_price转换为浮点数(*)
14.在该数据集对应的时期内,收入(revenue)是多少
15.在该数据集对应的时期内,一共有多少订单?
16.每一单(order)对应的平均总价是多少?
17.一共偶多少种不同的商品被售出
练习2
1.导入必要的库;2.从以下地址导入数据集;3.将数据集命名为euro12
4.只选取 Goals 这一列
5.有多少球队参与了2012欧洲杯
6.该数据集中一共有多少列(columns)?
7.将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框
8.对数据框discipline按照先Red Cards再Yellow Cards进行排序(*)
9.计算每个球队拿到的黄牌数的平均值
10.找到进球数Goals超过6的球队数据
11.选取以字母G开头的球队数据(*)
12.找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)(*)
练习3
1.导入必要的库 2.从以下地址导入数据3.将数据框命名为drinks
4. 哪个大陆(continent)平均消耗的啤酒(beer)更多?
5.打印出每个大陆(continent)的红酒消耗(wine_servings)的描述性统计值
6.打印出每个大陆每种酒类别的消耗平均值
7.打印出每个大陆每种酒类别的消耗中位数
8.打印出每个大陆对spirit饮品消耗的平均值,最大值和最小值(*)
练习4
1. 导入必要的库;2.从以下地址导入数据集 3.将数据框命名为crime
4.每一列(column)的数据类型是什么样的?
5.将Year的数据类型转换为 datetime64(*)
6.将列Year设置为数据框的索引
7. 删除名为Total的列
8.按照Year对数据框进行分组并求和 (跟原答案不一样,再研究)
9.何时是美国历史上生存最危险的年代?
idemax不能对日期型格式序列运营,改成int