登录注册写文章

Python 随机抽样

正在充电Loading

Python 随机抽样

# -*- coding: utf-8 -*-

import numpy

import pandas

data = pandas.read_csv(

'D:\\PDA\\4.9\\data.csv'

)

#设置随机种子

numpy.random.seed(seed=2)

#按照个数抽样

data.sample(n=10)

#按照百分比抽样

data.sample(frac=0.02)

#是否可放回抽样，

#replace=True，可放回,

#replace=False，不可放回

data.sample(n=10, replace=True)

#典型抽样，分层抽样

gbr = data.groupby("class")

gbr.groups

typicalNDict = {

1: 2,

2: 4,

3: 6

}#定义一个字典，从一班级中抽取2个人，二班级中抽取4个人，三班级中抽取6个人

def typicalSampling(group, typicalNDict):

name = group.name

n = typicalNDict[name]

return group.sample(n=n)

result = data.groupby(

'class', group_keys=False

).apply(typicalSampling, typicalNDict)#向量化运算的函数apply

typicalFracDict = {

1: 0.2,

2: 0.4,

3: 0.6

}#定义字典，按照百分比抽样

def typicalSampling(group, typicalFracDict):

name = group.name

frac = typicalFracDict[name]

return group.sample(frac=frac)

result = data.groupby(

'class', group_keys=False

).apply(typicalSampling, typicalFracDict)

id class score

39 40 1 45

4 5 1 63

53 54 1 95

25 26 1 64

37 38 1 107

70 71 1 75

85 86 2 77

81 82 2 63

54 55 2 121

68 69 2 56

13 14 2 69

86 87 2 93

57 58 2 82

84 85 2 85

94 95 2 103

96 97 2 108

35 36 2 101

89 90 2 86

45 46 2 95

80 81 2 81

20 21 2 138

65 66 3 83

83 84 3 52

34 35 3 66

6 7 3 87

77 78 3 77

82 83 3 54

55 56 3 126

17 18 3 58

67 68 3 93

10 11 3 89

26 27 3 64

61 62 3 103

88 89 3 89

69 70 3 96

0 1 3 77

90 91 3 91

91 92 3 59

48 49 3 98

7 8 3 48

52 53 3 62

最后编辑于：2017.12.10 04:28:27

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Android Studio插件推荐(PreIOC,GsonFormat)
好的插件能加快项目的开发速度，尤其是一些针对重复性的代码的插件，所以在这里向大家推荐2款不错的插件，如果以后发现新...
Raye阅读 5,066评论 2赞 11
王佩写作私密群招募（第二期在招）｜来聊聊“好中文的样子”
文／南方有路在2016年的最后一天，王佩在简书上发表文章《看哪，好中文的样子！》，正式开始他的日更计划。王佩自...
王佩阅读 31,757评论 195赞 245

热土还是沼泽？向左还是向右？
肖然和韩灵，九十年代初大学毕业走向社会的学生情侣。对我而言，韩灵就像是在大学宿舍里上铺的姐妹，熟悉亲切，每晚熄灯后...
朴朴浅影阅读 1,683评论 0赞 4
总有一段时光天真而笨拙
今天听舍友无意间提起来宿舍时选床的场景，我不禁想到老爸把我从家送到这里，坐了20多个小时的火车，跨了好几个省市，来...
寻安宁阅读 3,247评论 4赞 8

5赞6赞

赞赏

手机看全文