一、将时间差转化为秒
def f(x):
x = x.seconds
return x
total['创建任务时长'] = total['任务创建时间'] - total['入库时间']
total['创建任务时长2'] = total['创建任务时长'].apply(f)
1、Dataframe里面,要转换一整列的数值时,使用apply。这种方式可能有点慢,但由于目前处理的数据量在百万以内,等待时间可以接受。
2、x = x.seconds
二、选取某一段时间范围内的样本
total = total.set_index(['入库时间'])
total_high1 = total['2017/8/9 10:00:00':'2017/8/9 11:00:00']
1、将需要选取的时间设为index;
2、使用切片的方式选取子集;
3、需要选取多段时间组合在一起的时候,使用concat将多个子集连接起来。