需求:计算一个城市的行车平均时速和低速时长占比的关系(y:低速时长占比,x:平均时速)
公式 y=k*x^b(k乘x的b次方,markdown好难用啊,怎么写公式)
当时想到的一个方法是用scipy的leastsq方法来拟合出k与b
scipy.optimize.leastsq(func, x0, args=()),这里只介绍leastsq的三个参数,详细各参数的使用方法请参考scipy官网
func:一个函数,用来计算误差的
x0:ndarray。从哪里开始计算最小化
args:tuple, optional。这个参数很好用,把func里需要用到的其他参数都放在这里就可以
主体代码如下,如果涉及到多个城市,可能要分城市获取不同的系数,方法下面也会说到
#!/bin/python
#载入模块
import numpy as np
import string
from scipy.optimize import leastsq
#命名一个函数,计算y
def func(p,x):
k,b = p
return k*np.power(x,b)
def error():
print(s) #只是用来看循环了几次,如果只要运算结果的话,并无实际作用
return func(p,x)-y
def jisuanAB(file_x,file_y):
#获取城市编码,我把城市编码写在文件名上,用“_”连接,获取城市编码时需要再分开
city = file_x.split('_')[0]
output= open('xishu.txt',+a) #写到这个文件里
x = []
fx = open(file_x,'r') #读第一个参数中的文档
for line in fx:
line = line.strip()
lines = line.atof(line)
x.append(lines) #以上代码是为了将文件中的内容转化为list,进而转化为array
fx.close #对于初学者来说,关闭文件很重要,不然一直会占着内存,最终会报错
y =[]
fy = open(file_y,'r')
for line in fy:
line = line.strip()
lines = line.atof()
y.append(lines)
fy,close
#讲x,y转化为ndarry,之后的leastsq主函数中会用到
Xi = np.array((x))
Yi = np.array((y))
P0 = [100,2] #从哪里开始计算最小误差
Para=leastsq(error,p0,args=(Xi,Yi,s)) #使用leastsq计算系数
k,b=Para[0] #Para的输出结果,第0 个索引位就是the solution,详见官网
output.write(city+'\t'+str(k) +'\t' +str(b)+'\n')
print city,k,b
#代码从这里开始,写一个字典,里边存上x和y
if __name__ == '__main__':
file_map = {}
Lista=[1,2,3,4,5,6,7,8,9,10]
for i in Lista:
file_x = str(i) + "_pingjunshisu.txt"
file_y = str(i) + "_zhanbi.txt"
if file_x not in file_map:
file_map[file_x] = file_y
# 运行下面的代码,可生成最后的结果
for file_x in file_map:
jisuanAB(file_x, file_map[file_x])