Python库函数介绍:http://www.runoob.com/python/python-socket.html
python:https://yiyibooks.cn/xx/python_352/library/ssl.html
1.用Python获取数据(抓取网页)
- urllib
- urllib2
- httplib
- httplib2
- 抓取网页
- import urllib
- urilib.request.urlopen()
- f.read(),f.readline(),f.close()
3 . 对象身份比较:
- is ,is not
序列类型转换工厂函数
list(),str(),unicode(),basestring(),tuple()可用内建函数
enumerate(),sorted(),reversed(),len(),max(),sum(),min(),zip()
- enumerate 函数用于遍历序列中的元素以及它们的下标:
for i,j in enumerate(('a','b','c')):
print i,j
0 a
1 b
2 c
6.字符串
- str.istitle()是标题格式吗
列表
list.sort(func=none,key=none,reverse=false) --key=len是按照列表的长度进行排序创建字典:
- dict(info) info=[('wang',3000),('li',2340)]
- aDict={}.fromkeys(('wang','ni'),3000)
工资默认值是3000,fromkeys(key值,默认键值)
- zip()函数:
- zip()是Python的一个内建函数,它接受一系列可迭代的对象作为参数,将对象中对应的元素打包成一个个tuple(元组),然后返回由这些tuples组成的list(列表)。若传入参数的长度不等,则返回list的长度和参数中长度最短的对象相同。利用*号操作符,可以将list unzip(解压)。
- 比如:a = [1,2,3]
b = [4,5,6]
c = [4,5,6,7,8]
zipped = zip(a,b)
[(1, 4), (2, 5), (3, 6)]
zip(a,c)
[(1, 4), (2, 5), (3, 6)]
zip(*zipped)
[(1, 2, 3), (4, 5, 6)]
- 字典的内建函数:
- clear(),get(),items(),iteritems() :Returns an iterator on all items(key/valuepairs)
D.setdefault(k,x):Returns D[k] if k is a key in D; otherwise sets D[k] equal to x and returns x
values(),fromkeys(),keys(),popitem(),update()
- 集合:
- 可变:set,不可变:foneset()
12 .SciPy:
- ndarry(N维数组),Series(变长字典),DataFrame(数据框)
- sum(axis=0或者1或者不写),shape(),reshape(),sin(),where(),fromfunction(函数名,元祖)
- 日期转换:
- from datetime import date
from datetime import datetime
day=date.fromordinal(735190)
y=datetime.strftime(day,'%Y-%m-%d')
- 时间序列:
dates=pandas.date_range('20141001',periods=7)
dates=[2014-10-01,2014-10-02,.....,2014-10-07]
15.分组:
- tempdef.groupby('month').sum().volume- 统计总成交量
16.数据存取
- DataFrame df,df.to_csv(文件名)#存成csv,p.read_csv(文件名),df.to_excel(文件名.xls,sheet_name="")