零零散散

正则表达式##

py的正则表达式只能通过字符串来表示,配合re模块使用。由于有转义字符的存在,为了简便,一般都会附加r

  import re
  email = "opteacher@hotmail.com"
  print re.match(r"^\w+@(hotmail|126|163|qq|gmail).(com|cn)(.cn)?$", email)
  phone = "13918459376"
  print re.match(r"^1[3|5|7|8]\d{9}$", phone)
  idCard = "310114199101191314"
  print re.match(r"(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)", idCard)

当然,re也有匹配分离和提取的功能,通过re.split和match.group(n)来实现

实用模块##

collections
集合类工具模块

  • namedtuple:以tuple为基础定义一个类,并未其中的各个分量指定key名
  from collections import namedtuple
  Point = namedtuple("Point", ["x", "y"])
  p = Point(1, 2)

不过tuple不能改变值,算是个遗憾,不过真正做起来,namedtuple也是不够用的

  • deque:链表(不过为何没有中间插入?)
  from collections import deque
  q = deque([0, 1, 2, 3, 4, 5, 6])
  q.append(7)
  print q
  q.pop()
  print q
  q.appendleft(-1)
  print q
  q.popleft()
  print q
  • defaultdict:带默认值的KV表,当访问不存在的key是返回默认值
  from collections import defaultdict
  d = defaultdict(lambda: "")
  d["id"] = 5
  d["name"] = "op"
  print d["sex"]
  #  打印空字符串
  • OrderedDict:排过序的dict,按定义的顺序遍历
  from collections import OrderedDict
  d = OrderedDict([("z", 12), ("y", 55), ("")])
  • Counter:统计字符出现的个数
  from collections import Counter
  cc = Counter()
  for c in "i am a Chinese":
    cc[c] += 1
  print c

base64

Base64编码过程

对二进制数据,以每次取三个字节数据的规则,依次取数据。这样一次获取的数据是38=24bit,再把它分为四组24=46bit,由此得出四个索引(所以字符索引表的最大长度的2^6),根据索引得到对应的字符替换真数据中的字符。所得出的字符串就是Base64编码之后的字符串了。
hashlib
提供哈希加密,MD5、SHA1等。使用和JS无异
itertools
提供操作迭代对象的函数

  • count(n):生成n~无限的自然数列
  for i in itertools.count(1):  #  1 2 3 ..... 
  • cycle([n1, n2, ...]):循环迭代给出的序列
  for i in itertools.cycle([1, 2, 3]):  #  1 2 3 1 2 3 1 ...
  • repeat(n, [max]):循环迭代指定的参数(1),可以通过指定第二个参数控制其迭代的次数
  for i in itertools.repeat(1, 5):  #  1 1 1 1 1
  • chain(a1, a2, ...):相当于Array.concat()
  for i in itertools.chain([1, 2, 3], [4, 5, 6]):  #  1 2 3 4 5 6
  • groupby(n):将序列中相同的项提取出来,迭代的周期返回这个项和项出现的次数(序列)
  for ket, group in itertools.groupby("AAABBBCCCCCCDDEE"):
    print key, list(group)vv
  • imap():可以用来处理无限序列的map版本
  • ifilter():可以用来处理无限序列的filter版本

如果用map和filter处理无限序列,会无输出报错

XML
跟一般的XML库一样,分两种解析方式:DOM和SAX,DOM占用的内存消耗大,但一旦解析完成便可以随意操作;SAX的快速解析,遇到什么就输出什么,用事件驱动
HTMLParser
用于解析HTML的接口类,用回调的方式处理遇到的TAG,而且语法没有XML那么严格。编写爬虫会用到

  from HTMLParser import HTMLParser
  class MyWebPageParser(HTMLParser):
    def handle_starttag(self, tag, attrs):
      #  处理TAG头
    def handle_starttag(self, tag):
      #  处理TAG尾
    def handle_startendtag(self, tag, attrs):
      #  处理单TAG
    def handle_data(self, data):
      #  处理内容
    def handle_comment(self, comment):
      #  处理注释
    def handle_entityref(self, name):
      #  处理引用(估计是<meta ref="...“ ...)
    def handle_charref(self, name):
      #  处理字符集

  myHP = MyWebPageParser()
  myHp.feed("HTML代码")

PIL(Pillow)##

py的图片处理模块,最新根据官网的文档,通过pip安装Pillow(不再是简写PIL),用from PIL import XXX引入(不再是import Image)

  $ pip install Pillow
  from PIL import Image
  img = Image.open("media/test.jpg")

安装和使用参照:https://pillow.readthedocs.io/en/latest/installation.html
详细参照官方文档:http://effbot.org/imagingbook/

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,753评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,668评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,090评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,010评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,054评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,806评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,484评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,380评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,873评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,021评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,158评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,838评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,499评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,044评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,159评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,449评论 3 374
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,136评论 2 356

推荐阅读更多精彩内容

  • 今天是大家坐在教室里上课的最后一天了,时光打马而过,高考在即,麦冬说,时间流淌过日月星辰,流淌过山洋海河,流淌过亿...
    Good里与玉溪生阅读 249评论 0 0
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,648评论 18 399
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,673评论 18 139
  • 一. Java基础部分.................................................
    wy_sure阅读 3,811评论 0 11
  • 经过几天的整理工作,今天准备对衣柜动手勒,先来一个衣柜的整体照片 家里是十年前的装修,衣柜是固定在外墙上的,衣柜长...
    轩莉多彩阅读 186评论 0 0