Python之12306余票查询

简单的Python学习,用Python完成一个12306余票查询~

Python之12306余票查询

参考资料来自Python 实现火车票查询工具

需要用到的第三方库

  • requests,使用 Python 访问 HTTP 资源的必备库。

  • docopt,Python3 命令行参数解析工具。

  • prettytable, 格式化信息打印工具,能让你像 MySQL 那样打印数据。

效果图

屏幕快照 2018-10-05 下午5.12.19.png

分析12306接口请求

屏幕快照 2018-10-05 下午8.05.36.png

这是一个标准的12306查询余票界面,本次Demo使用的浏览器是Safari,首先打开Safari的开发选项
屏幕快照 2018-10-05 下午8.07.18.png
屏幕快照 2018-10-05 下午8.08.58.png

在网页检查器中我们刷新网页,可以观察到下面这个接口~


屏幕快照 2018-10-05 下午8.10.08.png

单独复制url打开就能发现这就是12306余票数据请求接口,分析一下这个接口的类型是Get,请求参数是

  • leftTicketDTO.train_date: 2018-10-30

  • leftTicketDTO.from_station: BJP

  • leftTicketDTO.to_station: LYF

  • purpose_codes: ADULT

hoho~,万里长征第一步走的还是比较顺利的,下面就用我们的python程序来请求这个接口看看~

Requests请求接口

import requests

url = 'https://kyfw.12306.cn/otn/leftTicket/queryA?leftTicketDTO.train_date=2018-10-30&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=LYF&purpose_codes=ADULT'
r= requests.get(url)
print(r.json())

关于requests库,我刚接触python觉得应该是现在网络交互中必选库吧,上述代码就请求12306的接口并且输出结果为json

{
    "data":{
        "flag":"1",
        "map":{
            "BXP":"北京西",
            "GLF":"关林",
            "LLF":"洛阳龙门",
            "LYF":"洛阳"
        },
        "result":Array[18]
    },
    "httpstatus":200,
    "messages":"",
    "status":true
}

数据结构如上,我们只需要result中的结果就ok,python也可以很方便的解析json这一点我觉得比java舒服一些。

r= requests.get(url)
print(r.json()['data']['result'])

我们现在已经有了数据,接下来则是把我们转换过的结果显示出来,万里长征第二步~

PrettyTable库

PrettyTable 是python中的一个第三方库,可用来生成美观的ASCII格式的表格,十分实用。以下为官方介绍:

A simple Python library for easily displaying tabular data in a visually appealing ASCII table format.PrettyTable is a simple Python library designed to make it quick and easy to represent tabular data in visually appealing ASCII tables. It was inspired by the ASCII tables used in the PostgreSQL shell psql. PrettyTable allows for selection of which columns are to be printed, independent alignment of columns (left or right justified or centred) and printing of “sub-tables” by specifying a row range.

使用方法也是非常简单,先写个小小的Demo

pt = PrettyTable()
pt.field_names=['测试1','测试2','测试3','测试4','测试5']
pt.add_row(['测试结果1','测试结果2', '测试结果3', '测试结果4','测试结果5'])
print(pt)

+-----------+-----------+-----------+-----------+-----------+
|   测试1   |   测试2   |   测试3   |   测试4   |   测试5   |
+-----------+-----------+-----------+-----------+-----------+
| 测试结果1 | 测试结果2 | 测试结果3 | 测试结果4 | 测试结果5 |
+-----------+-----------+-----------+-----------+-----------+

通过field_names设置元数据(其实并不知道怎么形容。。。

然后不断的add_row添加行,那么我们的12306也就可以这样写啦,

# coding: utf-8

import requests, datetime
from prettytable import PrettyTable


def _get_time(from_time, trains_time):
    try:
        time1 = datetime.datetime.strptime(from_time, "%H:%M")
        time2 = datetime.datetime.strptime(trains_time, "%H:%M")
    except ValueError as e:
        return '异常时间啦'
    hour = 0
    if time1.minute + time2.minute >= 60:
        hour = 1

    if time1.hour + time2.hour + hour > 24:
        return "次日到达"
    else:
        return "今日到达"


def _get_seat_count(count):
    if not str(count).strip():
        return '--'
    else:
        return count


url = 'https://kyfw.12306.cn/otn/leftTicket/queryA?leftTicketDTO.train_date=2018-10-30&leftTicketDTO.from_station=SHH&leftTicketDTO.to_station=LYF&purpose_codes=ADULT'
r = requests.get(url)
results = r.json()['data']['result']

header = '车次 车站 时间 历时 商务座特等座 一等座 二等座 高级软卧 软卧 动卧 硬卧'.split()
pt = PrettyTable()
pt._set_field_names(header)
for raw_train in results:
    trains_info = str(raw_train).split('|')
    from_station = trains_info[6]
    to_station = trains_info[7]
    from_time = trains_info[8]
    to_time = trains_info[9]
    trains_time = trains_info[10]
    pt.add_row([trains_info[3], from_station + "\n" + to_station, from_time + "\n" + to_time,
                trains_time + "\n" + _get_time(from_time, trains_time),
                _get_seat_count(trains_info[32]), _get_seat_count(trains_info[31]),
                _get_seat_count(trains_info[30]), _get_seat_count(trains_info[21]),
                _get_seat_count(trains_info[23]), _get_seat_count(trains_info[33]),
                _get_seat_count(trains_info[28])])

print(pt)


+-------+----------+-------+----------+--------------+--------+--------+----------+------+------+------+
|  车次 |   车站   |  时间 |   历时   | 商务座特等座 | 一等座 | 二等座 | 高级软卧 | 软卧 | 动卧 | 硬卧 |
+-------+----------+-------+----------+--------------+--------+--------+----------+------+------+------+
|  G427 |  北京西  | 06:20 |  03:26   |      11      |   2    |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 09:46 | 今日到达 |              |        |        |          |      |      |      |
|  G651 |  北京西  | 06:58 |  04:07   |      有      |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 11:05 | 今日到达 |              |        |        |          |      |      |      |
|  K269 |  北京西  | 07:00 |  10:47   |      --      |   --   |   --   |    --    |  有  |  --  |  有  |
|       |   洛阳   | 17:47 | 今日到达 |              |        |        |          |      |      |      |
|  K507 |  北京西  | 07:12 |  10:05   |      --      |   --   |   --   |    --    |  10  |  --  |  有  |
|       |   洛阳   | 17:17 | 今日到达 |              |        |        |          |      |      |      |
|  K817 |  北京西  | 08:01 |  11:11   |      --      |   --   |   --   |    --    |  9   |  --  |  有  |
|       |   洛阳   | 19:12 | 今日到达 |              |        |        |          |      |      |      |
|  G671 |  北京西  | 08:16 |  04:12   |      9       |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 12:28 | 今日到达 |              |        |        |          |      |      |      |
|  G307 |  北京西  | 09:38 |  04:09   |      8       |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 13:47 | 今日到达 |              |        |        |          |      |      |      |
|  G655 |  北京西  | 09:43 |  04:17   |      19      |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 14:00 | 今日到达 |              |        |        |          |      |      |      |
|  G429 |  北京西  | 10:45 |  04:01   |      7       |   2    |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 14:46 | 今日到达 |              |        |        |          |      |      |      |
|  K267 |  北京西  | 13:22 |  11:23   |      --      |   --   |   --   |    --    |  无  |  --  |  有  |
|       |   关林   | 00:45 | 今日到达 |              |        |        |          |      |      |      |
|  G673 |  北京西  | 14:35 |  04:17   |      8       |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 18:52 | 今日到达 |              |        |        |          |      |      |      |
|  G661 |  北京西  | 14:48 |  04:09   |      3       |   无   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 18:57 | 今日到达 |              |        |        |          |      |      |      |
|  G663 |  北京西  | 15:45 |  03:54   |      8       |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 19:39 | 今日到达 |              |        |        |          |      |      |      |
|  T55  |  北京西  | 15:50 |  08:47   |      --      |   --   |   --   |    --    |  3   |  --  |  2   |
|       |   洛阳   | 00:37 | 今日到达 |              |        |        |          |      |      |      |
|  Z75  |  北京西  | 15:57 |  07:05   |      --      |   --   |   --   |    --    |  2   |  --  |  无  |
|       |   洛阳   | 23:02 | 今日到达 |              |        |        |          |      |      |      |
|  G665 |  北京西  | 16:00 |  04:11   |      7       |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 20:11 | 今日到达 |              |        |        |          |      |      |      |
|  T231 |  北京西  | 18:50 |  08:03   |      --      |   --   |   --   |    --    |  无  |  --  |  18  |
|       |   洛阳   | 02:53 | 次日到达 |              |        |        |          |      |      |      |
| K1363 |  北京西  | 22:06 |  09:38   |      --      |   --   |   --   |    --    |  无  |  --  |  有  |
|       |   洛阳   | 07:44 | 次日到达 |              |        |        |          |      |      |      |
+-------+----------+-------+----------+--------------+--------+--------+----------+------+------+------+

12306的接口格式我个人觉得有点非人类…本例用的组合方法可能并不是最优方法,欢迎大家提供更好的方法~,万里长征三步走完啦,最后一步就是如何动态的调整出发地和目的地。

docopt

一个参数解析库,可以看下Python 参数解析库 docopt 简单使用图文教程。

利用这个库的便利性我们可以很方便的提取出想要的参数信息,

"""命令行火车票查看器

Usage:
    tickets [-gdtkz] <from> <to> <date>

Options:
    -h,--help   显示帮助菜单
    -g          高铁
    -d          动车
    -t          特快
    -k          快速
    -z          直达

Example:
    tickets 北京 上海 2016-10-10
    tickets -dg 成都 南京 2016-10-10
"""

def cil():
    """command-line interface"""
    arguments = docopt(__doc__)
    from_station = arguments['<from>']
    to_station = arguments['<to>']
    date = arguments['<date>']
    print("from_station:" + from_station + "\nto_station:" + to_station + "\ndate:" + date)


if __name__ == '__main__':
    cil()
    
python tickets_test.py -dg 上海 洛阳 2018-10-31

from_station:上海
to_station:洛阳
date:2018-10-31

这里其实还有一个问题就是我们提取出来的都是中文,而12306接口需要的是缩写,这里我们可以通过12306的另一个接口解决~

import re, requests
from pprint import pprint
url = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9069'
response = requests.get(url)
stations = re.findall(u'([\u4e00-\u9fa5]+)\|([A-Z]+)', response.text)
pprint(dict(stations), indent=4)

python parse_station.py > stations.py


stations = {'一间堡': 'YJT',
            '一面坡': 'YPB',
            '一面山': 'YST',
            '七台河': 'QTB',
            '七甸': 'QDM',
            '七营': 'QYJ',
            '七里河': 'QLD',
            '万乐': 'WEB',
            '万发屯': 'WFB',
            '万宁': 'WNQ',
            '万州': 'WYW',
            '万州北': 'WZE',
            '万年': 'WWG',
            '万源': 'WYY',
            '三义井': 'OYD',
            '三井子': 'OJT',
            '三亚': 'SEQ',
            '三元区': 'SMS',
            '三关口': 'OKJ',
            '三十家': 'SRD',
            '三十里堡': 'SST',
            '三原': 'SAY',
            '三合庄': 'SVP',
            .....
            }

所有的条件已经集齐,我们走最后一步吧~

汽车人合体

def cil():
    """command-line interface"""
    arguments = docopt(__doc__)
    from_station = stations.get(arguments['<from>'])
    to_station = stations.get(arguments['<to>'])
    date = arguments['<date>']
    print("from_station:" + from_station + "\nto_station:" + to_station)
    # 构建URL
    url = 'https://kyfw.12306.cn/otn/leftTicket/queryA?leftTicketDTO.train_date={}&leftTicketDTO.from_station={}&leftTicketDTO.to_station={}&purpose_codes=ADULT'.format(
        date, from_station, to_station
    )
    r = requests.get(url, verify=False)
    results = r.json()['data']['result']
    header = '车次 车站 时间 历时 商务座特等座 一等座 二等座 高级软卧 软卧 动卧 硬卧'.split()
    pt = PrettyTable()
    pt._set_field_names(header)
    for raw_train in results:
        trains_info = str(raw_train).split('|')
        from_station = trains_info[6]
        to_station = trains_info[7]
        from_time = trains_info[8]
        to_time = trains_info[9]
        trains_time = trains_info[10]
        pt.add_row([trains_info[3], from_station + "\n" + to_station, from_time + "\n" + to_time,
                    trains_time + "\n" + _get_time(from_time, trains_time),
                    _get_seat_count(trains_info[32]), _get_seat_count(trains_info[31]),
                    _get_seat_count(trains_info[30]), _get_seat_count(trains_info[21]),
                    _get_seat_count(trains_info[23]), _get_seat_count(trains_info[33]),
                    _get_seat_count(trains_info[28])])

    print(pt)



if __name__ == '__main__':
    cil()

以上是本次Demo的完整调用,作为一个Android开发我觉得python还是挺有意思的~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,172评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,346评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,788评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,299评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,409评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,467评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,476评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,262评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,699评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,994评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,167评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,827评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,499评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,149评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,387评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,028评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,055评论 2 352

推荐阅读更多精彩内容