简单的Python学习,用Python完成一个12306余票查询~
Python之12306余票查询
参考资料来自Python 实现火车票查询工具
需要用到的第三方库
requests
,使用 Python 访问 HTTP 资源的必备库。docopt
,Python3 命令行参数解析工具。prettytable
, 格式化信息打印工具,能让你像 MySQL 那样打印数据。
效果图
分析12306接口请求
在网页检查器中我们刷新网页,可以观察到下面这个接口~
单独复制url打开就能发现这就是12306余票数据请求接口,分析一下这个接口的类型是Get,请求参数是
leftTicketDTO.train_date: 2018-10-30
leftTicketDTO.from_station: BJP
leftTicketDTO.to_station: LYF
purpose_codes: ADULT
hoho~,万里长征第一步走的还是比较顺利的,下面就用我们的python程序来请求这个接口看看~
Requests请求接口
import requests
url = 'https://kyfw.12306.cn/otn/leftTicket/queryA?leftTicketDTO.train_date=2018-10-30&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=LYF&purpose_codes=ADULT'
r= requests.get(url)
print(r.json())
关于requests库,我刚接触python觉得应该是现在网络交互中必选库吧,上述代码就请求12306的接口并且输出结果为json
{
"data":{
"flag":"1",
"map":{
"BXP":"北京西",
"GLF":"关林",
"LLF":"洛阳龙门",
"LYF":"洛阳"
},
"result":Array[18]
},
"httpstatus":200,
"messages":"",
"status":true
}
数据结构如上,我们只需要result中的结果就ok,python也可以很方便的解析json这一点我觉得比java舒服一些。
r= requests.get(url)
print(r.json()['data']['result'])
我们现在已经有了数据,接下来则是把我们转换过的结果显示出来,万里长征第二步~
PrettyTable库
PrettyTable 是python中的一个第三方库,可用来生成美观的ASCII格式的表格,十分实用。以下为官方介绍:
A simple Python library for easily displaying tabular data in a visually appealing ASCII table format.PrettyTable is a simple Python library designed to make it quick and easy to represent tabular data in visually appealing ASCII tables. It was inspired by the ASCII tables used in the PostgreSQL shell psql. PrettyTable allows for selection of which columns are to be printed, independent alignment of columns (left or right justified or centred) and printing of “sub-tables” by specifying a row range.
使用方法也是非常简单,先写个小小的Demo
pt = PrettyTable()
pt.field_names=['测试1','测试2','测试3','测试4','测试5']
pt.add_row(['测试结果1','测试结果2', '测试结果3', '测试结果4','测试结果5'])
print(pt)
+-----------+-----------+-----------+-----------+-----------+
| 测试1 | 测试2 | 测试3 | 测试4 | 测试5 |
+-----------+-----------+-----------+-----------+-----------+
| 测试结果1 | 测试结果2 | 测试结果3 | 测试结果4 | 测试结果5 |
+-----------+-----------+-----------+-----------+-----------+
通过field_names设置元数据(其实并不知道怎么形容。。。
然后不断的add_row添加行,那么我们的12306也就可以这样写啦,
# coding: utf-8
import requests, datetime
from prettytable import PrettyTable
def _get_time(from_time, trains_time):
try:
time1 = datetime.datetime.strptime(from_time, "%H:%M")
time2 = datetime.datetime.strptime(trains_time, "%H:%M")
except ValueError as e:
return '异常时间啦'
hour = 0
if time1.minute + time2.minute >= 60:
hour = 1
if time1.hour + time2.hour + hour > 24:
return "次日到达"
else:
return "今日到达"
def _get_seat_count(count):
if not str(count).strip():
return '--'
else:
return count
url = 'https://kyfw.12306.cn/otn/leftTicket/queryA?leftTicketDTO.train_date=2018-10-30&leftTicketDTO.from_station=SHH&leftTicketDTO.to_station=LYF&purpose_codes=ADULT'
r = requests.get(url)
results = r.json()['data']['result']
header = '车次 车站 时间 历时 商务座特等座 一等座 二等座 高级软卧 软卧 动卧 硬卧'.split()
pt = PrettyTable()
pt._set_field_names(header)
for raw_train in results:
trains_info = str(raw_train).split('|')
from_station = trains_info[6]
to_station = trains_info[7]
from_time = trains_info[8]
to_time = trains_info[9]
trains_time = trains_info[10]
pt.add_row([trains_info[3], from_station + "\n" + to_station, from_time + "\n" + to_time,
trains_time + "\n" + _get_time(from_time, trains_time),
_get_seat_count(trains_info[32]), _get_seat_count(trains_info[31]),
_get_seat_count(trains_info[30]), _get_seat_count(trains_info[21]),
_get_seat_count(trains_info[23]), _get_seat_count(trains_info[33]),
_get_seat_count(trains_info[28])])
print(pt)
+-------+----------+-------+----------+--------------+--------+--------+----------+------+------+------+
| 车次 | 车站 | 时间 | 历时 | 商务座特等座 | 一等座 | 二等座 | 高级软卧 | 软卧 | 动卧 | 硬卧 |
+-------+----------+-------+----------+--------------+--------+--------+----------+------+------+------+
| G427 | 北京西 | 06:20 | 03:26 | 11 | 2 | 有 | -- | -- | -- | -- |
| | 洛阳龙门 | 09:46 | 今日到达 | | | | | | | |
| G651 | 北京西 | 06:58 | 04:07 | 有 | 有 | 有 | -- | -- | -- | -- |
| | 洛阳龙门 | 11:05 | 今日到达 | | | | | | | |
| K269 | 北京西 | 07:00 | 10:47 | -- | -- | -- | -- | 有 | -- | 有 |
| | 洛阳 | 17:47 | 今日到达 | | | | | | | |
| K507 | 北京西 | 07:12 | 10:05 | -- | -- | -- | -- | 10 | -- | 有 |
| | 洛阳 | 17:17 | 今日到达 | | | | | | | |
| K817 | 北京西 | 08:01 | 11:11 | -- | -- | -- | -- | 9 | -- | 有 |
| | 洛阳 | 19:12 | 今日到达 | | | | | | | |
| G671 | 北京西 | 08:16 | 04:12 | 9 | 有 | 有 | -- | -- | -- | -- |
| | 洛阳龙门 | 12:28 | 今日到达 | | | | | | | |
| G307 | 北京西 | 09:38 | 04:09 | 8 | 有 | 有 | -- | -- | -- | -- |
| | 洛阳龙门 | 13:47 | 今日到达 | | | | | | | |
| G655 | 北京西 | 09:43 | 04:17 | 19 | 有 | 有 | -- | -- | -- | -- |
| | 洛阳龙门 | 14:00 | 今日到达 | | | | | | | |
| G429 | 北京西 | 10:45 | 04:01 | 7 | 2 | 有 | -- | -- | -- | -- |
| | 洛阳龙门 | 14:46 | 今日到达 | | | | | | | |
| K267 | 北京西 | 13:22 | 11:23 | -- | -- | -- | -- | 无 | -- | 有 |
| | 关林 | 00:45 | 今日到达 | | | | | | | |
| G673 | 北京西 | 14:35 | 04:17 | 8 | 有 | 有 | -- | -- | -- | -- |
| | 洛阳龙门 | 18:52 | 今日到达 | | | | | | | |
| G661 | 北京西 | 14:48 | 04:09 | 3 | 无 | 有 | -- | -- | -- | -- |
| | 洛阳龙门 | 18:57 | 今日到达 | | | | | | | |
| G663 | 北京西 | 15:45 | 03:54 | 8 | 有 | 有 | -- | -- | -- | -- |
| | 洛阳龙门 | 19:39 | 今日到达 | | | | | | | |
| T55 | 北京西 | 15:50 | 08:47 | -- | -- | -- | -- | 3 | -- | 2 |
| | 洛阳 | 00:37 | 今日到达 | | | | | | | |
| Z75 | 北京西 | 15:57 | 07:05 | -- | -- | -- | -- | 2 | -- | 无 |
| | 洛阳 | 23:02 | 今日到达 | | | | | | | |
| G665 | 北京西 | 16:00 | 04:11 | 7 | 有 | 有 | -- | -- | -- | -- |
| | 洛阳龙门 | 20:11 | 今日到达 | | | | | | | |
| T231 | 北京西 | 18:50 | 08:03 | -- | -- | -- | -- | 无 | -- | 18 |
| | 洛阳 | 02:53 | 次日到达 | | | | | | | |
| K1363 | 北京西 | 22:06 | 09:38 | -- | -- | -- | -- | 无 | -- | 有 |
| | 洛阳 | 07:44 | 次日到达 | | | | | | | |
+-------+----------+-------+----------+--------------+--------+--------+----------+------+------+------+
12306的接口格式我个人觉得有点非人类…本例用的组合方法可能并不是最优方法,欢迎大家提供更好的方法~,万里长征三步走完啦,最后一步就是如何动态的调整出发地和目的地。
docopt
一个参数解析库,可以看下Python 参数解析库 docopt 简单使用图文教程。
利用这个库的便利性我们可以很方便的提取出想要的参数信息,
"""命令行火车票查看器
Usage:
tickets [-gdtkz] <from> <to> <date>
Options:
-h,--help 显示帮助菜单
-g 高铁
-d 动车
-t 特快
-k 快速
-z 直达
Example:
tickets 北京 上海 2016-10-10
tickets -dg 成都 南京 2016-10-10
"""
def cil():
"""command-line interface"""
arguments = docopt(__doc__)
from_station = arguments['<from>']
to_station = arguments['<to>']
date = arguments['<date>']
print("from_station:" + from_station + "\nto_station:" + to_station + "\ndate:" + date)
if __name__ == '__main__':
cil()
python tickets_test.py -dg 上海 洛阳 2018-10-31
from_station:上海
to_station:洛阳
date:2018-10-31
这里其实还有一个问题就是我们提取出来的都是中文,而12306接口需要的是缩写,这里我们可以通过12306的另一个接口解决~
import re, requests
from pprint import pprint
url = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9069'
response = requests.get(url)
stations = re.findall(u'([\u4e00-\u9fa5]+)\|([A-Z]+)', response.text)
pprint(dict(stations), indent=4)
python parse_station.py > stations.py
stations = {'一间堡': 'YJT',
'一面坡': 'YPB',
'一面山': 'YST',
'七台河': 'QTB',
'七甸': 'QDM',
'七营': 'QYJ',
'七里河': 'QLD',
'万乐': 'WEB',
'万发屯': 'WFB',
'万宁': 'WNQ',
'万州': 'WYW',
'万州北': 'WZE',
'万年': 'WWG',
'万源': 'WYY',
'三义井': 'OYD',
'三井子': 'OJT',
'三亚': 'SEQ',
'三元区': 'SMS',
'三关口': 'OKJ',
'三十家': 'SRD',
'三十里堡': 'SST',
'三原': 'SAY',
'三合庄': 'SVP',
.....
}
所有的条件已经集齐,我们走最后一步吧~
汽车人合体
def cil():
"""command-line interface"""
arguments = docopt(__doc__)
from_station = stations.get(arguments['<from>'])
to_station = stations.get(arguments['<to>'])
date = arguments['<date>']
print("from_station:" + from_station + "\nto_station:" + to_station)
# 构建URL
url = 'https://kyfw.12306.cn/otn/leftTicket/queryA?leftTicketDTO.train_date={}&leftTicketDTO.from_station={}&leftTicketDTO.to_station={}&purpose_codes=ADULT'.format(
date, from_station, to_station
)
r = requests.get(url, verify=False)
results = r.json()['data']['result']
header = '车次 车站 时间 历时 商务座特等座 一等座 二等座 高级软卧 软卧 动卧 硬卧'.split()
pt = PrettyTable()
pt._set_field_names(header)
for raw_train in results:
trains_info = str(raw_train).split('|')
from_station = trains_info[6]
to_station = trains_info[7]
from_time = trains_info[8]
to_time = trains_info[9]
trains_time = trains_info[10]
pt.add_row([trains_info[3], from_station + "\n" + to_station, from_time + "\n" + to_time,
trains_time + "\n" + _get_time(from_time, trains_time),
_get_seat_count(trains_info[32]), _get_seat_count(trains_info[31]),
_get_seat_count(trains_info[30]), _get_seat_count(trains_info[21]),
_get_seat_count(trains_info[23]), _get_seat_count(trains_info[33]),
_get_seat_count(trains_info[28])])
print(pt)
if __name__ == '__main__':
cil()
以上是本次Demo的完整调用,作为一个Android开发我觉得python还是挺有意思的~