前言
本套教程共分3章:
本套内容主要用于分析12306购票流程,意在编写一套自动购票小程序。12306接口 api 经常变动,但是流程分析是固定的。因此,本套教程主要记录12306 相关购票流程分析过程,以作记录。
余票查询流程分析
- 首先,12306官网余票查询页面,输入相应的信息后,点击查询按钮,我们就可以查询到车票信息了。因此,我们这个过程就行抓包分析,就可以很简单的得到 12306余票查询接口 了。
我们通过 Chrome 浏览器进行抓包结果如下所示:
query
可以看到,查询接口是一个Get
操作,其URL为:
https://kyfw.12306.cn/otn/leftTicket/queryZ
注:12306的查询接口经常改变(可能一天一改),其变动的主要规律为:https://kyfw.12306.cn/otn/leftTicket/query[A-Z]
,就是最后一个字母做变动。因此,如果程序查询出异常,很大可能就是接口改变了,重新抓下查询接口即可。
然后,我们可以看到查询接口的参数总共有3个:
leftTicketDTO.train_date:2018-01-18
leftTicketDTO.from_station:IOQ
leftTicketDTO.to_station:CBQ
purpose_codes:ADULT
其中:
leftTicketDTO.train_date
是:出发时间(格式:yyyy-mm-dd);
leftTicketDTO.from_station
是:出发站代号;
leftTicketDTO.to_station
是:到达站代号;
purpose_codes
是:乘客类型(成人:ADULT,学生:0X00)
对于参数,我们暂时未能解决的就是出发站和到达站的代号获取,我们查询操作输入的是出发站名称和到达站名称,因此,这里存在一个转换操作。我们从上图中可以看到,点击查询按钮的时候,浏览器总共就向服务器发送了两个请求,而这两个请求均没有发现车站名跟车站代码的转换请求,因此,这里的转换应该是通过 javascipt
来实现的。
所以,我们重新刷新下这个查询页面,然后查找 js 文件,然后我们就可以找到:
其转换接口为:
https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9043
然后看下这个接口的返回内容:
可以看到返回的内容包含了车站名称跟车站代码,所以我们这里只需访问这个接口,然后通过正则把车站名称跟代码提取出来就可以了。
- 通过上面的分析,我们就已经可以构造查询请求了,那我们接下来分析一下如何解析出车票数据。
首先,我们来看下余票查询请求接口返回的数据:
response
我们可以看到,服务器返回的是一个json格式数据。这里粗略一看,暂时看不出车票相关信息,但是返回的数据中,data
里面的result
键携带了多个复杂的数据,那么让我们拿出一个来看下内容:
"8%2B2GKMHhFwJoxRtWKimoLpGAliGbngi%2FZaphnKuMyZD6oV2ieyNTg0mIPI4Cg2ljbffdoF2nMGOi%0AoDAImy4gVlrYEXIMA4X9VNDR%2BiPQ0tA9cnErEkGoq7Nd%2BoZV33CakJ7WCeywseloco%2F15a8qeTyC%0AR3wI3WTWSbe8P66c5Fp86A6MENy207nyROgc5s2hiNxL5kPyHA5RXOw8xtg5y1n6%2BpvD%2FB9IL10G%0AIVRhxULzYA1W64eelsUzo0EbT2ze|预订|6i000D312606|D3126|IOQ|NJH|IOQ|CBQ|07:00|09:17|02:17|Y|fKWSG%2ByqVSSwNQ471kVkHPnkzR90vYtBDPVB07ya1Y%2BjCttf|20180118|3|Q6|01|06|1|0|||||||无||||有|有|||O0M0O0|OMO|0"
仔细看一下,这里有预定
,有
,无
,仔细看一下,甚至还有D3126(车次)
,因此, 这里应该就是我们所需的车票信息了,各个信息都被|
分隔。所以我们所需要做的,就是把这串字符串用|
进行分割,然后分析出各个子串的含义。这里,笔者分析得出的结果为:
车次:3
start_station_code:起始站:4
end_station_code终点站:5
from_station_code:出发站:6
to_station_code:到达站:7
start_time:出发时间:8
arrive_time:达到时间:9
历时:10
商务特等座:32
一等座:31
二等座:30
高级软卧:21
软卧:23
动卧:33
硬卧:28
软座:24
硬座:29
无座:26
其他:22
备注:1
start_train_date:车票出发日期:13
secretStr:0
其实,如果我们抓包抓的够仔细,我们可以在一个 js文件 中发现如下代码:
function b4(ct, cv) {
var cs = [];
for (var cr = 0; cr < ct.length; cr++) {
var cw = [];
var cq = ct[cr].split("|"); //用"|"进行字符串切割
cw.secretHBStr = cq[36];
cw.secretStr = cq[0]; //secretStr索引为0
cw.buttonTextInfo = cq[1];
var cu = [];
cu.train_no = cq[2]; //车票号
cu.station_train_code = cq[3]; //车次
cu.start_station_telecode = cq[4]; //起始站代号
cu.end_station_telecode = cq[5]; //终点站代号
cu.from_station_telecode = cq[6]; //出发站代号
cu.to_station_telecode = cq[7]; //到达站代号
cu.start_time = cq[8]; //出发时间
cu.arrive_time = cq[9]; //到达时间
cu.lishi = cq[10]; //历时
cu.canWebBuy = cq[11]; //是否能购买:Y 可以
cu.yp_info = cq[12];
cu.start_train_date = cq[13]; //出发日期
cu.train_seat_feature = cq[14];
cu.location_code = cq[15];
cu.from_station_no = cq[16];
cu.to_station_no = cq[17];
cu.is_support_card = cq[18];
cu.controlled_train_flag = cq[19];
cu.gg_num = cq[20] ? cq[20] : "--";
cu.gr_num = cq[21] ? cq[21] : "--";
cu.qt_num = cq[22] ? cq[22] : "--";
cu.rw_num = cq[23] ? cq[23] : "--"; //软卧
cu.rz_num = cq[24] ? cq[24] : "--"; //软座
cu.tz_num = cq[25] ? cq[25] : "--";
cu.wz_num = cq[26] ? cq[26] : "--"; //无座
cu.yb_num = cq[27] ? cq[27] : "--";
cu.yw_num = cq[28] ? cq[28] : "--"; //硬卧
cu.yz_num = cq[29] ? cq[29] : "--";
cu.ze_num = cq[30] ? cq[30] : "--"; //二等座
cu.zy_num = cq[31] ? cq[31] : "--"; //一等座
cu.swz_num = cq[32] ? cq[32] : "--"; //商务特等座
cu.srrb_num = cq[33] ? cq[33] : "--";
cu.yp_ex = cq[34];
cu.seat_types = cq[35];
cu.exchange_train_flag = cq[36];
cu.from_station_name = cv[cq[6]];
cu.to_station_name = cv[cq[7]];
cw.queryLeftNewDTO = cu;
cs.push(cw)
}
return cs
}
通过以上分析,我们就可以写出一个自动查票小程序了。