前言:
今年由于疫情的原因,基本上人多的活动场地都有了预约的功能。本人有幸作为一个女团周边商城开发技术,因为女团有许多的活动,所以开发了一套预约系统,断断续续不停的加功能,写了两个多月,功能繁琐的要命,所以我对预约相关的功能十分敏感。
最近有个考研备考的朋友找到我,问我能不能搞个自动预约的东西,他一直被一个小姑娘抢座位,没法复习了。我一听这就来劲了,谁当初为了学程序,不是想着有一天可以实现一些同一件事上可以帮自己比别人更牛比的程序。想法有了,就是要实现的时候了。
他直接给我了个二维码让我扫,说这个就是那个座位的预约二维码。很好,扫过后是一个https链接,然后我复制到电脑上打开,查看源代码和http相关信息。但是浏览器F12提供的内容并不是太完整,包括你刷新页面后,请求全都没有了,这时候一个强大的工具就显得格外重要了“fiddler”,一个可以抓手机上的包的抓包工具,通过它我们很容易的能获取到http请求和响应的一些信息。至于fiddler的使用及抓手机包的方法,网上一大堆,这里不再赘述。
扫码后复制的地址:https://passport2.chaoxing.com/mlogin?loginType=1&newversion=true&fid=&refer=http%3A%2F%2Foffice.chaoxing.com%2Ffront%2Fthird%2Fapps%2Fseat%2Fcode%3Fid%3Dxxxx%26seatNum%3Dxxx (教室id和座位id不便透漏)
思考一下:自动预约功能,字面意思,肯定要有预约操作和程序定时自动执行了。
一、预约操作
这是本功能的主体。我首先在手机上操作了一番。得出人要操作的话,有以下步骤
1)登录
2)选择时间段
3)确定预约
看上去简单的三步,实际上实现还是要花点功夫的。
登录
扫码后,如果没登录,则跳转到登陆页面。因为我们是爬虫程序跑的,所以本就没有保存登录状态cookie,需要每次预约都要从登陆开始走一遍。
我用python试着请求了一下,发现可以获取响应,所以就看着源代码开始找登录方法。
发现没有在页面写js,而是引用了一个外部的js文件,很显然登录方法就在这里面了。根据src相对路径,我们可以拼出他的全路径为:https://passport2.chaoxing.com/js/fanya/mobile/login.js?v=5,访问这个文件,然后Ctrl+F找到登录方法。
由上图可知,这个登陆方法需要的参数一共有5个,经过多次登录测试发现。
fid:可以默认为-1
uname:手机号
password:密码
refer:跳转来源,及从哪个页面跳到登录页面的,可以默认为“”,
t:默认为True
若登录成功则返回
{"url":"http%3A%2F%2Foffice.chaoxing.com%2Ffront%2Fthird%2Fapps%2Fseat%2Fcode%3Fid%3D4219%26seatNum%3D380","status":true}
url:为登录成功要跳转的页面
status:为是否成功
本以为一个小小的登录很容易,没想到却试了几次都不成功。密码也加密了,就是不成功。后面想,肯定是缺什么东西了,从一个http请求来看,除了参数可以穿东西,后台也是可以通过cookie来获取信息的。果然,请求登录页面的时候,响应里面返回了两条cookie,如下图。
就是这俩cookie,请求的时候传过去就可以了
看上图,我们获取到cookie后保存到对象的headers变量中,成功后我们获取的cookie有这些。注意,这些非常重要,因为你接下来的每个请求都要用到他们。
预约
终于登陆可以了,接下来就是重头戏了,也是本功能的重点。同样的道理,要想预约肯定要调用预约的接口,但是预约的接口在哪里呢,这还是要我们到 预约的页面去看了。就是那个二维码啦。
{"url":"http%3A%2F%2Foffice.chaoxing.com%2Ffront%2Fthird%2Fapps%2Fseat%2Fcode%3Fid%3Dxxxx%26seatNum%3Dxxx","status":true}
还记得这个吗,这是登录成功返回的,url就是那个扫码的页面。我们把他解码后就是http://office.chaoxing.com/front/third/apps/seat/code?id=xxxx&seatNum=xxx
id:教室ID
seatNum:座位ID
访问这个页面后我们可以得到它的源码,然后就要开始找方法了
对一个请求来说,我们不管他会返回什么,我们就只管知道他需要什么。
看参数
roomId:很显然这是教室ID
day:大胆猜测,应该是预约的日期,至于是什么格式,我们后面再找
startTime:,endTime:既然日期有了,这个肯定是时间段了,不过我们也是还不知道格式,待会去找
token:页面生成自带的,这个很重要,是一个防刷的方式
type:1固定参数
好了,我们现在需要知道三个时间的格式是什么了
day: _this.chosedDay,我们在上下文找一下这个变量,发现了它:_this.chosedDay = moment().format('YYYY-MM-DD'),所以我们可以锁定基本上格式为2020-09-21。
至于startTime和endTime,我们继续找发现了它
如果有Vue基础的人应该能知道了,这个参数应该是从其他地方获取的了,我们去找一下。
找啊找,找啊找。终于一番倒腾,终于找到了
通过调用教室信息来获取可预约的时间信息。当然也看到了用的是('HH:mm')
好了,我们时间都知道了,也是相当于所有参数都知道了,我们现在要去跑一下了。
这时候你想到了用登陆返回的cookie来去请求就一定成功。额,又草率了。其他的不说,这个cookie用的是真的多啊,这个系统。这个预约页面访问的时候也返回了几个cookie。经过我多次尝试,发现登录的那个cookie用来提交是不可行的。两个cookie叠加起来也是不可行的,只能使用预约页面返回的cookie才可以。
终于我们成功了。
{"data":{"seatReserve":{"deptId":xxxx,"duration":"3.0","endTime":1600678800000,"expireTime":1600669200000,"firstLevelName":"xxxxxxx","id":xxxxxx,"inserttime":1600617601000,"learnDuration":0,"roomId":xxxx,"seatNum":"xxx","secondLevelName":"xx","signDuration":20,"startTime":1600668000000,"status":0,"thirdLevelName":"xxxxx","uid":60165572,"updatetime":1600617602000}},"success":true}
返回success:true,说明预约成功了。
但是有个问题,那就是一天最多能预约8个小时,每次提交只能4个小时。所以想预约满的话要提交两次。
这时候可能回想,那个方法,时间段一改,再调用不就完事儿了吗。想的太简单了。
那个token,肯定不是白传的。
多次测试发现每次请求页面,token的值都不一样。说明什么?我们每次都要请求一次页面,我还发现,页面返回的cookie也不一样。是真的烦啊。只能循环时间段的时候,把cookie和token给重置掉。然后就皆大欢喜了。。。。。
自动服务
因为我主要搞的是C#,所以嘛,就windows系统了,做一个windows服务来解决它,当然我们也需要一个定时作业。所以就有了他们
win32service+BlockingScheduler
它们其实我也不太熟,就是直接搜直接用。
这里我放两个链接,想了解的可以看一下:
win32service:https://www.cnblogs.com/shenh/p/8931620.html
BlockingScheduler:https://blog.csdn.net/lipachong/article/details/99962134
基本概念就是到半夜12点整开始请求,为了防止ip被封掉,每次请求我sleep了0.5秒。执行完后发个邮件通知给我朋友。OK,完美。
初次写文章,可能有点凌乱哈。作为一个自学一年python的小老弟感觉我的代码还是不得行,感兴趣的大佬可以指点指点奥。
项目地址:python-requests: python利用requests模块+win32service+BlockingScheduler实现学习通图书馆定时预约抢座