Python盘纪念币系列之三:自动预约脚本编写 02

前面我们的预约脚本已经自动将姓名填入了网页,现在来处理剩下的部分

自动输入其他固定信息

前面提到过自动输入姓名信息,其实证件号码、手机号码、2020年贺岁币(第一批)这三条信息也是可以自动输入的。

输入的方式其实是一样的,下面是代码:

ele_identNo = driver.find_element_by_xpath('//*[@id="identNo"]')
ele_identNo.send_keys(paras['identNo'])
ele_mobile = driver.find_element_by_xpath('//*[@id="mobile"]')
ele_mobile.send_keys(paras['mobile'])
ele_cardvalue0 = driver.find_element_by_xpath('//*[@id="cardvalue0"]')
ele_cardvalue0.send_keys(paras['cardvalue0'])

自动输入验证码

前文有提到过,网页上验证码的源是一条链接而不是一张固定的图片:

image

基于这种情况,我们不能通过链接直接读取当前的验证码。退而求其次,我们采取的方式是对当前验证码截图。不过这样做有一个缺点,就是每次运行时需要存储一个临时的验证码图片。考虑到脚本的使用环境不会有太多的验证码被缓存,而且每次缓存时保持临时图片的文件名不变则一直只会有一张图片,所以这个策略是可以被接受的。

那怎样对当前验证码截图呢?

selenium已经为我们想到了这一点:

# 先找到验证码对应的网页元素
ele_piccaptcha = driver.find_element_by_xpath('//*[@id="piccaptcha"]')
# 然后直接调用这个元素的screenshot方法,参数是保存的路径即可实现截图
ele_piccaptcha.screenshot('./temp_capchar.jpg')

我们将验证码图片保存为了当前目录下的temp_capchar.jpg文件。但有时由于元素选择的不准确或者其他的原因会导致图片偏大,所以在识别验证码之前需要对它进行“瘦身”(前文代码中有体现):

# 先读取图片
image = cv2.imread(capchar, 0)
# 将图片上下左右各切割一个像素
image = image[1:-1, 1:-1]

上述代码是默认封装在recognize_capchar方法中的,要识别验证码,我们只需要将验证码图片的路径以及我们训练好的模型传递给这个方法即可。
需要注意的是,由于初始化神经网络的耗时相对其他代码来说会长很多,所以最好的做法是在程序一开始就初始化一个模型对象,后面只要需要自动识别验证码,都用这个对象来做。整个过程只需要初始化模型一次,能大大的提高效率,毕竟这是抢钱的时候。

# 用已经提前初始化好的模型和标签对象来对temp_capchar.jpg进行自动识别
capchar = recognize_capchar('./temp_capchar.jpg', model, lb)
# 将识别结果输入到对应的框中
ele_capchar = driver.find_element_by_xpath('//*[@id="piccode"]')
ele_capchar.send_keys(capchar)

自动选择下拉框

前面都是静态的网页元素,像这种需要选择的元素应该怎么处理呢?

image
image

其实也还是一步步的来,首先获取到这个下拉框对象:

ele_orglevel = driver.find_element_by_xpath('//*[@id="orglevel1"]')

然后可以通过这个下拉框对象的text属性已经预先配置好的location信息获取到下拉列表的下标:

for org_index, org in enumerate(ele_orglevel.text.split('\n')):
    if loca in org:
        ele_org = driver.find_element_by_xpath(xpath + '/option[{}]'.format(str(org_index + 1)))
        ele_org.click()
        break

这样一级一级的做下来就可以选中预先配置的选项了。我把这些重复的动作做到一个for循环中,然后将下拉框的选择做成了一个独立的方法,这样代码是不是看起来精简了许多:

def choose_bank(driver, location, top_xpath):
    locations = location.split(',')
    for index, loca in enumerate(locations):
        level = str(index + 1)
        xpath = top_xpath.replace('1', level)
        ele_orglevel = driver.find_element_by_xpath(xpath)
        for org_index, org in enumerate(ele_orglevel.text.split('\n')):
            if loca in org:
                ele_org = driver.find_element_by_xpath(xpath + '/option[{}]'.format(str(org_index + 1)))
                ele_org.click()
                break
    xpath = top_xpath.replace('1', str(len(locations) + 1))
    try:
        ele_bottom = driver.find_element_by_xpath(xpath)
    except:
        return
    else:
        org_index = random.choice(list(range(len(ele_bottom.text.split('\n'))))[1:])
        ele_org = driver.find_element_by_xpath(xpath + '/option[{}]'.format(str(org_index + 1)))
        ele_org.click()

然后这样调用就可以了:

choose_bank(driver, paras['location'], '//*[@id="orglevel1"]')

手机验证码的处理

由于手机验证码不是程序能直接拿到的东西,所以这个脚本也无能为力,这也是这个脚本只能叫做半自动脚本的原因。

但这里还是能简单讲讲业务流程的。

要获取手机验证码,我们首先得点击“获取验证码”按钮:

btn_sms = driver.find_element_by_xpath('//*[@id="sendValidate"]')
btn_sms.click()

然后,我们需要输入手机验证码,然后程序会自动的输入到网页中:

phoneCaptchaNo = input('请输入手机验证码, 按回车键确认(如果还未收到短信,请等到短信之后再输入):\n')
ele_phoneCaptchaNo = driver.find_element_by_xpath('//*[@id="phoneCaptchaNo"]')
ele_phoneCaptchaNo.send_keys(phoneCaptchaNo)

提交预约单

至此,整个表单的信息全部填写完成,现在就差提交了:

ele_infosubmit = driver.find_element_by_xpath('//*[@id="infosubmit"]')
ele_infosubmit.click()

后记

到这里,整个预约过程就结束了。

我们的“Python盘纪念币系列”也基本结束。

本系列的所有源代码都会放在下面的github仓库里面,有需要可以参考,有问题欢迎指正,谢谢!

https://github.com/TitusWongCN/AutoTokenAppointment

后面会有一篇文章对“Python盘纪念币系列”做一个总结,同时开始下一个系列,敬请期待!


第一期:Python盘纪念币系列之一:简介

第二期:Python盘纪念币系列之二:识别验证码 01

第三期:Python盘纪念币系列之二:识别验证码 02

第四期:Python盘纪念币系列之二:识别验证码 03

第五期:Python盘纪念币系列之二:识别验证码 04

第六期:Python盘纪念币系列之三:自动预约脚本编写 01

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 原文地址 https://mbinary.coding.me/introduction-to-bitcoin.ht...
    mbinary阅读 5,553评论 0 4
  • 上一篇我们对图片做了预处理,构建了数据集,今天我们就要用这个数据集来训练神经网络了。 学习数据集 我们拿到任何一个...
    wzhw阅读 770评论 1 0
  • 第一章:初来乍到? 在地球上的张昊因为经费不支而导致昏迷不醒,可当他醒来后,却发现自己来到了另一个世界,而且在穿越...
    张景灏阅读 575评论 0 1
  • 没做过小姐,没找过小姐,不知道咋写。 欲望总是要得到满足方才退却,肉欲兽欲,金钱名利,情爱欢愉,贪嗔痴念,无欲之人...
    牧云千里外阅读 156评论 0 0
  • 1,从本篇文章/音频/视频中我学到的最重要的概念 陌生人的善意 请大家理解什么叫“概念”,请从文章中自己总结你学到...
    310涂涛阅读 162评论 3 0