python_day7爬虫之selenium

1.破解极验滑动验证

from selenium import webdriver
from selenium.webdriver import ActionChains
from PIL import Image
import time
import random

# 截取图片函数
def cut_image(driver):
    driver.save_screenshot('image.png')

    img = driver.find_element_by_class_name('geetest_canvas_img')

    left = img.location['x']
    upper = img.location['y']

    right = left + img.size['width']
    lower = upper + img.size['height']

    image_obj = Image.open('image.png')
    img_cut = image_obj.crop((left, upper, right, lower))
    # img_cut.show()
    return img_cut


# 得到完整图片
def get_image1(driver):

    js_code = '''
        var x = document.getElementsByClassName('geetest_canvas_fullbg')[0].style.display="block";
        console.log(x)
        '''

    time.sleep(0.2)
    driver.execute_script(js_code)

    time.sleep(0.2)
    img1 = cut_image(driver)

    return img1

# 得到缺口图片
def get_image2(driver):
    js_code = '''
        var x = document.getElementsByClassName('geetest_canvas_fullbg')[0].style.display="none";
        console.log(x)
        '''

    time.sleep(0.2)
    driver.execute_script(js_code)

    time.sleep(0.2)
    img2 = cut_image(driver)

    return img2

# 对比图片,得到滑动距离
def get_distance(img1, img2):

    # 小滑块右侧位置
    start_location = 60

    # 像素差
    threshold = 60

    for i in range(start_location, img1.size[0]):
        for j in range(img1.size[1]):

            # 获得点(i,j)处的RGB像素值
            rgb1 = img1.load()[i, j]
            rgb2 = img2.load()[i, j]
            r = abs(rgb1[0] - rgb2[0])
            g = abs(rgb1[1] - rgb2[1])
            b = abs(rgb1[2] - rgb2[2])

            if not (r < threshold and g < threshold and b < threshold):
                # 有误差,减去7
                return i-7

def get_tracks(distance):
    distance += 20
    v0 = 0
    a_list = [3, 4, 5]
    t = 0.2
    s = 0

    # 向前滑动轨迹
    forward_tracks = []
    mid = distance * 3 / 5
    while s < distance:
        if s < mid:
            a = a_list[random.randint(0, 2)]
        else:
            a = -a_list[random.randint(0, 2)]

        v = v0
        stack = v * t + 0.5 * a * (t ** 2)

        # 每次拿到的位移
        stack = round(stack)
        s += stack
        v0 = v + a * t

        forward_tracks.append(stack)

    back_tracks = [-1, -1, -2, -3, -2, -3, -2, -2, -3, -1]

    return {'forward_tracks': forward_tracks, 'back_tracks': back_tracks}


def main(user, pwd):

    driver = webdriver.Chrome()
    driver.maximize_window()

    try:
        driver.implicitly_wait(10)
        driver.get('https://account.cnblogs.com/signin?returnUrl=https%3A%2F%2Fwww.cnblogs.com%2F')

        username = driver.find_element_by_id('LoginName')
        username.send_keys(user)
        time.sleep(1)

        password = driver.find_element_by_id('Password')
        password.send_keys(pwd)
        time.sleep(1)

        submit = driver.find_element_by_id('submitBtn')
        submit.click()
        time.sleep(1)

        # 获取完整图片
        img1 = get_image1(driver)

        # 获取缺口图片
        img2 = get_image2(driver)

        # 获取移动距离
        distance = get_distance(img1, img2)

        # 获取滑动轨迹,模拟人的滑动轨迹
        tracks = get_tracks(distance)

        button = driver.find_element_by_class_name('geetest_slider_button')
        ActionChains(driver).click_and_hold(button).perform()

        for forward_track in tracks['forward_tracks']:
            ActionChains(driver).move_by_offset(xoffset=forward_track, yoffset=0).perform()
        time.sleep(0.2)

        for back_track in tracks['back_tracks']:
            ActionChains(driver).move_by_offset(xoffset=back_track, yoffset=0).perform()

        ActionChains(driver).move_by_offset(xoffset=-3, yoffset=0).perform()
        ActionChains(driver).move_by_offset(xoffset=3, yoffset=0).perform()
        time.sleep(0.1)

        ActionChains(driver).release().perform()
        time.sleep(3)
    finally:
        driver.close()

if __name__ == '__main__':

    user = '********'
    pwd = '****************'
    main(user, pwd)
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,607评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,239评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,960评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,750评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,764评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,604评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,347评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,253评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,702评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,893评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,015评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,734评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,352评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,934评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,052评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,216评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,969评论 2 355

推荐阅读更多精彩内容

  • 本文是验证码系列的第二篇。笔者的写作顺序基于心中排名,所以这次为大家带来的是极限验证——GeeTest。 写到这里...
    弗拉明哥阅读 5,002评论 2 25
  • 我们可以借助插件来做 打开插件,找到自己需要的验证码 筛选有用的路径 把对应的视图函数也拿过来,注意还需要一个ge...
    程序员之路阅读 1,334评论 0 1
  • 极验验证码破解—超详细教程(一) 极验验证码破解—超详细教程(二) 极验验证码破解—超详细教程(三) Gayhub...
    起昵称真麻烦啊阅读 18,547评论 17 25
  • 莉莎在写作文时抬起头,并问友“embarrass”是怎么拼写的? 南希说:“我不确定。我想它可能有两个r和s。噢,...
    杨秀华阅读 175评论 0 1
  • 今天周六,下午本来有两波客户过来体验感受,结果三点的顾客没来,四点半的客户带了人过来没有办卡,我总结了一下,除了天...
    闻迪Fineyoga阅读 125评论 0 0