文章参考 https://blog.csdn.net/Chen_chong__/article/details/82950968
#! -*- coding:utf-8 -*-
# 参考 https://blog.csdn.net/Chen_chong__/article/details/82950968
import asyncio
import random,time
from pyppeteer import launch
from retrying import retry
async def main(username ,pwd ,url):
# 以下使用await 可以针对耗时的操作进行挂起
browser =await launch({
'headless': False,
'dumpio': True,
'args': [
'--disable-extensions',
'--hide-scrollbars',
'--disable-bundled-ppapi-flash',
'--mute-audio',
'--no-sandbox',
'--disable-setuid-sandbox',
'--disable-gpu',
],
}) # 启动pyppeteer 属于内存中实现交互的模拟器
page = await browser.newPage() # 启动个新的浏览器页面,此需要下载Chromeium
await page.setUserAgent('Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36')
await page.goto(url) # 访问登录页面
# 替换淘宝在检测浏览时采集的一些参数。
# 就是在浏览器运行的时候,始终让window.navigator.webdriver=false
# navigator是windiw对象的一个属性,同时修改plugins,languages,navigator 且让
await page.evaluate(js1) #以下为插入中间js,将淘宝会为了检测浏览器而调用的js修改其结果。
await page.evaluate(js3)
await page.evaluate(js4)
await page.evaluate(js5)
# 使用type选定页面元素,并修改其数值,用于输入账号密码,修改的速度仿人类操作,因为有个输入速度的检测机制
# 因为 pyppeteer 框架需要转换为js操作,而js和python的类型定义不同,所以写法与参数要用字典,类型导入
await page.type('.J_UserName', username, {'delay': input_time_random() - 50})
await page.type('#J_StandardPwd input', pwd, {'delay': input_time_random()})
#await page.screenshot({'path': './headless-test-result.png'}) # 截图测试
time.sleep(2)
# 检测页面是否有滑块。原理是检测页面元素。
slider = await page.Jeval('#nocaptcha', 'node => node.style') # 是否有滑块
if slider:
print('当前页面出现滑块')
#await page.screenshot({'path': './headless-login-slide.png'}) # 截图测试
flag,page = await mouse_slide(page=page) #js拉动滑块过去。
if flag:
await page.keyboard.press('Enter') # 确保内容输入完毕,少数页面会自动完成按钮点击
print("print enter",flag,page)
await page.evaluate('''document.getElementById("J_SubmitStatic").click()''') # 如果无法通过回车键完成点击,就调用js模拟点击登录按钮。
time.sleep(2)
#cookies_list = await page.cookies()
cookies = await get_cookie(page) # 导出cookie 完成登陆后就可以拿着cookie玩各种各样的事情了。
else:
print("print enter", flag,page)
else:
print("")
await page.keyboard.press('Enter')
print("print enter")
await page.evaluate('''document.getElementById("J_SubmitStatic").click()''')
await page.waitFor(20)
await page.waitForNavigation()
try:
global error # 检测是否是账号密码错误
print("error_1:",error)
error = await page.Jeval('.error', 'node => node.textContent')
print("error_2:",error)
except Exception as e:
error = None
print('发生错误:',e)
finally:
if error:
print('确保账户安全重新入输入')
# 程序退出。
loop.close()
else:
print(page.url)
cookies = await get_cookie(page)
time.sleep(5)
return cookies
js1 = '''() =>{
Object.defineProperties(navigator,{
webdriver:{
get: () => false
}
})
}'''
js2 = '''() => {
alert (
window.navigator.webdriver
)
}'''
js3 = '''() => {
window.navigator.chrome = {
runtime: {},
// etc.
};
}'''
js4 = '''() =>{
Object.defineProperty(navigator, 'languages', {
get: () => ['en-US', 'en']
});
}'''
js5 = '''() =>{
Object.defineProperty(navigator, 'plugins', {
get: () => [1, 2, 3, 4, 5,6],
});
}'''
# 获取登录后cookie
async def get_cookie(page):
#res = await page.content()
cookies_list = await page.cookies()
cookies = ''
for cookie in cookies_list:
str_cookie = '{0}={1};'
str_cookie = str_cookie.format(cookie.get('name'), cookie.get('value'))
cookies += str_cookie
return cookies
def input_time_random():
return random.randint(100, 151)
def retry_if_result_none(result):
return result is None
@retry(retry_on_result=retry_if_result_none,)
async def mouse_slide(page=None):
await asyncio.sleep(2)
try :
print('开始验证...')
#鼠标移动到滑块,按下,滑动到头(然后延时处理),松开按键
await page.hover('#nc_1_n1z') # 不同场景的验证码模块能名字不同。
await page.mouse.down()
await page.mouse.move(2000, 0, {'delay': random.randint(1000, 2000)})
await page.mouse.up()
except Exception as e:
print(e, ':验证失败')
return None,page
else:
await asyncio.sleep(2)
# 判断是否通过
slider_again = await page.Jeval('.nc-lang-cnt', 'node => node.textContent')
if slider_again != '验证通过':
return None,page
else:
#await page.screenshot({'path': './headless-slide-result.png'}) # 截图测试
print('验证通过')
return 1,page
if __name__ == '__main__':
username = 'xxx' # 账号
pwd = 'xxx' #密码
url = 'https://login.taobao.com/member/login.jhtml?style=mini&from=b2b&full_redirect=true' # 淘宝登录地址
loop = asyncio.get_event_loop() #事件循环,开启个无限循环的程序流程,把一些函数注册到事件循环上。当满足事件发生的时候,调用相应的协程函数。
result = loop.run_until_complete(main(username, pwd, url)) #将协程注册到事件循环,并启动事件循环
print('登录后cookies:',result)
淘宝登录页面登录验证通过
QQ截图20190106203737.png
登录成功
QQ截图20190106203813.png