破解js反爬机制的有道翻译——制作个人翻译工具

  • 效果图

    (界面有点丑,将就看吧。。。)

  • 这类公用资源网站,在你需要翻译的时候,需要的是进入他们的网站进行操作,大批量的翻译,同样的是需要调用他们的接口,收费。。。
  • 这个时候我们想用他们的数据库来获得自己的需求,在我进行的分析的时候,有道翻译问题还是在他们的有些表单数据是进行js加密操作的,不能直接请求数据!
  • 得,直接进入主题吧。

  • 首先我们正常的爬虫程序,就是在导包后,填入真正的url地址去访问;
  • 进入有道翻译网页按F12进入开发者模式,找到存在真正url地址的包,输入翻译词汇,后如下图:


    流程1
  • 找到真实url,同时data表单数据也在下面:


    流程2
  • 我们会发现,i其实是我们输入的翻译词汇,这里还有三处数据很关键,分别是salt、ts、sign,都是进行加密的数据(难不倒我们,往下看!)
  • 所以我们进行的是post隐式请求!!!
  • 开始逆向js查找数据加密的地方,那我们查找salt,会得到一串js,在进行美化一下:


    流程3
  • 再在这里面搜索salt,会得到很多处都有salt


    流程4
  • 在查找的过程中花费一段时间哈。。。
  • 直接跳了,找到如下图:


    流程5
  • 在第4处这个地方!
  • 就可以清楚的看到加密数据是怎么传递生成的,分别是salt、ts、sign!
  • 到这里,我们获得了url、headers、表单数据及其中的加密数据!
  • 同时,我们对程序进行GUI界面化,更加直观,再打包!

代码

import requests,time,random,hashlib,json
from tkinter import *
from tkinter import messagebox

# 界面控制
def fanyi():
    text = entry.get()
    text = text.strip()
    print(text)
    if text == '':
        messagebox.showinfo('提示:','请输入')
    else:
        result,result_detail = parse(text)
        # 进行界面排版
        theLabel = Label(room, text='翻译:'+'\n'+result+'\n'+'\n'+'详细翻译:'+'\n'+result_detail, font= ('黑体',15), fg='red')
        theLabel.grid(row=1, column=1)

# 翻译结果返回
def parse(text):

    # 网址
    url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'

    # 逆向js解析表单数据
    ts = str(int(time.time()*1000))
    salt = ts + str(random.randint(0, 10))
    # md5加密
    md5 = hashlib.md5()
    encryption = 'fanyideskweb' + text + salt + "n%A-rKaT5fb[Gy?;N5@Tj"
    md5.update(encryption.encode("utf-8"))
    sign = md5.hexdigest()

    # 表单
    data = {
        'i': text,
        'from': 'AUTO',
        'to': 'AUTO',
        'smartresult': 'dict',
        'client': 'fanyideskweb',
        'salt': salt,
        'sign': sign,
        'ts': ts,
        'bv': '7e3150ecbdf9de52dc355751b074cf60',
        'doctype': 'json',
        'version': '2.1',
        'keyfrom': 'fanyi.web',
        'action': 'FY_BY_CLICKBUTTION'
    }

    # 请求headers
    headers = {
        'Accept': 'application/json, text/javascript, */*; q=0.01',
        'Accept-Encoding': 'gzip, deflate',
        'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,zh-HK;q=0.7,zh-TW;q=0.6',
        'Connection': 'keep-alive',
        'Content-Length': '242',
        'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
        'Cookie': 'OUTFOX_SEARCH_USER_ID_NCOO=101631173.1664094; OUTFOX_SEARCH_USER_ID="1817802748@10.169.0.84"; _ntes_nnid=c5aaa2bceb9489aff9a93944a0e70db5,1564971812601; JSESSIONID=aaaXCWGeXbuZff2fbSgZw; ___rl__test__cookies=1566701790595',
        'Host': 'fanyi.youdao.com',
        'Origin': 'http://fanyi.youdao.com',
        'Referer': 'http://fanyi.youdao.com/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36',
        'X-Requested-With': 'XMLHttpRequest',
    }

    request = requests.post(url=url,data=data,headers=headers)
    details = request.text
    '''
    # json字符串
    <class 'str'>
    {"translateResult":[[{"tgt":"你好","src":"hello"}]],"errorCode":0,"type":"en2zh-CHS",
        "smartResult":{"entries":["","n. 表示问候, 惊奇或唤起注意时的用语\r\n","int. 喂;哈罗\r\n","n. (Hello)人名;(法)埃洛\r\n"],"type":1}}
    '''
    translateResult = json.loads(details)
    result = translateResult["translateResult"][0][0]['tgt']
    # print('翻译:', translateResult["translateResult"][0][0]['tgt'])
    # print('详细翻译:',''.join(translateResult["smartResult"]["entries"]))
    try:
        result_detail = ''.join(translateResult["smartResult"]["entries"])
    except:
        result_detail = '无详细翻译!'
    return result,result_detail


room = Tk()

room.title("翻译")

room.geometry('800x300+500+300')

label = Label(room, text = '输入', font= ('黑体',25), fg='black')

label.grid()

entry = Entry(room, font = ('微软雅黑',20))
entry.grid(row= 0, column=1)
button = Button(room,text = '进行翻译', font=('微软雅黑',20), command= fanyi)
button.grid(row= 0, column=2)

room.mainloop()
#打包命令:pyinstaller -F -i gg.ico youdao.py
  • 打包成exe可执行文件命令:pyinstaller -F -i gg.ico youdao.py
注意
  • 最后返回来的数据是json字符串。。。

不要温顺的走进那良夜
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,039评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,223评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,916评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,009评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,030评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,011评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,934评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,754评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,202评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,433评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,590评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,321评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,917评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,568评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,738评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,583评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,482评论 2 352

推荐阅读更多精彩内容