js逆向-MD5

再进行数据爬取的过程中,有些时候浏览器访问服务端会带上一些加密的参数,爬虫模拟客户端操作,也需要携带加密参数才可以正常获取数据,那这时候就需要我们去观察浏览器是怎么对这个数据加密的,根据不同的加密方式去编写相关的代码。

浏览器获取加密参数基本都是执行了js代码,所以我们先需要分析加密的位置和加密的方式。

优志愿案例

1701353293889.png
1701353308712.png
1701353313508.png

post请求需要携带参数,并且不是携带表单数据,而是请求载荷,表单数据和请求载荷的区别在于请求的

  1. 表单数据:表单数据通常是通过HTML表单提交的用户输入数据。当用户在网页上填写表单并点击提交按钮时,浏览器会将表单数据封装为一个HTTP POST请求,并将数据作为请求体(Request Body)的一部分发送到服务器。表单数据通常使用键值对(Key-Value)的形式来表示,其中键表示表单字段的名称,值表示用户输入的内容。


    1701353418236.png

    2.请求载荷(Payload):请求载荷是指在HTTP请求中传递的任意数据。与表单数据不同,请求载荷可以是各种形式的数据,如JSON、XML、二进制数据等。


    1701353429051.png
1701353459948.png

并且通过抓取数据包可以发现第一页和第二页的请求中,u-sign的值不一样,也就意味着,如果使用python代码模拟请求,就没有办法使用同一个u-sign值去请求到结果

url = 'https://uwf7de983aad7a717eb.youzy.cn/youzy.dms.basiclib.api.college.query'
headers = {
    'U-Sign': '643ff9499febb3ee34c95ffe0bb29cb0',# 第一页的u-sign值
    'Content-Type':'application/json'
}
res_data = '{"keyword":"","provinceNames":[],"natureTypes":[],"eduLevel":"","categories":[],"features":[],"pageIndex":1,"pageSize":20,"sort":11}'
# 第一页的请求参数
res = requests.post(url=url,data=res_data,headers=headers)
print(res.text) # 可以获取第一页的数据

但是如果将res_data换为第二页的请求参数

res_data = '{"keyword":"","provinceNames":[],"natureTypes":[],"eduLevel":"","categories":[],"features":[],"pageIndex":2,"pageSize":20,"sort":11}'
# 获取不到数据,因为u-sign发生了改变

找u-sign加密数据的赋值位置

1701353736548.png
1701353747382.png

此时都是匹配的位置,这么多我们可以通过给每个打断点的方式去判断这其中是否生效(断点的作用是在程序执行过程中暂停代码的执行,以便你可以检查程序的状态和调试代码。当程序执行到设置了断点的行时,调试器会中断程序的执行,并进入调试模式,此时你可以逐行执行、观察变量的值、检查程序的执行路径等)

其中发现第三个是会执行的


1701353952735.png
1701354203527.png

n函数就是加密函数


1701354254102.png

联系上下文,可以发现和百度百科中的js md5加密方式很相似,所以基本可以确定为md5加密

测试


1701354336014.png
1701354348424.png

与测试工具中的值是一致,所以确定这个u-sign的值就是通过md5加密出来的。通过以上分析,加密调用n函数,传入的是请求载荷中的字符串+&+9sasji5owng41irkisvtjhlxhmrysrp1固定的值 所以,可以使用python模拟过程

python代码实现

data = '{"keyword":"","provincenames":[],"naturetypes":[],"edulevel":"","categories":[],"features":[],"pageindex":1,"pagesize":20,"sort":11}'
def encryption(data):
    o = data+"&9sasji5owng41irkisvtjhlxhmrysrp1"
    sign = hashlib.md5(o.encode()).hexdigest() # 字符串--》md5--》调用python自带的hashlib.md5方法 传入字节数据 返回对象,用对象.hexdigest()获取最后的md5加密数据
    return sign
sign = encryption(data)

完整代码

import hashlib

import requests

def encryption(data):
    # 前端js在加密的过程中把所有的请求载荷数据都变为了小写再拼接固定的&9sasji5owng41irkisvtjhlxhmrysrp1
    o = data.lower()+'&9sasji5owng41irkisvtjhlxhmrysrp1'
    # md方法需要传入一个参数 看得懂的数据
    # 获取md5加密的值
    sign = hashlib.md5(o.encode()).hexdigest()
    print(sign)
    # 数据返回
    return sign
# 字符串怎么编码?
res_data = '{"keyword":"","provinceNames":[],"natureTypes":[],"eduLevel":"","categories":[],"features":[],"pageIndex":3,"pageSize":20,"sort":11}'
u_sign = encryption(res_data) # 调用加密函数把res_data数据传过去 生成第三页的u-sign

url = 'https://uwf7de983aad7a717eb.youzy.cn/youzy.dms.basiclib.api.college.query'
headers = {
    # 请求中携带md5加密值
    'U-Sign': u_sign,
    'Content-Type':'application/json'
}
# 发送post请求,传递参数
# 请求载荷:
# 表单数据:
res = requests.post(url=url,data=res_data,headers=headers)
data = res.json()
# print(data)
# 获取响应数据
for i in data['result']['items']:
    print(i['cnName'],i['logoUrl'],i['provinceName'])
'''
通过断点发现u-sign代码生成位置
"u-sign": o(e.url, e.data)==>643ff9499febb3ee34c95ffe0bb29cb0,
o对应的是js中的一个函数 ,传入了两个参数,e.url="/youzy.dms.basiclib.api.college.query"
e.data =  请求载荷中的参数


o = "{"keyword":"","provincenames":[],"naturetypes":[],"edulevel":"","categories":[],"features":[],"pageindex":1,"pagesize":20,"sort":11}&9sasji5owng41irkisvtjhlxhmrysrp1"

n(o) 调用n函数传入o参数:"{"keyword":"","provincenames":[],"naturetypes":[],"edulevel":"","categories":[],"features":[],"pageindex":1,"pagesize":20,"sort":11}&9sasji5owng41irkisvtjhlxhmrysrp1"
n对应的是md5加密函数

如何在请求的时候带上变动的u-sign 
在python中实现md5加密
'''
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,589评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,615评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,933评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,976评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,999评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,775评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,474评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,359评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,854评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,007评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,146评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,826评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,484评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,029评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,153评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,420评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,107评论 2 356

推荐阅读更多精彩内容