反爬虫策略

这篇文章是对上篇的一个实现。虽然已经破解了它再去实现有点不开心。
但作为防止学生暴力的爬页面也比较足够了。

需求

在请求重要接口时要多传一个不太好爬的 authkey 实现反爬虫

authkey 实现

生产authkey， authkey是后端生产的一个随机key，过一段时间会过期使用一次也过期。
从算法池中取2个加密算法对authkey进行加密。
把加密后的authkey, 和对应的2个解密算法返回给前端

前端拿到的代码如下

;
! function() {
    var map = function(arr, f) {
        if (Array.prototype.map) {
            return Array.prototype.map.call(arr, f);
        }
        var result = [];
        for (var i = 0; i < arr.length; i++) { result.push(f(arr[i])); }
        return result;
    };
    // 删除 process 对node设障碍 不影响浏览器
    delete process;
  
    //下发的加密后的authkey
    var result = [32, 50, 103, ..., 312, 632];
    var fun_arr = [f1, f2];

    result = map(result, function(item){
        return String.fromCharCode(item);
    }).join('')

    result = fun_arr[0](result);
    result = fun_arr[1](result);

    callback(new Function('return "' + result + '";'));
}();

前端对代码又进行了解密然后callback

4 . 对整个代码转为unnicode 数组。真正返回给前端的是

// 对上面所有代码进行unicode后返回
eval(
    function(arr, f) {
        if (typeof Array.prototype.map === "function") {
            return arr.map(f)
        }
        var res = [],
            j = 0;
        for (var i = 0, l = arr.length; i < l; i++) { res[j++] = f(arr[i], i, arr) }
        return res
    }(
        [38684, 38658, 38727, 38742, .........., 38735, 38724, 38741],
        function(item) {
            return String.fromCharCode(item - 38625)
        }).join('')
)

5、我们还可以加上混淆代码，环境判断等等障碍但终究无法彻底防范。

前端能做的还是很有限，能起到限制初学者。
真正的预防还是在后端通过访问频率， ip 等来屏蔽。

反爬虫就是程序员的互相伤害，爬的人不要太暴力就好。

最后编辑于：2017.12.04 06:35:16

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

反爬虫策略

反爬虫策略

需求

authkey 实现

相关阅读更多精彩内容

友情链接更多精彩内容