PHP模拟百度蜘蛛,伪造IP爬行网站,附源代码

PHP模拟百度蜘蛛,伪造IP爬行网站,附源代码

<?php
// 关闭PHP报错
error_reporting( E_ALL^E_NOTICE^E_WARNING );

//实现使用curl模拟百度 蜘蛛进行采集
function Go($url){
    $ch = curl_init();
    //随机生成IP
    $ip = rand(0,255).'.'.rand(0,255).'.'.rand(0,255).'.'.rand(0,255) ; // 百度 蜘蛛
    $timeout = 15;
    curl_setopt($ch,CURLOPT_URL,$url);
    curl_setopt($ch,CURLOPT_TIMEOUT,0);
    //伪造百度 蜘蛛IP  
    curl_setopt($ch,CURLOPT_HTTPHEADER,array('X-FORWARDED-FOR:'.$ip.'','CLIENT-IP:'.$ip.'')); 
    //伪造百度 蜘蛛头部
    curl_setopt($ch,CURLOPT_USERAGENT,"Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)");
    curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
    curl_setopt($ch,CURLOPT_HEADER,0);
    curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
    curl_setopt($ch,CURLOPT_SSL_VERIFYPEER,false);
      curl_setopt($ch, CURLOPT_IPRESOLVE, CURL_IPRESOLVE_V4);
    $content = curl_exec($ch);
}

代码转自https://www.52bz.la/4067.html

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1、通过CocoaPods安装项目名称项目信息 AFNetworking网络请求组件 FMDB本地数据库组件 SD...
    阳明AI阅读 16,029评论 3 119
  • 如果你的博客或网站是搭建在付费主机上,如果你是博客或网站的站长,如果你连原始访问日志是什么都不知道,或者对其根本不...
    五米Jared阅读 3,030评论 0 6
  • 最近感觉真的是很丧阿。。。
    ff188ec37c22阅读 109评论 0 1
  • 王_冲阅读 210评论 0 0
  • 每天写作15分钟 3/30 毛毛 人间一趟,看看太阳 世界上每天都有好多故事上演,数亿人生,就有数亿故事,相信每个...
    飞花_毛毛阅读 737评论 0 2