PHP获取远程文件的几种方式


layout: post
title: "PHP获取远程文件的几种方式"
date: 2016-05-18 14:18:15 +0800
comments: true
categories: [php]


接上次的内容,今天结合代码来分析下PHP获取远程文件的几种方式。

  • fopen
    • 获取本地文件
    • 获取到的资源绑定到一个流上面
  • file_get_centents
    • 获取一些Get获得的数据,也可以POST,
    • 可以做断点续传
  • socket
  • curl
    • 可以保存cookie 并且在下一次发送出去
    • 做模拟登陆

fopen

<?php 
    require_once('common.php');
    echo "<h2>fopen获取文件测试</h2>";
    /*fopen打开本地文件*/
    $filename="test.html";
    $fp=fopen($filename,"r+");//r+ 只读,+表示如果不存在则创建
    $fc="";
    while(!feof($fp)){
        $fc.=fgets($fp,1024);//获取到的资源绑定到流上。这样来获取流数据
        }
    fclose($fp);
    echo "<h4>输出http_response_header</h4>";
    dumpout($http_response_header); 
    echo "<h3>本地文件:".$fc."</h3>";
    
    /*fopen打开远程url*/
    $filename="http://localhost/Login/02/test.html";
    $fp=fopen($filename,"r");
    echo "<h4>输出stream_get_meta_data</h4>";
    dumpArr(stream_get_meta_data($fp));
    $fc="";
    while(!feof($fp)){
        $fc=fgets($fp,1024);
        }
    fclose($fp);
    echo "<h4>输出http_response_header</h4>";
    dumpout($http_response_header);
    echo "<h3>远程url:".$fc."</h3>";
 
?>

file_get_centents

<?php 
    require_once('common.php');
    echo "<h2>file_get_contents获取文件测试</h2>";
    /*file_get_contents打开本地文件*/
    $filename="test.html";
    $fc=file_get_contents($filename);
    echo "<h3>本地文件:".$fc."</h3>";
    
    /*fopen打开远程url  get方法*/
    $filename="http://localhost/Login/02/test.php";
    $fc=file_get_contents($filename);
    echo "<h4>输出http_response_header</h4>";
    dumpout($http_response_header);   
    echo "<h3>get方法获取远程url:".$fc."</h3>";
    
    /*fopen打开远程url  post方法*/
    $filename="http://localhost/Login/02/test.php";
    /*构建请求头信息*/
    $post = array ('type' => '1');
    $content = http_build_query($post);
    $content_length = strlen($content);
    $options = array(
        'http' => array(
            'method' => 'POST',
            'header' =>
            "Content-type: application/x-www-form-urlencoded\r\n" .
            "Content-length: $content_length\r\n",
            'content' => $content
        )
    );
    $fc = file_get_contents($filename, false, stream_context_create($options));
    echo "<h4>输出http_response_header</h4>";
    dumpout($http_response_header);   
    echo "<h3>post方法获取远程url:".$fc."</h3>";
    
 
?>

socket

<?php 
    require_once('common.php');
    /*Accept: */
    /*  Accept-Language: zh-cn,en-us;q=0.5
        Content-Type: application/x-www-form-urlencoded
        /*模拟浏览器信息*/
        User-Agent: Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; .NET CLR 1.0.3705; .NET CLR 1.1.4322)
        Host: 要发送到的主机地址
        Content-Length: 发送数据的长度
        Pragma: no-cache
        Cache-Control: no-cache
        username=php&password=iask   //post发送的数据
     *
     */
    
    
    /*fsocket模拟get提交*/
    echo "<h2>fsocket模拟get提交</h2>";
    $url="http://localhost/Login/02/test.php?type=1";
    $info = parse_url($url);  
    $fp = fsockopen($info["host"], 80, $errno, $errstr, 3);  
    $head = "GET ".$info['path']."?".$info["query"]." HTTP/1.0\r\n";  
    $head .= "Host: ".$info['host']."\r\n";  
    $head .= "\r\n";  
    $write = fputs($fp, $head);  
    while (!feof($fp)){  
        $line = fgets($fp); 
        echo $line."<br>";  
        }
    
    /*fsocket模拟post提交*/
    echo "<h2>fsocket模拟post提交</h2>";
    $query="type=1";
    $info = parse_url($url);  
    $fp = fsockopen($info["host"], 80, $errno, $errstr, 3);  
    $head = "POST ".$info['path']." HTTP/1.0\r\n";  
    $head .= "Host: ".$info['host']."\r\n";  
    $head .= "Referer: http://".$info['host'].$info['path']."\r\n";  
    $head .= "Content-type: application/x-www-form-urlencoded\r\n";  
    $head .= "Content-Length: ".strlen(trim($query))."\r\n";  
    $head .= "\r\n";  
    $head .= trim($query);  
    $write = fputs($fp, $head);  
    while (!feof($fp))  {  
        $line = fgets($fp);  
        echo $line."<br>";  
        }
?>

cURL

<?php 
    require_once('common.php');
    /*curl模拟get提交*/
    echo "<h2>curl模拟get提交</h2>";
    $url="http://localhost/Login/02/test.php?type=1";

    //初始化
    $ch=curl_init();
    //设置选项,包括URL
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_HEADER, 0); 
    //执行并获取HTML文档内容
    $output = curl_exec($ch); 
    echo "<h2>输出curl_getinfo相关信息</h2>";
    $info = curl_getinfo($ch);
    dumpArr($info);
    //释放curl句柄
    curl_close($ch); 
    //打印获得的数据
    print_r($output);
 
 
    echo "<h2>curl模拟post提交</h2>";
    $url="http://localhost/Login/02/test.php";
    $post_data = array ("type" => "1");
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    // post数据
    curl_setopt($ch, CURLOPT_POST, 1);
    // post的变量
    curl_setopt($ch, CURLOPT_POSTFIELDS, $post_data);
    $output = curl_exec($ch);
    echo "<h2>输出curl_getinfo相关信息</h2>";
    $info = curl_getinfo($ch);
    dumpArr($info);
    curl_close($ch);
    //打印获得的数据
    print_r($output);
?>

上面的文件引用的common.php

<?php 
header("Content-type:text/html;charset:utf-8");
/*获取当前访问用户IP*/
function GetIP(){ 
    if (getenv("HTTP_CLIENT_IP") && strcasecmp(getenv("HTTP_CLIENT_IP"), "unknown")){
        $ip = getenv("HTTP_CLIENT_IP"); 
        }
    else if (getenv("HTTP_X_FORWARDED_FOR") && strcasecmp(getenv("HTTP_X_FORWARDED_FOR"), "unknown")) {
        $ip = getenv("HTTP_X_FORWARDED_FOR"); 
        }
    else if (getenv("REMOTE_ADDR") && strcasecmp(getenv("REMOTE_ADDR"), "unknown")) {
        $ip = getenv("REMOTE_ADDR"); 
        }
    else if (isset($_SERVER['REMOTE_ADDR']) && $_SERVER['REMOTE_ADDR'] && strcasecmp($_SERVER['REMOTE_ADDR'], "unknown")) {
        $ip = $_SERVER['REMOTE_ADDR']; 
        }
    else {
    $ip = "unknown"; 
        }
    return($ip); 
}
 /*格式化header*/
function parseHeaders( $headers ){
    $head = array();
    foreach( $headers as $k=>$v ){
        $t = explode( ':', $v, 2 );
        if( isset( $t[1] ) ){
            $head[ trim($t[0]) ] = trim( $t[1] );
            }
        else{
            $head[] = $v;
            if( preg_match( "#HTTP/[0-9\.]+\s+([0-9]+)#",$v, $out ) ){
                $head['reponse_code'] = intval($out[1]);
                }
            }
        }
    return $head;
}
/*数组格式化输出header*/
function dumpout($vars, $label = '', $return = false) {
    $vars=parseHeaders($vars);
    if (ini_get('html_errors')) {
        $content = "<pre>\n";
        if ($label != '') {
            $content .= "<strong>{$label} :</strong>\n";
        }
        $content .= htmlspecialchars(print_r($vars, true));
        $content .= "\n</pre>\n";
    } else {
        $content = $label . " :\n" . print_r($vars, true);
    }
    if ($return) { return $content; }
    echo $content;
    return null;
}
/*数组格式化输出arr*/
function dumpArr($vars, $label = '', $return = false) {
    if (ini_get('html_errors')) {
        $content = "<pre>\n";
        if ($label != '') {
            $content .= "<strong>{$label} :</strong>\n";
        }
        $content .= htmlspecialchars(print_r($vars, true));
        $content .= "\n</pre>\n";
    } else {
        $content = $label . " :\n" . print_r($vars, true);
    }
    if ($return) { return $content; }
    echo $content;
    return null;
}
?>


以上几种方式用得较为多的是cURl,因为它可以保存COOKIE的特性,在PHP的网络爬虫中都离不开它。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容