使用phpQuery采集网页数据

phpQuery是一个基于PHP的服务端开源项目,旨在让PHP开发人员轻松获取网页数据,并进行处理,比如获取某天的天气状况。另外,phpQuery遵序jQuery的思想,可以用jQuery中的选择器来对需要内容进行筛选。

phpQuery下载地址

1.流程

抓取数据的主要流程为先引入phpQuery,接着装载文档,最后通过phpQuery内置的pq函数筛选出我们需要的内容。

header("Content-Type:text/html;charset=gbk;");

require("phpQuery/phpQuery.php");  //引入phpQuery

$url = "http://www.w3school.com.cn/";

phpQuery::newDocumentFile($url);  //装载文档

echo pq("h1")->html();  //w3school 在线教程

2.装载文档有很多,这里简单说两种

第一种:

$url = "http://www.w3school.com.cn/";

phpQuery::newDocumentFile($url)

根据目标的url地址,从文件(URL)转载。

第二种:

$url = "http://www.w3school.com.cn/";

$filePath = file_get_contents($url);

phpQuery::newDocumentHTML($filePath);

先用file_get_contents获取网页源代码,然后从标签(字符串)装载文档。

3.pq函数

在装载文档后,我们就获取到一个phpQuery对象,就可以通过pq函数来操作这个phpQuery对象,我们可以和jQuery选择器一样使用pq函数

例如:

pq("#box")->html();

pq(".box:eq(2)")->html();

pq("input[type='text']")->val();

pq(".box")->find("#con")->html();

大家可以依照jQuery的选择器自行尝试。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • <a name='html'>HTML</a> Doctype作用?标准模式与兼容模式各有什么区别? (1)、<...
    clark124阅读 3,603评论 1 19
  • 学习HTML的最佳网站没有之一http://www.w3school.com.cn/html/ 关于HTML/HT...
    Amyyy_阅读 2,159评论 0 16
  • 通过jQuery,您可以选取(查询,query)HTML元素,并对它们执行“操作”(actions)。 jQuer...
    枇杷树8824阅读 676评论 0 3
  • 作为一个前端程序猿,下面这些站会让你眼前一亮。 amazeui框架组建丰富 http://amazeui.org...
    欧巴冰冰阅读 8,942评论 18 303
  • 书中自有藏金屋,这话不假!这本书对于心灵治疗方面提出解决方案,同时也很精辟的指出:阻碍心智成熟的障碍就是...
    徐丽红阅读 745评论 0 1