首页 / PHP / 使用phpQuery采集网页的方法

使用phpQuery采集网页的方法

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了使用phpQuery采集网页的方法，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1929字，纯文字阅读大概需要3分钟。

内容图文

phpQuery是一个基于PHP的服务端开源项目，它可以让PHP开发人员轻松处理DOM文档内容，比如获取某新闻网站的头条信息。更有意思的是，它采用了jQuery的思想，你可以像使用jQuery一样处理页面内容，获取你想要的页面信息。
采集头条
先看一实例，现在我要采集新浪网国内新闻的头条，代码如下：
代码如下:
include 'phpQuery/phpQuery.php';
phpQuery::newDocumentFile('//www.gxlcms.com');
echo pq(".blkTop h1:eq(0)")->html();

简单的三行代码，就可以获取头条内容。首先在程序中包含phpQuery.php核心程序，然后调用读取目标网页，最后输出对应标签下的内容。
pq()是一个功能强大的方法，跟jQuery的$()如出一辙，jQuery的选择器基本上都能使用在phpQuery上，只要把“.”变成“->”。如上例中，pq(“.blkTop h1:eq(0)”)抓取了页面class属性为blkTop的DIV元素，并找到该DIV内部的第一个h1标签，然后用html()方法获取h1标签里的内容（带html标签），也就是我们要获取的头条信息，如果使用text()方法，则只获取头条的文本内容。当然要使用好phpQuery，关键是要找对文档中对应内容的节点。
采集文章列表
下面再来看一个例子，获取helloweba.com网站的blog列表，请看代码：
代码如下:
include 'phpQuery/phpQuery.php';
phpQuery::newDocumentFile('//www.gxlcms.com');
$artlist = pq(".blog_li");
foreach($artlist as $li){
   echo pq($li)->find('h2')->html()."";
}

通过循环列表中的DIV，找出文章标题并输出，就是这么简单。
解析XML文档
假设现在有一个这样的test.xml文档：
代码如下:
<?xml version="1.0" encoding="utf-8"?>
<root>
<contact>
     <name>张三</name>
     <age>22</age>
</contact>
<contact>
     <name>王五</name>
     <age>18</age>
</contact>
</root>

现在我要获取名字为张三的联系人的年龄，代码如下：
代码如下:
include 'phpQuery/phpQuery.php';
phpQuery::newDocumentFile('test.xml');
echo pq('contact > age:eq(0)');
结果输出：22

像jQuery一样，精准查找文档节点，输出节点下的内容，解析一个XML文档就是这么简单。现在你不必为采集网站内容而使用那些头疼的正则算法、内容替换等繁琐的代码了，有了phpQuery，一切就变得轻松多了。
phpquery项目官网地址：http://code.google.com/p/phpquery/

内容总结

以上是互联网集市为您收集整理的使用phpQuery采集网页的方法全部内容，希望文章能够帮你解决使用phpQuery采集网页的方法所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/269251.html

来源：【匿名】

【上一篇】保存到桌面、设为桌面且带图标的PHP代码【下一篇】PHP 5 数据对象 (PDO) 抽象层与 Oracle

更多 ►

【使用phpQuery采集网页的方法】教程文章相关的互联网学习教程文章

php使用phpquery爬虫速度太慢怎么解决【图】

1、在网站根目录中创建文件夹phpQuery，打开我们下载的phpQuery，将以下内容拷贝之我们创建的目录中：2、在phpQuery文件夹中创建index.php（为什么？大家可以思考一下），在index.php中写入以下代码：3、打开浏览器输入链接http://localhost/phpQuery/index.php，得到以下结果：4、但是phpQuery有一个缺点是无法抓取https地址内容，例如我们将index.php中的http://www.baidu.com 改成https://www.baidu.com，重新执行并查看：推荐教...

TP3.2引入phpquery文件实例分享【图】

一、放在ThinkPHP框架该目录下控制器里写法控制器里如何使用?// 导入phpQuery Vendor(phpQuery.phpQuery);$doc = \phpQuery::newDocumentHTML($fileContent);相关推荐：phpQuery接收微信公众号链接地址有问题用phpQuery像jquery一样解析html代码使用phpQuery采集网页的方法_PHP教程以上就是TP3.2引入phpquery文件实例分享的详细内容，更多请关注Gxl网其它相关文章！

用phpQuery像jquery一样解析html代码

简介如何在php中方便地解析html代码，估计是每个phper都会遇到的问题。用phpQuery就可以让php处理html代码像jQuery一样方便。项目地址：https://code.google.com/p/phpquery/ github地址：https://github.com/TobiaszCudnik/phpquery DEMO 下载库文件：https://code.google.com/p/phpquery/downloads/list 我下的是onefile版：phpQuery-0.9.5.386-onefile.zip 官方demo：https://code.google.com/p/phpquery/source/browse/branc...

自己写的一个php基于phpQuery的通用采集类

还是小菜，第一次分享代码哈，这是自己以前写的一个php的采集类，自己一直在用，自我感觉很简单很强大，只要懂一点点选择器的知识就可以采集任何页面了，也支持https页面，做简单的采集足够用了。 <?php /** *通用列表采集类 *版本V1.3 *作者:JAE *博客:http://blog.jaekj.com */ require_once ../phpQuery/phpQuery/phpQuery.php; class QueryList{ private $pageURL; private $regArr = arra...

一个基于phpQuery的php通用采集类分享_PHP教程

一、采集类源码代码如下: /** *通用列表采集类 *版本V1.3 *作者:JAE */ require_once '../phpQuery/phpQuery/phpQuery.php'; class QueryList{ private $pageURL; private $regArr = array(); public $jsonArr = array(); private $regRange; private $html; /************************************************ * 参数: 页面地址选择器数组块选择器 ...

使用phpQuery采集网页的方法_PHP教程

phpQuery占用内存过多的处理方法_PHP教程

phpQuery是一个用php实现的类似jQuery的开源项目，可以在服务器端以jQuery的语法形式解析网页元素。相对于正则或其它方式匹配网页方式，phpQuery使用起来要方便的多。在使用phpQuery采集网页时，遇到一个问题：在处理大量网页之后，phpQuery占用的内存数量非常惊人（很快就超过了1G)，比如这段代码：代码如下:while (true) { phpQuery::newDocumentFile($htmlFile); // 处理网页元素... echo memory_get_usage() . "\n"...

phpQuery让php处理html代码像jQuery一样方便，phpqueryjquery_PHP教程【图】

phpQuery让php处理html代码像jQuery一样方便，phpqueryjquery 简介如何在php中方便地解析html代码，估计是每个phper都会遇到的问题。用phpQuery就可以让php处理html代码像jQuery一样方便。项目地址：https://code.google.com/p/phpquery/ github地址：https://github.com/TobiaszCudnik/phpquery DEMO 下载库文件：https://code.google.com/p/phpquery/downloads/list 我下的是onefile版：phpQuery-0.9.5.386-onefile.zip 官方de...

用phpQuery像jquery一样解析html代码，phpqueryjquery_PHP教程

用phpQuery像jquery一样解析html代码，phpqueryjquery简介如何在php中方便地解析html代码，估计是每个phper都会遇到的问题。用phpQuery就可以让php处理html代码像jQuery一样方便。项目地址：https://code.google.com/p/phpquery/ github地址：https://github.com/TobiaszCudnik/phpquery DEMO 下载库文件：https://code.google.com/p/phpquery/downloads/list 我下的是onefile版：phpQuery-0.9.5.386-onefile.zip 官方demo：http...

用phpquery采集的问题【图】

我用phpquery采集网页的内容以下是 phpQuery::newDocumentFile($url); $img=pq(.productImageGrid #prodImageCell)->html();echo $img;$img_txt=pq(.productImageGrid #prodImageCell)->text(); $img_txt是空值，没内容 $img 不管是echo还是print_r都是显示图片请问$img怎么转成字符串，我需要存入数据库。以上为浏览器里面显示的代码，我就想这些代码存入数据库。回复讨论(解决方案) &ran...

phpQuery数据抓取疑问

我想使用phpQuery 抓取某东产品的名字和价格，能取到产品名称，不能取到价格，因为源代码的价格是使用JS输出的，如果用Chrome浏览器审查元素是有价格的，应该怎样取得审查元素里的价格？回复讨论(解决方案) 没人知道吗？是ajax的吧?那就得多一次请求了如果是js代码,那就要用正则去匹配另外phpquery很久没维护了,要高级点的比如css3,html5之类,建议尝试下querypath(当然也不能解决你这个问题) 感谢回答，还...

phpQuery占用内存过多的处理方法

phpQuery占用内存过多的处理方法解决phpQuery占用内存过多的问题 phpQuery是一个用php实现的类似jQuery的开源项目，可以在服务器端以jQuery的语法形式解析网页元素。相对于正则或其它方式匹配网页方式，phpQuery使用起来要方便的多。在使用phpQuery采集网页时，遇到一个问题：在处理大量网页之后，phpQuery占用的内存数量非常惊人（很快就超过了1G)，比如这段代码： while (true) {phpQuery::newDocumentFile($htmlFile);// 处理...

用phpquery采集的有关问题【图】

用phpquery采集的问题我用phpquery采集网页的内容以下是phpQuery::newDocumentFile($url); $img=pq(.productImageGrid #prodImageCell)->html(); echo $img; $img_txt=pq(.productImageGrid #prodImageCell)->text();$img_txt是空值，没内容 $img 不管是echo还是print_r都是显示图片请问$img怎么转成字符串，我需要存入数据库。以上为浏览器里面显示的代码，我就想这些代码存入数据库。分享到：------解决方案-----------------...

-phpQuery采集出现乱码

在线等-phpQuery采集出现乱码关于采集电影天堂出现乱码，求高手帮处理。。。。。。。。header("Content-type: text/html; charset=utf-8");set_time_limit(0); require_once("../phpQuery/phpQuery.php");function shootCodeBug($data){ $data=mb_convert_encoding($data,'ISO-8859-1','gb2312'); return mb_convert_encoding($data,'utf-8','GBK');} phpQuery::newDocumentHTML(shootC...

使用phpQuery轻巧采集网页内容

使用phpQuery轻松采集网页内容phpQuery是一个基于PHP的服务端开源项目，它可以让PHP开发人员轻松处理DOM文档内容，比如获取某新闻网站的头条信息。更有意思的是，它采用了jQuery的思想，你可以像使用jQuery一样处理页面内容，获取你想要的页面信息。采集头条先看一实例，现在我要采集新浪网国内新闻的头条，代码如下：include phpQuery/phpQuery.php; phpQuery::newDocumentFile(http://news.sina.com.cn/china); echo pq(".blkTop...

首页 / PHP / 使用phpQuery采集网页的方法

使用phpQuery采集网页的方法

内容导读

内容图文

内容总结

内容备注

内容手机端

【使用phpQuery采集网页的方法】教程文章相关的互联网学习教程文章

php使用phpquery爬虫速度太慢怎么解决【图】

TP3.2引入phpquery文件实例分享【图】

用phpQuery像jquery一样解析html代码

自己写的一个php基于phpQuery的通用采集类

一个基于phpQuery的php通用采集类分享_PHP教程

使用phpQuery采集网页的方法_PHP教程

phpQuery占用内存过多的处理方法_PHP教程

phpQuery让php处理html代码像jQuery一样方便，phpqueryjquery_PHP教程【图】

用phpQuery像jquery一样解析html代码，phpqueryjquery_PHP教程

用phpquery采集的问题【图】

phpQuery数据抓取疑问

phpQuery占用内存过多的处理方法

用phpquery采集的有关问题【图】

-phpQuery采集出现乱码

使用phpQuery轻巧采集网页内容

QUERY - 相关标签

PHP - 相关标签

采集 - 相关标签

PHP - 技术教程分类

PHP - 最新教程

PHP - 最热教程