前言

平时开发中可能遇到一个问题。采集网页,小偷程序等等。各种花式秀正则的话,虽然能体现出geek,但是我觉得做事却不够优雅。采集到的网页说白了也是DOM,jQuery各种优雅地获取节点。幸好,有这个类库,帮我们解决了这个,那就是phpQuery.

为什么使用phpQuery

phpQuery是基于php5新添加的DOMDocument。而DOMDocument则是专门用来处理html/xml。它提供了强大的xpath选择器及其他很多html/xml操作函数,使得处理html/xml起来非常方便。

尤其对于新手,看到一堆”不知所云”的字符评凑在一起,有种脑袋都要炸了的感觉。如果要分离的对象没有太明显的特征,正则写起来更是麻烦。

学习成本低,jQuery是PHP程序员的标配,那么懂jQuery的话,是可以无缝衔接的,学习成本几乎为0。选择器,节点,节点信息,over

下载地址

实验

既然开始了,那么就做个实验,比如我们要获取SF的所有标签名称https://segmentfault.com/tags,审查元素,得到部分标签属性。负载均衡

Demo

require("phpQuery.php");//导入phpQuery库

$html = phpQuery::newDocumentFile("https://segmentfault.com/tags");

$hrefList = pq(".tag"); //获取标签为a的所有对象$(".tag")

foreach ($hrefList as $href) {

echo $href->getAttribute("data-original-title"),"
";

}

结果

总结

0.网页采集真特么无脑暴力,成功绕过恶心的正则

1.写法参照jQuery

2.体会Dom的思想

3.此类库并非万金油,更适合网页采集

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

php采集网页,phpQuery采集网页实现代码实例相关推荐

  1. 网页图片采集-网页图片采集软件免费

    一款免费的网页图片采集软件可以采集网页上的各种图片,每个人都可以采集到各种高清图源.支持任意格式的图片采集,只需要导入链接即可批量采集图片. 还有更多的采集方式:输入关键词全网图片采集/任意网站所有图 ...

  2. java 网页采集_java采集网页 抓取网页

    下面是编程之家 jb51.cc 通过网络收集整理的代码片段. 编程之家小编现在分享给大家,也给大家做个参考. import java.io.BufferedReader; import java.io ...

  3. 在Scrapy中如何利用Xpath选择器从网页中采集目标数据——详细教程(下篇)

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 二十四桥明月夜, 玉人何处教吹箫. ...

  4. 天猫php采集列表,QueryList: QueryList是一个基于phpQuery的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了。...

    #QueryList交流社区: http://querylist.cc/ #QueryList文档: http://doc.querylist.cc/ #QueryList交流QQ群:12326696 ...

  5. php网页抓取代码,几种PHP实现网页抓取的程序代码

    网页抓取就像搜索引擎一个可以去自动抓取其它服务器上的内容了,下面我整理的几个php常用做法,大家一起来看看. 抓取某一个网页中的内容,需要对DOM树进行解析,找到指定节点后,再抓取我们需要的内容,过程 ...

  6. JS window对象的top、parent、opener含义介绍 以及防止网页被嵌入框架的代码

    1.top 该变更永远指分割窗口最高层次的浏览器窗口.如果计划从分割窗口的最高层次开始执行命令,就可以用top变量. 2.opener opener用于在window.open的页面引用执行该wind ...

  7. 在线即时通讯工具的网页即时聊天的html代码

    <a target=blank href=tencent://message/?uin=你的QQ号码&Site=您的网站/&Menu=yes><img border= ...

  8. flv 自动播放 html autostart=true,《网页制作之FLV视频播放代码的编写.doc

    <网页制作之FLV视频播放代码的编写 网页制作之FLV视频播放代码的编写解决方案一:编写成js嵌入网页中 直接copy下面代码,修改其中红色部分,即:swf_width.swf_height.t ...

  9. java通过url获取网页内容_Java语言通过URL读取网页数据并保存到本地文件(代码实例)...

    本文主要向大家介绍了Java语言通过URL读取网页数据并保存到本地文件(代码实例),通过具体的内容向大家展示,希望对大家学习JAVA语言有所帮助. Java通过URL读取网页数据并保存到本地文件(代码 ...

最新文章

  1. 使用adb devices命令无法识别夜神模拟器的解决方法
  2. 我是一名Cisco爱好 者
  3. 小tips:JS严格模式(use strict)下不能使用arguments.callee的替代方案
  4. 拍拍网t恤DIY效果
  5. UVa 12012 - Detection of Extraterrestrial(hash)
  6. python工作环境_CentOS7下python工作环境管理
  7. [react] React中如何监听state的变化?
  8. 【原创】论码农的财富修养
  9. 3位高二女生用大数据成功预测地铁出站人数 | 00后正在抛弃你
  10. python标准库学习笔记
  11. 玩机搞机----安卓全机型修改开机第一屏步骤教程
  12. flash绘制荷花多个图层_《荷花》Flash动画课件
  13. eterm php,eterm配置出租 eterm3 eterm黑屏
  14. kubectl edit 与kubectl rollout
  15. 求一个好用的简洁设置的PPT倒计时器
  16. 深度学习之空洞卷积(Dilated/Atrous Convolution)
  17. Northwind中文版Access2000、MSSQL版也适用LinqPad学习
  18. 轻量全面的硬件检测工具——Speccy中文版评测
  19. 博..条码打印机的java开发
  20. php 如何守护进程_PHP 编写守护进程

热门文章

  1. IOS UINavigationController use
  2. 2012年的第一天 自己独自踏上回家的路 木有任何人相送
  3. es6 find 数组内查询用法
  4. ZZUOJ1196: 单调数
  5. Dijkstra算法的思想和数学归纳法
  6. Linux IPC POSIX 消息队列
  7. 近期window7x64 打补丁之后IE11x64无法启动
  8. execl中一串字符,以某个分隔符分开,公式实现
  9. cmd变量,参数,for循环,
  10. 10 Linux引导过程和服务控制