用php抓取页面,用正则表达式 获取信息,整理到数组中

// 1.抓取目标网站分析,通过 f12 分析加截的js文件及 DOM结构里寻找 信息列表,通常是json数据格式,包括 api接口文件,js文件,以及script 标签中保存的json数据。

// 2. 直接抓取html文档,通过 css 标签 分析数据格式,用正则表达式过滤目标信息,并进行目标数据整理,包括 标签,标题,内容,图片,链接等信息,

// 3 整理获取到的字符串,

实例

header("Content-Type: text/html;charset=utf8");

$url = 'https://www.jd.com/';

$ch = curl_init();

// 创建一个新cURL资源

curl_setopt($ch, CURLOPT_URL, $url);

// 设置URL

curl_setopt($ch, CURLOPT_TIMEOUT, 30);

// 设置超时限制防止死循环

curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

// 爬取重定向页面

curl_setopt($ch, CURLOPT_AUTOREFERER, 1);

// 自动设置Referer,防止盗链

// curl_setopt($ch, CURLOPT_POST, 1);

// 发送一个常规的Post请求

// curl_setopt($ch, CURLOPT_POSTFIELDS, $data);

// Post提交的数据包

curl_setopt($ch, CURLOPT_HEADER, 0);

// 显示返回的Header区域内容

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

// 要求结果保存到字符串中还是输出到屏幕上

// 禁用SSL证书的验证,就可以解决HTPPS获取不到的问题

curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0);

// 对认证证书来源的检查

curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 0);

// 从证书中检查SSL加密算法是否存在

// curl_setopt($ch, CURLOPT_HTTP_VERSION, CURL_HTTP_VERSION_1_1);

// 默认值,让 cURL 自己判断使用哪个版本。 (强制使用 HTTP/1.1)。

// curl_setopt($ch, CURLOPT_USERAGENT, 'Data');

// 在HTTP请求中包含一个"User-Agent: "头的字符串。

$html = curl_exec($ch);

// 运行cURL,请求URL,把结果复制给变量

if (curl_errno($ch)) {

echo 'Errno' . curl_error($curl);

//捕抓异常

}

curl_close($ch);

// 关闭cURL连接

// 用正则表达式 匹配cate_menu_lk 开头的 信息到数组

$pattem = '/(cate_menu_lk)(.*)(?)/';

preg_match_all($pattem, $html, $match);

// 整理获取到的字符串,

foreach ($match[2] as $v) {

//  获取/后面的内容

$v = strstr($v, '/');

//  去掉 /

$v = ltrim($v, '/');

//  用"> 分割字符串

$v = explode('">', $v);

echo '商品名称:' . $v[1] . '网址:' . $v[0] . '
';

}

运行实例 »

点击 "运行实例" 按钮查看在线实例

php获取京东列表,1018 获取京东商品列表和网址 20191018 2000-2200相关推荐

  1. html怎么做商品列表,纯js实现商品列表功能

    商品列表 功能需求:根据数据创建商品列表 来看一下效果: html结构:模拟商品数据,根据数据实例化Main对象. goodsList import Main from './js/Main.js'; ...

  2. 列表用法:格式化商品列表、商品添加到购物车

    一. 循环names列表,打印每个元素的索引值和元素,当索引值为偶数时,把对应的元素改成-1. 思路: 可以用enumerate()   # 枚举 names = ['old_driver', 'ra ...

  3. 【小程序项目开发-- 京东商城】uni-app之商品列表页面 (下)

  4. 【小程序项目开发-- 京东商城】uni-app之商品列表页面 (上)

  5. 使用HttpClient和Jsoup爬取京东商城关键字搜索的商品页面

    使用HttpClient可以创建浏览器对象,然后对页面数据进行抓取,另外再使用Jsoup库解析Html页面.因为Jsoup和JQuery一样有选择器获取元素的方式,所以抓取页面数据变得非常方便. 例如 ...

  6. 美多商城之商品(商品列表页)

    四.商品列表页 4.1 商品列表页分析 4.1.1. 商品列表页组成结构分析 1.商品频道分类 已经提前封装在contents.utils.py文件中,直接调用即可. 2.面包屑导航 可以使用三级分类 ...

  7. (转)淘淘商城系列——MyBatis分页插件(PageHelper)的使用以及商品列表展示

    http://blog.csdn.net/yerenyuan_pku/article/details/72774381 上文我们实现了展示后台页面的功能,而本文我们实现的主要功能是展示商品列表,大家要 ...

  8. 【精】LintCode领扣算法问题答案:306. 商品列表

    306. 商品列表: 有一个商品列表,该列表是由L1.L2两个子列表拼接而成.当用户浏览并翻页时,需要从列表L1.L2中获取商品进行展示.展示规则如下: 用户可以进行多次翻页,用offset表示用户已 ...

  9. 【VUE】微商城(八)----商品列表,商品详情页

    微商城源码 微商城后端接口项目以及部署说明包含API接口说明文档 1.分类页跳转商品列表 1).在pages文件夹下创建一个goods文件夹,并且在goods文件夹创建一个GoodsListView. ...

  10. 美多商城项目:商品数据库表设计、准备商品数据、首页广告、商品列表页

    一.商品数据库表设计 1.1 SPU和SKU 在电商中对于商品,有两个重要的概念:SPU和SKU 1. SPU介绍 SPU = Standard Product Unit (标准产品单位) SPU是商 ...

最新文章

  1. SSM整合时Maven项目的pom.xml版本兼容的代码备份
  2. 教育机构如何提升在线教育技术能力? | 云+社区技术沙龙
  3. java中报错convension_LambdaConversionException与泛型:JVM错误?
  4. 转发程序无法决定链接类型
  5. BIC无代码绘制差异基因火山图
  6. 21 张让你代码能力突飞猛进的速查表(神经网络、线性代数、可视化等)
  7. VC 2008 Express 编译OpenCV2.0/2.1
  8. python输出print(x+y)_Python语句序列“x='car';y=2;print(x+y)”的输出结果是() (2.0分)_学小易找答案...
  9. linux下查看mysql数据库的字段类型_系统运维|[小白技巧]如何在Linux上检查MySQL数据表的存储引擎类型...
  10. influxdb 统计 每天 指定时间段_抖音短视频什么时间段发布?容易上热门!
  11. oracle的ebs系统,EBS系统简介
  12. NB-IOT+GPS模组
  13. 年终了,大家要小心!
  14. springboot2.3.9使用spring data elasticsearch兼容低版本es(6.X)
  15. 【转载】9个offer,12家公司,35场面试,从微软到谷歌
  16. 【转帖】 嵌入式路线狂人计划--------个人认为。
  17. U盘文件恢复,3个方法恢复教程
  18. 跑跑卡丁车组队竞速赛得分制度问题
  19. CodeForces - 1292C Xenon‘s Attack on the Gangs(思维+dp)
  20. IL2CPP 构建大小优化

热门文章

  1. 微信一键检测单删好友 帮你搞来了!
  2. ESD闸机门禁管理系统的构成
  3. springboot事务回滚报错No qualifying bean of type ‘org.springframework.transaction.TransactionManager‘ avai
  4. Vue----路由(Vue2与Vue3)
  5. 【大数据存储】Java操纵MongoDB练习
  6. 现代计算机相关知识了解农业常识,2015年中国海洋大学095112农业信息化考研大纲...
  7. 企业即时通讯软件的技术功能
  8. Java学习笔记--八种基本数据类型
  9. musical.ly 实习小结3
  10. 三、集成学习——偏差与方差理论