php获取京东列表,1018 获取京东商品列表和网址 20191018 2000-2200
用php抓取页面,用正则表达式 获取信息,整理到数组中
// 1.抓取目标网站分析,通过 f12 分析加截的js文件及 DOM结构里寻找 信息列表,通常是json数据格式,包括 api接口文件,js文件,以及script 标签中保存的json数据。
// 2. 直接抓取html文档,通过 css 标签 分析数据格式,用正则表达式过滤目标信息,并进行目标数据整理,包括 标签,标题,内容,图片,链接等信息,
// 3 整理获取到的字符串,
实例
header("Content-Type: text/html;charset=utf8");
$url = 'https://www.jd.com/';
$ch = curl_init();
// 创建一个新cURL资源
curl_setopt($ch, CURLOPT_URL, $url);
// 设置URL
curl_setopt($ch, CURLOPT_TIMEOUT, 30);
// 设置超时限制防止死循环
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
// 爬取重定向页面
curl_setopt($ch, CURLOPT_AUTOREFERER, 1);
// 自动设置Referer,防止盗链
// curl_setopt($ch, CURLOPT_POST, 1);
// 发送一个常规的Post请求
// curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
// Post提交的数据包
curl_setopt($ch, CURLOPT_HEADER, 0);
// 显示返回的Header区域内容
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
// 要求结果保存到字符串中还是输出到屏幕上
// 禁用SSL证书的验证,就可以解决HTPPS获取不到的问题
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0);
// 对认证证书来源的检查
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 0);
// 从证书中检查SSL加密算法是否存在
// curl_setopt($ch, CURLOPT_HTTP_VERSION, CURL_HTTP_VERSION_1_1);
// 默认值,让 cURL 自己判断使用哪个版本。 (强制使用 HTTP/1.1)。
// curl_setopt($ch, CURLOPT_USERAGENT, 'Data');
// 在HTTP请求中包含一个"User-Agent: "头的字符串。
$html = curl_exec($ch);
// 运行cURL,请求URL,把结果复制给变量
if (curl_errno($ch)) {
echo 'Errno' . curl_error($curl);
//捕抓异常
}
curl_close($ch);
// 关闭cURL连接
// 用正则表达式 匹配cate_menu_lk 开头的 信息到数组
$pattem = '/(cate_menu_lk)(.*)(?)/';
preg_match_all($pattem, $html, $match);
// 整理获取到的字符串,
foreach ($match[2] as $v) {
// 获取/后面的内容
$v = strstr($v, '/');
// 去掉 /
$v = ltrim($v, '/');
// 用"> 分割字符串
$v = explode('">', $v);
echo '商品名称:' . $v[1] . '网址:' . $v[0] . '
';
}
运行实例 »
点击 "运行实例" 按钮查看在线实例
php获取京东列表,1018 获取京东商品列表和网址 20191018 2000-2200相关推荐
- html怎么做商品列表,纯js实现商品列表功能
商品列表 功能需求:根据数据创建商品列表 来看一下效果: html结构:模拟商品数据,根据数据实例化Main对象. goodsList import Main from './js/Main.js'; ...
- 列表用法:格式化商品列表、商品添加到购物车
一. 循环names列表,打印每个元素的索引值和元素,当索引值为偶数时,把对应的元素改成-1. 思路: 可以用enumerate() # 枚举 names = ['old_driver', 'ra ...
- 【小程序项目开发-- 京东商城】uni-app之商品列表页面 (下)
- 【小程序项目开发-- 京东商城】uni-app之商品列表页面 (上)
- 使用HttpClient和Jsoup爬取京东商城关键字搜索的商品页面
使用HttpClient可以创建浏览器对象,然后对页面数据进行抓取,另外再使用Jsoup库解析Html页面.因为Jsoup和JQuery一样有选择器获取元素的方式,所以抓取页面数据变得非常方便. 例如 ...
- 美多商城之商品(商品列表页)
四.商品列表页 4.1 商品列表页分析 4.1.1. 商品列表页组成结构分析 1.商品频道分类 已经提前封装在contents.utils.py文件中,直接调用即可. 2.面包屑导航 可以使用三级分类 ...
- (转)淘淘商城系列——MyBatis分页插件(PageHelper)的使用以及商品列表展示
http://blog.csdn.net/yerenyuan_pku/article/details/72774381 上文我们实现了展示后台页面的功能,而本文我们实现的主要功能是展示商品列表,大家要 ...
- 【精】LintCode领扣算法问题答案:306. 商品列表
306. 商品列表: 有一个商品列表,该列表是由L1.L2两个子列表拼接而成.当用户浏览并翻页时,需要从列表L1.L2中获取商品进行展示.展示规则如下: 用户可以进行多次翻页,用offset表示用户已 ...
- 【VUE】微商城(八)----商品列表,商品详情页
微商城源码 微商城后端接口项目以及部署说明包含API接口说明文档 1.分类页跳转商品列表 1).在pages文件夹下创建一个goods文件夹,并且在goods文件夹创建一个GoodsListView. ...
- 美多商城项目:商品数据库表设计、准备商品数据、首页广告、商品列表页
一.商品数据库表设计 1.1 SPU和SKU 在电商中对于商品,有两个重要的概念:SPU和SKU 1. SPU介绍 SPU = Standard Product Unit (标准产品单位) SPU是商 ...
最新文章
- SSM整合时Maven项目的pom.xml版本兼容的代码备份
- 教育机构如何提升在线教育技术能力? | 云+社区技术沙龙
- java中报错convension_LambdaConversionException与泛型:JVM错误?
- 转发程序无法决定链接类型
- BIC无代码绘制差异基因火山图
- 21 张让你代码能力突飞猛进的速查表(神经网络、线性代数、可视化等)
- VC 2008 Express 编译OpenCV2.0/2.1
- python输出print(x+y)_Python语句序列“x='car';y=2;print(x+y)”的输出结果是() (2.0分)_学小易找答案...
- linux下查看mysql数据库的字段类型_系统运维|[小白技巧]如何在Linux上检查MySQL数据表的存储引擎类型...
- influxdb 统计 每天 指定时间段_抖音短视频什么时间段发布?容易上热门!
- oracle的ebs系统,EBS系统简介
- NB-IOT+GPS模组
- 年终了,大家要小心!
- springboot2.3.9使用spring data elasticsearch兼容低版本es(6.X)
- 【转载】9个offer,12家公司,35场面试,从微软到谷歌
- 【转帖】 嵌入式路线狂人计划--------个人认为。
- U盘文件恢复,3个方法恢复教程
- 跑跑卡丁车组队竞速赛得分制度问题
- CodeForces - 1292C Xenon‘s Attack on the Gangs(思维+dp)
- IL2CPP 构建大小优化
热门文章
- 微信一键检测单删好友 帮你搞来了!
- ESD闸机门禁管理系统的构成
- springboot事务回滚报错No qualifying bean of type ‘org.springframework.transaction.TransactionManager‘ avai
- Vue----路由(Vue2与Vue3)
- 【大数据存储】Java操纵MongoDB练习
- 现代计算机相关知识了解农业常识,2015年中国海洋大学095112农业信息化考研大纲...
- 企业即时通讯软件的技术功能
- Java学习笔记--八种基本数据类型
- musical.ly 实习小结3
- 三、集成学习——偏差与方差理论