爬虫技术——抓取滴滴打车优惠券
本文介绍如何抓取滴滴打车优惠券
一、数据来源
券妈妈。
二、抓取方法
使用simple_html_dom的方式先抓取整个页面,再进行元素分析。
实现代码如下
<?php header("Content-type: text/html; charset=utf-8"); require_once('simple_html_dom.php');$index = 0;$total = 0;$html = file_get_html('http://www.quanmama.com/quan/1718911.html');$html_bj_content = $html->find('table tbody', 0);echo $html_bj_content;foreach($html_bj_content->find('tr') as $item) {$title = $item->find('td', 0)->plaintext;$source = $item->find('td a', 0)->href;// echo $source;$total ++;if (false == stristr($source, "gsactivity.diditaxi.com.cn/gulfstream/activity/v2/giftpackage")){continue;}else{try {$channels = explode('g_channel=',$source);$data = array('title' => $title,'source' => "https://gsactivity.diditaxi.com.cn/gulfstream/activity/v2/giftpackage/index?g_channel=".$channels[1],'channel' => $channels[1]);// var_dump($data); $diditrip = M('diditrip','tp_');$isadd = $diditrip ->add($data);if ($isadd){$index ++;}} catch (\Exception $e) {// $res = array("code" => "error", "message" => "数据库错误"); }}}// $this->success('同步'.$total.'条,成功'.$index."条",'index');?>
转载于:https://www.cnblogs.com/txw1958/p/crawler-didi.html
爬虫技术——抓取滴滴打车优惠券相关推荐
- python爬网页数据用什么_初学者如何用“python爬虫”技术抓取网页数据?
原标题:初学者如何用"python爬虫"技术抓取网页数据? 在当今社会,互联网上充斥着许多有用的数据.我们只需要耐心观察并添加一些技术手段即可获得大量有价值的数据.而这里的&quo ...
- java 获取邮编_java利用爬虫技术抓取(省、市(区号\邮编)、县)数据
/** * @param var 城市名称 * @returnstring数组.0表示邮编1表示区号 */ @SuppressWarnings("deprecation") pri ...
- Python爬虫实战---抓取图书馆借阅信息
Python爬虫实战---抓取图书馆借阅信息 原创作品,引用请表明出处:Python爬虫实战---抓取图书馆借阅信息 前段时间在图书馆借了很多书,借得多了就容易忘记每本书的应还日期,老是担心自己会违约 ...
- 基于Java的网络爬虫实现抓取网络小说(一)
基于Java的网络爬虫实现抓取网络小说(一) 今天开始写点东西,一方面加深印象一方面再学习. 网络爬虫(Web crawler),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,它们被广泛用 ...
- Python爬虫:抓取智联招聘岗位信息和要求(进阶版)
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:王强 ( 想要学习Python?Python学习交流群 ...
- 爬虫数据抓取怎么弄?
爬虫数据抓取是一种自动化的数据采集技术,可以快速.高效地从互联网上获取大量的数据.本文将介绍爬虫数据抓取的基本原理.常用的爬虫框架和工具.爬虫数据抓取的注意事项以及爬虫数据抓取的应用场景. 一.爬虫数 ...
- python抓取网页电话号码_利用正则表达式编写python 爬虫,抓取网页电话号码!...
利用正则表达式编写python 爬虫,抓取网页联系我们电话号码!这里以九奥科技(www.jiuaoo.com)为例,抓取'联系我们'里面的电话号码,并输出. #!/usrweilie/bin/pyth ...
- python简单爬虫代码-python爬虫超简单攻略,带你写入门级的爬虫,抓取上万条信息...
原标题:python爬虫超简单攻略,带你写入门级的爬虫,抓取上万条信息 最近经常有人问我,明明看着教程写个爬虫很简单,但是自己上手的时候就麻爪了...那么今天就给刚开始学习爬虫的同学,分享一下怎么一步 ...
- Google爬虫如何抓取JavaScript的?
博客转移,点击进入:Google爬虫如何抓取JavaScript的? 我在公众号里写了很多SAP的文章 有兴趣可以关注一下 公众号:SAP Technical
最新文章
- 魔改Attention大集合
- TCP流嗅探和连接跟踪工具tcpick
- idea 构建spring_以Spring方式构建企业Java应用程序
- PrimeFaces Extensions中的全新JSF组件
- easyui,layui和 vuejs 有什么区别
- RabbitMQ单机瞎玩(1)
- 清华MBZUAICMU牛津提出DenseCLIP,用上下文感知的提示进行语言引导密集预测!代码已开源!...
- 如何在一个月内让QQ农场冲上40级
- 外军网络空间作战简报
- HTTP请求/响应原理
- java pojo属性,java中的POJO类属性建议使用包装数据类型
- 红​字​和​蓝​字​冲​销(红字冲正、蓝字冲正)
- 小程序模板网站平台_小程序模板平台哪个好
- 关于EasyRecovery工具数据恢复的原理
- 使用强化学习快速让AI学会玩贪食蛇游戏(轻量级二十分钟训练+代码)
- Django 中引入bootstrap的方法
- Python编程——Python基础知识之列表(-)
- 那天我看着一群老炮怒放 -- zhangchu
- CSS基础-01-基础认知
- 外星人系统下载Alienware X17R2系统dell原厂预装版 WIN11-21H2外星人原厂WIN11系统下载,附创建带F12 SupportAssist OS Recovery恢复功能教程
热门文章
- 平板电脑什么牌子好?看完这组图片更爱他了
- QSqlDatabase: QMYSQL driver not loaded
- 猿创征文|那些少见但好用的软件开发工具
- CDCM61002的原理图以及实测
- 数据结构 绪论 我想静静
- JabRef 源码分析
- 4D成像雷达风口,谁在快速崛起?
- 抖音账号你了解几种玩法以及实操揭秘
- 【STM32F407的DSP教程】第37章 STM32F407的FIR低通滤波器实现(支持逐个数据的实时滤波)
- 【3D目标检测】SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation