大众点评的爬虫代码(php版本)
1.由于本人是一个php开发,看到很多爬虫工具是python写的,好不容易找到一个php写的。
<?php
set_time_limit(0);
class snap_dianping
{ //抓取的分类,(*)代表页码 static $url = array( "20"=>"http://www.dianping.com/hangzhou/ch10/g215p(*)","21"=>"http://www.dianping.com/hangzhou/ch10/g34032p(*)","22"=>"http://www.dianping.com/hangzhou/ch10/g26481p(*)","23"=>"http://www.dianping.com/hangzhou/ch10/g104p(*)","24"=>"http://www.dianping.com/hangzhou/ch10/g106p(*)","25"=>"http://www.dianping.com/hangzhou/ch10/g107p(*)","26"=>"http://www.dianping.com/hangzhou/ch10/g1338p(*)","27"=>"http://www.dianping.com/hangzhou/ch10/g34055p(*)","28"=>"http://www.dianping.com/hangzhou/ch10/g2714p(*)","29"=>"http://www.dianping.com/hangzhou/ch10/g118p(*)","30"=>"http://www.dianping.com/hangzhou/ch10/g1783p(*)","31"=>"http://www.dianping.com/hangzhou/ch10/g25474p(*)"); static $result = array(); static function snap_list($url,$typename='') { $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36"); curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_TIMEOUT, 10);
// curl_setopt($ch, CURLOPT_POSTFIELDS, "form_email=".urlencode($a)."&form_password=$b"); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
// curl_setopt($ch, CURLOPT_COOKIEJAR, $d); $w = curl_exec($ch); curl_close($ch); return $w; } static function snap_page() { foreach (self::$url as $key=>$val) { echo $key."<br/>"; $Page = 1; $t = true; while ($t) { $u = str_replace('(*)', $Page, $val); flush(); $get = self::snap_list($u, $key); file_put_contents("/data/www/html/xuechaozhang/html_page/$key/$Page.txt", $get);sleep(30); $Page++; if($Page == 50){break;}} } return self::$result; } static function snap_geo($Address) { $data = array(); $googleAPI = "http://maps.google.com/maps/geo?output=json&oe=utf8&q=".urlencode($Address); $w['lat'] = ''; $w['lon'] = ''; //$w = json_decode(@file_get_contents($googleAPI)); $data['lat'] = $w->Placemark[0]->Point->coordinates[0]; $data['lon'] = $w->Placemark[0]->Point->coordinates[1]; return $data; }
}
date_default_timezone_set('Asia/Shanghai'); snap_dianping::snap_page();
?>
大众点评的爬虫代码(php版本)相关推荐
- python爬取大众点评数据_利用Node.js制作爬取大众点评的爬虫
前言 Node.js天生支持并发,但是对于习惯了顺序编程的人,一开始会对Node.js不适应,比如,变量作用域是函数块式的(与C.Java不一样):for循环体({})内引用i的值实际上是循环结束之后 ...
- python爬虫大众点评_python爬虫——按城市及店铺面爬取大众点评分类
题外话:因为最近遇到很多标签要对其进行分类,其中很多是店铺名,所以就想爬取大众点评的分类信息.因为不是专门做爬虫的,所以下面这段代码仅仅是可以实现要求,如何能避免网站的反爬机制这一点就无能无力了.另外 ...
- 【大众点评评论爬虫】一键获取大众点评完整评论工具批量爬取保存为excel数据
大众点评评论采集服务 服务v:spider_bj 与原网页对比 服务v:spider_bj
- python爬取大众点评_Python爬虫,获取大众点评上海地区的餐饮信息!
需求:获取大众点评官网上上海地区的全部餐饮信息(店名,商圈,星级,评论数,人均数,口味评分,环境评分,服务评分,地址,电话等信息) 分析:餐饮种类分为18种,每一种下面又有子分类! 接着我们拿一个种类 ...
- 大众点评超实用爬虫系列4
大家期待的大众点评系列终于更新啦!! 在上一节中我们已经学会通过xpath或者css选择器来对区域名所对应的节点进行定位,并且成功的获取到了我们所需要区域名所对应的url链接. 至此,我们已经成功的获 ...
- 大众点评数据,大众点评商家数据 ,大众点评2023爬虫
大众点评2023年7月商家数据,大众点评商家数据,几乎包含所有字段
- python爬大众点评手机号_Python爬虫丨大众点评数据爬虫教程(1)
方式二: 需要安装fontTools包,没安装的请(pip install fontTools) from fontTools.ttLib import TTFont def get_xml(self ...
- 为了部落 来自艾泽拉斯勇士的python爬虫学习心得 爬取大众点评上的各种美食数据并进行数据分析
为了希尔瓦娜斯 第一个爬虫程序 csgo枪械数据 先上代码 基本思想 问题1 问题2 爬取大众点评 URL分析 第一个难题 生成csv文件以及pandas库 matplotlib.pyplot库 K- ...
- 美团技术分享:大众点评App的短视频耗电量优化实战
美团技术专栏: 关注MAYOU18 前言 美团测试团队负责App的质量保证工作,日常除了App的功能测试以外,还会重点关注App的性能测试.现在大家对手机越来越依赖,而上面各App的耗电量,直接影响了 ...
最新文章
- 使用关键点进行小目标检测
- 我的spark学习之路(三):利用spark做回归分析
- 关于Layout Weight一些使用技巧
- QEventLoop的简单使用(二)
- css引入矢量图标_WEB 项目开发中的图标管理解决方案
- Andriod下音频的相关操作
- python ConfigParser模块详解
- 什么叫侧面指纹识别_正面背面侧面 你手机的指纹识别长在哪?
- 初识TensorFlow
- 24. Element namespaceURI 属性
- Html5 Canvas动画基础碰撞检测的实现
- 共享软件加密的一些误区
- YYKit系列之——YYModel使用
- 正四边形单元刚度矩阵与其尺寸关系
- Fdfs环境搭建及整合Java
- matlab随机抽样模拟,随机抽样一致性算法(matlab)
- 如何更改ElementUI组件的图标大小以及标签属性
- 【Redis学习笔记(九)】之 Redis客户端详解
- android 新浪微博第三方登录,Android的集成新浪微博第三方登录
- 面向对象--接口--接口的例题