1.由于本人是一个php开发,看到很多爬虫工具是python写的,好不容易找到一个php写的。

<?php
set_time_limit(0);
class snap_dianping
{  //抓取的分类,(*)代表页码  static $url = array(  "20"=>"http://www.dianping.com/hangzhou/ch10/g215p(*)","21"=>"http://www.dianping.com/hangzhou/ch10/g34032p(*)","22"=>"http://www.dianping.com/hangzhou/ch10/g26481p(*)","23"=>"http://www.dianping.com/hangzhou/ch10/g104p(*)","24"=>"http://www.dianping.com/hangzhou/ch10/g106p(*)","25"=>"http://www.dianping.com/hangzhou/ch10/g107p(*)","26"=>"http://www.dianping.com/hangzhou/ch10/g1338p(*)","27"=>"http://www.dianping.com/hangzhou/ch10/g34055p(*)","28"=>"http://www.dianping.com/hangzhou/ch10/g2714p(*)","29"=>"http://www.dianping.com/hangzhou/ch10/g118p(*)","30"=>"http://www.dianping.com/hangzhou/ch10/g1783p(*)","31"=>"http://www.dianping.com/hangzhou/ch10/g25474p(*)");  static $result = array();  static function snap_list($url,$typename='')  {  $ch = curl_init();  curl_setopt($ch, CURLOPT_URL, $url);  curl_setopt($ch, CURLOPT_HEADER, 0);  curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);  curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36");  curl_setopt($ch, CURLOPT_POST, 1);  curl_setopt($ch, CURLOPT_TIMEOUT, 10);
//        curl_setopt($ch, CURLOPT_POSTFIELDS, "form_email=".urlencode($a)."&form_password=$b");  curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
//        curl_setopt($ch, CURLOPT_COOKIEJAR, $d);  $w = curl_exec($ch);  curl_close($ch);  return $w; }  static function snap_page()  {  foreach (self::$url as $key=>$val)  {  echo $key."<br/>";  $Page = 1;  $t = true;  while ($t) {  $u = str_replace('(*)', $Page, $val);  flush();  $get = self::snap_list($u, $key);  file_put_contents("/data/www/html/xuechaozhang/html_page/$key/$Page.txt", $get);sleep(30);  $Page++;  if($Page == 50){break;}}  }  return self::$result;  }  static function snap_geo($Address)  {  $data = array();  $googleAPI = "http://maps.google.com/maps/geo?output=json&oe=utf8&q=".urlencode($Address);  $w['lat'] = '';  $w['lon'] = '';  //$w = json_decode(@file_get_contents($googleAPI));  $data['lat'] = $w->Placemark[0]->Point->coordinates[0];  $data['lon'] = $w->Placemark[0]->Point->coordinates[1];  return $data;  }
}
date_default_timezone_set('Asia/Shanghai');  snap_dianping::snap_page();
?>  

大众点评的爬虫代码(php版本)相关推荐

  1. python爬取大众点评数据_利用Node.js制作爬取大众点评的爬虫

    前言 Node.js天生支持并发,但是对于习惯了顺序编程的人,一开始会对Node.js不适应,比如,变量作用域是函数块式的(与C.Java不一样):for循环体({})内引用i的值实际上是循环结束之后 ...

  2. python爬虫大众点评_python爬虫——按城市及店铺面爬取大众点评分类

    题外话:因为最近遇到很多标签要对其进行分类,其中很多是店铺名,所以就想爬取大众点评的分类信息.因为不是专门做爬虫的,所以下面这段代码仅仅是可以实现要求,如何能避免网站的反爬机制这一点就无能无力了.另外 ...

  3. 【大众点评评论爬虫】一键获取大众点评完整评论工具批量爬取保存为excel数据

    大众点评评论采集服务 服务v:spider_bj 与原网页对比 服务v:spider_bj

  4. python爬取大众点评_Python爬虫,获取大众点评上海地区的餐饮信息!

    需求:获取大众点评官网上上海地区的全部餐饮信息(店名,商圈,星级,评论数,人均数,口味评分,环境评分,服务评分,地址,电话等信息) 分析:餐饮种类分为18种,每一种下面又有子分类! 接着我们拿一个种类 ...

  5. 大众点评超实用爬虫系列4

    大家期待的大众点评系列终于更新啦!! 在上一节中我们已经学会通过xpath或者css选择器来对区域名所对应的节点进行定位,并且成功的获取到了我们所需要区域名所对应的url链接. 至此,我们已经成功的获 ...

  6. 大众点评数据,大众点评商家数据 ,大众点评2023爬虫

    大众点评2023年7月商家数据,大众点评商家数据,几乎包含所有字段

  7. python爬大众点评手机号_Python爬虫丨大众点评数据爬虫教程(1)

    方式二: 需要安装fontTools包,没安装的请(pip install fontTools) from fontTools.ttLib import TTFont def get_xml(self ...

  8. 为了部落 来自艾泽拉斯勇士的python爬虫学习心得 爬取大众点评上的各种美食数据并进行数据分析

    为了希尔瓦娜斯 第一个爬虫程序 csgo枪械数据 先上代码 基本思想 问题1 问题2 爬取大众点评 URL分析 第一个难题 生成csv文件以及pandas库 matplotlib.pyplot库 K- ...

  9. 美团技术分享:大众点评App的短视频耗电量优化实战

    美团技术专栏: 关注MAYOU18 前言 美团测试团队负责App的质量保证工作,日常除了App的功能测试以外,还会重点关注App的性能测试.现在大家对手机越来越依赖,而上面各App的耗电量,直接影响了 ...

最新文章

  1. 使用关键点进行小目标检测
  2. 我的spark学习之路(三):利用spark做回归分析
  3. 关于Layout Weight一些使用技巧
  4. QEventLoop的简单使用(二)
  5. css引入矢量图标_WEB 项目开发中的图标管理解决方案
  6. Andriod下音频的相关操作
  7. python ConfigParser模块详解
  8. 什么叫侧面指纹识别_正面背面侧面 你手机的指纹识别长在哪?
  9. 初识TensorFlow
  10. 24. Element namespaceURI 属性
  11. Html5 Canvas动画基础碰撞检测的实现
  12. 共享软件加密的一些误区
  13. YYKit系列之——YYModel使用
  14. 正四边形单元刚度矩阵与其尺寸关系
  15. Fdfs环境搭建及整合Java
  16. matlab随机抽样模拟,随机抽样一致性算法(matlab)
  17. 如何更改ElementUI组件的图标大小以及标签属性
  18. 【Redis学习笔记(九)】之 Redis客户端详解
  19. android 新浪微博第三方登录,Android的集成新浪微博第三方登录
  20. 面向对象--接口--接口的例题

热门文章

  1. “阿基里斯和乌龟”与逻辑推理的各向异性
  2. 联想小新Air 12鹿晗定制版笔记本评测
  3. 天野第五期易语言半内存辅助培训班教程
  4. 微服务书城(第三天)
  5. Javascript语法精讲——ECMAScript(一)
  6. CSS 纵横比属性 --- aspect-ratio
  7. DML DQL DCL
  8. 低功耗Atom下载机兼Home Server咯
  9. 黑盒测试——nextDate函数测试(等价类划分法、边界值分析法、判定表驱动法)
  10. windows脚本实战