爬取去哪儿数据

import pymysql
from lxml import etree

#!/usr/bin/env python
# encoding: utf-8
"""
@author: owen.cai
@contact: 1181698715@qq.com
@file: qunarspider.py
@time: 2019/9/30 15:01
"""
import pymysql
from lxml import etree
class qunaer(object):def __init__(self):mysql_info={'host':'localhost','port':3306,'user':'root','password':'123456','db':'test','charset':'utf8','createdbsql':'''create table if not exists  test.qunar(time varchar (50),title varchar (50))'''}print(mysql_info['host'])# url = 'http://travel.qunar.com/travelbook/list.htm?page={0}&order=hot_heat'url='http://travel.qunar.com/travelbook/list.htm'# response=requests.get(url)def mysql_(self,sql):# 打开数据库连接(具体配置信息请自行替换)db = pymysql.Connect(host=self.mysql_info['host'],port=self.mysql_info['port'],user=self.mysql_info['user'],password=self.mysql_info['password'],db=self.mysql_info['db'],charset=self.mysql_info['charset'])# 创建一个游标对象cursor = db.cursor()# print('数据库连接成功')# 执行 SQL 建表语句cursor.execute(sql)db.commit()# print('数据库执行成功')def parse(self,url):response = etree.parse(url, etree.HTMLParser())# print(response)# aa=response.xpath("/html/body/div[2]/div/div[2]/ul/li[1]/p[1]/span[1]/span[3]/text()")times=response.xpath("//span[@class='days']/text()")titles = response.xpath("//h2/a/text()")# title = response.xpath("//aa[@target='_blank']/text()")for time,title in zip(times ,titles):# print(time,title)print('''insert into test.qunar values("{time}","{title}")'''.format(time=time,title=str(title).encode('utf-8')))if title in ("@王鋆鋆[OCT主题乐园3日游]It's Show Time五彩缤纷周末乐悠游","拾童心去珠海长隆海洋王国-邂逅一场神奇的海洋奇缘VS看一场马戏新巨创《龙秀?》","俯天津之眼?,童年动物园?,民国特色馆?游海洋公园?天津亲子3日游?"):continueself.mysql_('''insert into test.qunar values("{time}","{title}")'''.format(time=time,title=str(title).encode('utf-8')))# print(aa)# print(title)
if __name__=="__main__":qunaer=qunaer()for i in range(1,201):print("第{i}页开始".format(i=i))qunaer.parse(qunaer.url.format(i))# try:#     mysql_('select * from  mtime limit 10')#     mysql_(mysql_info['createdbsql'])# except Exception as except_:#     print(except_)#多线程编程 下一步计划,多线程编程

爬取的数据存入mysql

python etree爬取去哪儿数据相关推荐

  1. python selenium 爬取去哪儿网的数据

    python selenium 爬取去哪儿网的数据 完整代码下载:https://github.com/tanjunchen/SpiderProject/tree/master/selenium+qu ...

  2. python selenium爬取去哪儿网的酒店信息——详细步骤及代码实现

    目录 准备工作 一.webdriver部分 二.定位到新页面 三.提取酒店信息 ??这里要注意?? 四.输出结果 五.全部代码 准备工作 1.pip install selenium 2.配置浏览器驱 ...

  3. python+appium爬取微信运动数据,并分析好友的日常步数情况

    python+appium爬取微信运动数据,并分析好友的日常步数情况 声明:仅供技术交流,请勿用于非法用途,如有其它非法用途造成损失,和本博客无关 目录 python+appium爬取微信运动数据,并 ...

  4. python为啥爬取数据会有重复_利用Python来爬取“吃鸡”数据,为什么别人能吃鸡?...

    原标题:利用Python来爬取"吃鸡"数据,为什么别人能吃鸡? 首先,神装镇楼 背景 最近老板爱上了吃鸡(手游:全军出击),经常拉着我们开黑,只能放弃午休的时间,陪老板在沙漠里奔波 ...

  5. python爬虫爬取58网站数据_Python爬虫,爬取58租房数据 字体反爬

    Python爬虫,爬取58租房数据 这俩天项目主管给了个爬虫任务,要爬取58同城上福州区域的租房房源信息.因为58的前端页面做了base64字体加密所以爬取比较费力,前前后后花了俩天才搞完. 项目演示 ...

  6. python 爬虫 表格,python爬虫爬取网页表格数据

    用python爬取网页表格数据,供大家参考,具体内容如下 from bs4 import BeautifulSoup import requests import csv import bs4 #检查 ...

  7. Python+Selenium爬取新浪微博评论数据

    Python+Selenium爬取指定新浪微博的数据 微博分析 微博端类型 选择爬取对象 Ajax动态加载数据分析 Python实现代码 微博分析 微博端类型 首先找到一个待爬取的微博,需要注意的是, ...

  8. Selenium实战之Python+Selenium爬取京东商品数据

    实战目标:爬取京东商品信息,包括商品的标题.链接.价格.评价数量. 代码核心在于这几个部分: 其一:使用元素定位来获取页面上指定需要抓取的关键字: 其二:将页面上定位得到的数据永久存储到本地文件中. ...

  9. python爬取网页代码-python爬虫爬取网页所有数据详细教程

    Python爬虫可通过查找一个或多个域的所有 URL 从 Web 收集数据.Python 有几个流行的网络爬虫库和框架.大家熟知的就是python爬取网页数据,对于没有编程技术的普通人来说,怎么才能快 ...

最新文章

  1. python程序默认执行与多线程
  2. python在线读-Python测试之道
  3. mysql远程服务器返回错误404未找到_远程服务器返回错误: 404错误、远程服务器返回错误:500错误、 HttpWebResponse远程服务器返回错误:(404、500) 错误。...
  4. JS 中迭代数组的三种方法
  5. java状态模式所有情况_轻松掌握Java状态模式
  6. 循环结构程序设计(算法竞赛入门经典)课后题
  7. 操作系统 --- 线程与进程的比较
  8. iPhone的mysql客户端_适用于iPhone的MySQL C API库
  9. 小程序php生成海报,小程序用canvas绘制海报的做法
  10. Winscp使用sudo user登录
  11. ASP.NET 3.5控件和组件开发技术之客户端回发/回调揭密
  12. 2020总结:临渊羡鱼不如退而结网
  13. lucene全文检索包括双层PDF
  14. 计算机的常见故障及解决方法,最全的电脑开机常见故障及解决方法!
  15. windows下cfree5中%d输出浮点数的问题
  16. linux拷贝文件前几行,Linux显示文件前几行、拷贝文件前几行、删除文件前几列...
  17. 2011版MacBook Air win7安装教程
  18. 【读书笔记】《JS函数式编程指南》(一)
  19. 从零开始搭建个人静态简历网站
  20. 计算机房灭火器如何配置,机房灭火器配置标准

热门文章

  1. 逆天好用丨打开新世界的大门
  2. 多态 (多态的用处,意义,应用)
  3. 简易BadUSB,攻击效果不简单
  4. 自由枪骑兵修改服务器端口,自由枪骑兵 Freelancer 更改高分辨率(支持宽屏)方法...
  5. 使用MATLAB进行灰色关联度分析
  6. html原生触发事件,jQ点击事件用原生写的方法.html
  7. multisim对电路的仿真
  8. 人工智能识别图片食物
  9. TicWatch+android studio开发之ADB调试
  10. conda channel代表了什么?