爬取 携程旅游网

‘content-type’:‘application/json’,

这个请求头参数是关键

import requests

import json

import re

headers = {

'USER_AGENT': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36',

'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',

'Accept-Language': 'en',

'referer': 'https://vacations.ctrip.com/',

'content-type':'application/json',

'origin': 'https://vacations.ctrip.com',

}

data = {"contentType": "json",

"head": {"cid": "09031030111366754355", "ctok": "", "cver": "1.0", "lang": "01", "sid": "8888", "syscode": "09",

"auth": "", "extension": []}, "version": "80400",

"client": {"trace": "none", "device": "PC", "source": "NVacationSearchV2",

"variables": [{"key": "SHXVERSION", "value": "B"}], "cid": "1605494184427.2ep3s2"},

"poiType": {"poid": 1, "type": "D", "keyword": "北京"},

"filtered": {"sort": 8, "channel": "Online", "tab": "A126", "saleCity": 206, "startCity": 206, "pageSize": 30,

"pageIndex": 2, "items": [{"key": "CHANNEL_ID", "value": "114"}]}, "returnType": {"type": "all",

"filters": "ProductNewLine,ProductLine,HotDestination,HotScenicSpot,SaleDepartureStat,TravelDays,DepartureDate,Month,ProductPattern,ProductLevel,ADSuitPersons,ADServiceCharacteristic,ADIsDirectFlight,ADHotelCharacteristic,ADNLineCharacteristic,ProductDistrict,ProviderBrand,PriceRange,Promotion,OnSale,ADServiceGarantee",

"recommendProduct": True}}

response = requests.post(

'https://vacations.ctrip.com/list/restapi/gateway/13561/search?_fxpcqlniredt=09031030111366754355',

data=json.dumps(data), headers=headers)

print(response.text)

python爬取携程网旅游_爬取携程网(ajax动态加载)相关推荐

  1. python翻页功能url不变_爬取Ajax动态加载和翻页时url不变的网页

    这两天投了一家公司的爬虫实习生,笔试题是完成一个爬虫的小需求.网站没有什么反爬的高级技巧.但是有非常常见的,并不是针对我们爬虫的,却让我们新手很难理解的ajax动态加载技术和乍一看不明白的翻页时不变的 ...

  2. Python爬取东方财富网任意股票任意时间段的Ajax动态加载股票数据

    导言 最近由于需求想爬取以下东方财富网的股票数据,但是发现没有想象那么简单,接下来我会讲述一下我遇到的问题以及是如何解决,最后成功的爬出了想要的数据. 查看网页源码 首先我们F12打开东方财富网网页源 ...

  3. 关于使用scrapy框架编写爬虫以及Ajax动态加载问题、反爬问题解决方案

    关于使用scrapy框架编写爬虫以及Ajax动态加载问题.反爬问题解决方案 参考文章: (1)关于使用scrapy框架编写爬虫以及Ajax动态加载问题.反爬问题解决方案 (2)https://www. ...

  4. 爬取通过ajax动态加载的页面(实时监控华尔街见闻资讯与快讯)

    学习了几天如何使用scrapy去爬取静态网站,今天尝试去爬取动态加载的网站.选取的网站是华尔街见闻,文中不会像往常一样大篇幅讲解每一步该如何做,而是探讨如何爬取. 在源代码中无法获得全部数据(有的根本 ...

  5. python爬虫之Ajax动态加载数据抓取--豆瓣电影/腾讯招聘

    动态加载数据抓取-Ajax 特点 1.右键 -> 查看网页源码中没有具体数据 2.滚动鼠标滑轮或其他动作时加载 抓取 1.F12打开控制台,页面动作抓取网络数据包 2.抓取json文件URL地址 ...

  6. python爬取携程网旅游_爬虫之携程网旅游信息爬取

    最近手又有点闲,闲着无聊就爬取了携程的信息,这个爬虫是我随手写的,各位可以看看. # -*- encoding=utf-8 -*- #爬取携程旅游信息 #2017/8/14 from bs4 impo ...

  7. 爬取携程网(ajax动态加载)

    爬取 携程旅游网 'content-type':'application/json', 这个请求头参数是关键 import requests import json import reheaders ...

  8. python爬虫之动态加载获取药品监督管理局

    本次爬取实现使用request模块爬取国家药品监督管理局的企业信息数据并存入到Excel表格中 爬取目标网站 http://scxk.nmpa.gov.cn:81/xk/# 分析页面: 打开网页查看首 ...

  9. python爬取百度迁徙动态图_爬取动态图片—以百度图片为例

    一:何谓动态加载图片 所谓动态加载图片即指html刚加载时,图片时没有的,然后通过json发生有关图片的数据,在插入到html里面去,以到底快速打开网页的目的,那么问题来了?我们如何找到加载文件的js ...

最新文章

  1. 华为主题包hwt下载_华为主题 | 星黛露
  2. 通过Log4net来配置我们需要的日志文件格式
  3. python中的requests模块的使用大全
  4. Java 的Runnable和Callable的区别
  5. js遍历数组foreach_JavaScript forEach –如何在JS中遍历数组
  6. java中关于线程的状态属性_深入理解Java多线程与并发框(第①篇)——线程的状态...
  7. linux中禁用Root帐户的4种方法
  8. ITIL事件管理流程设计
  9. RACK与重复ACK
  10. 数字信号处理3个作业-----作业3自相关与Burg求解AR模型系数以估计其功率谱
  11. EPMS- 让企业应用更加轻便!
  12. Linux 与 Python编程2021 经典函数实例 educoder实训
  13. 关于此博客更名和改版的说明
  14. 虚拟机CentOS启动报错-entering emergency mode解决办法
  15. 数字认证是做什么的?数字认证有什么用?
  16. Access 密码破解原理- -
  17. 华为无线设备WLAN QoS配置命令
  18. == 和 ===区别
  19. 10 常见网络攻击案例
  20. 合肥达内培训php,合肥达内PHP培训php7扩展声明与获取ini配置

热门文章

  1. qt 控件设置相对位置_qt设置控件相对位置
  2. 【WiFi破解】WiFi密码不知道了怎么办,一行代码轻松破解
  3. 拼多多在海外暂时不会上线砍一刀功能;微软落户中国三十周年;JDK 19 GA发布|极客头条
  4. Generalized Function Pointers
  5. 基于android的互动健身平台,基于Android和ARM的智能健身系统的设计与实现
  6. 转自g+,一个有意思的故事
  7. Apache虚拟主机相关配置
  8. 关于poi导出excel浏览器不下载的问题
  9. 星起航:抖音小店适合去做吗
  10. Freemark生成Word文件的加密处理