python爬取携程网旅游_爬取携程网(ajax动态加载)
爬取 携程旅游网
‘content-type’:‘application/json’,
这个请求头参数是关键
import requests
import json
import re
headers = {
'USER_AGENT': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36',
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language': 'en',
'referer': 'https://vacations.ctrip.com/',
'content-type':'application/json',
'origin': 'https://vacations.ctrip.com',
}
data = {"contentType": "json",
"head": {"cid": "09031030111366754355", "ctok": "", "cver": "1.0", "lang": "01", "sid": "8888", "syscode": "09",
"auth": "", "extension": []}, "version": "80400",
"client": {"trace": "none", "device": "PC", "source": "NVacationSearchV2",
"variables": [{"key": "SHXVERSION", "value": "B"}], "cid": "1605494184427.2ep3s2"},
"poiType": {"poid": 1, "type": "D", "keyword": "北京"},
"filtered": {"sort": 8, "channel": "Online", "tab": "A126", "saleCity": 206, "startCity": 206, "pageSize": 30,
"pageIndex": 2, "items": [{"key": "CHANNEL_ID", "value": "114"}]}, "returnType": {"type": "all",
"filters": "ProductNewLine,ProductLine,HotDestination,HotScenicSpot,SaleDepartureStat,TravelDays,DepartureDate,Month,ProductPattern,ProductLevel,ADSuitPersons,ADServiceCharacteristic,ADIsDirectFlight,ADHotelCharacteristic,ADNLineCharacteristic,ProductDistrict,ProviderBrand,PriceRange,Promotion,OnSale,ADServiceGarantee",
"recommendProduct": True}}
response = requests.post(
'https://vacations.ctrip.com/list/restapi/gateway/13561/search?_fxpcqlniredt=09031030111366754355',
data=json.dumps(data), headers=headers)
print(response.text)
python爬取携程网旅游_爬取携程网(ajax动态加载)相关推荐
- python翻页功能url不变_爬取Ajax动态加载和翻页时url不变的网页
这两天投了一家公司的爬虫实习生,笔试题是完成一个爬虫的小需求.网站没有什么反爬的高级技巧.但是有非常常见的,并不是针对我们爬虫的,却让我们新手很难理解的ajax动态加载技术和乍一看不明白的翻页时不变的 ...
- Python爬取东方财富网任意股票任意时间段的Ajax动态加载股票数据
导言 最近由于需求想爬取以下东方财富网的股票数据,但是发现没有想象那么简单,接下来我会讲述一下我遇到的问题以及是如何解决,最后成功的爬出了想要的数据. 查看网页源码 首先我们F12打开东方财富网网页源 ...
- 关于使用scrapy框架编写爬虫以及Ajax动态加载问题、反爬问题解决方案
关于使用scrapy框架编写爬虫以及Ajax动态加载问题.反爬问题解决方案 参考文章: (1)关于使用scrapy框架编写爬虫以及Ajax动态加载问题.反爬问题解决方案 (2)https://www. ...
- 爬取通过ajax动态加载的页面(实时监控华尔街见闻资讯与快讯)
学习了几天如何使用scrapy去爬取静态网站,今天尝试去爬取动态加载的网站.选取的网站是华尔街见闻,文中不会像往常一样大篇幅讲解每一步该如何做,而是探讨如何爬取. 在源代码中无法获得全部数据(有的根本 ...
- python爬虫之Ajax动态加载数据抓取--豆瓣电影/腾讯招聘
动态加载数据抓取-Ajax 特点 1.右键 -> 查看网页源码中没有具体数据 2.滚动鼠标滑轮或其他动作时加载 抓取 1.F12打开控制台,页面动作抓取网络数据包 2.抓取json文件URL地址 ...
- python爬取携程网旅游_爬虫之携程网旅游信息爬取
最近手又有点闲,闲着无聊就爬取了携程的信息,这个爬虫是我随手写的,各位可以看看. # -*- encoding=utf-8 -*- #爬取携程旅游信息 #2017/8/14 from bs4 impo ...
- 爬取携程网(ajax动态加载)
爬取 携程旅游网 'content-type':'application/json', 这个请求头参数是关键 import requests import json import reheaders ...
- python爬虫之动态加载获取药品监督管理局
本次爬取实现使用request模块爬取国家药品监督管理局的企业信息数据并存入到Excel表格中 爬取目标网站 http://scxk.nmpa.gov.cn:81/xk/# 分析页面: 打开网页查看首 ...
- python爬取百度迁徙动态图_爬取动态图片—以百度图片为例
一:何谓动态加载图片 所谓动态加载图片即指html刚加载时,图片时没有的,然后通过json发生有关图片的数据,在插入到html里面去,以到底快速打开网页的目的,那么问题来了?我们如何找到加载文件的js ...
最新文章
- 华为主题包hwt下载_华为主题 | 星黛露
- 通过Log4net来配置我们需要的日志文件格式
- python中的requests模块的使用大全
- Java 的Runnable和Callable的区别
- js遍历数组foreach_JavaScript forEach –如何在JS中遍历数组
- java中关于线程的状态属性_深入理解Java多线程与并发框(第①篇)——线程的状态...
- linux中禁用Root帐户的4种方法
- ITIL事件管理流程设计
- RACK与重复ACK
- 数字信号处理3个作业-----作业3自相关与Burg求解AR模型系数以估计其功率谱
- EPMS- 让企业应用更加轻便!
- Linux 与 Python编程2021 经典函数实例 educoder实训
- 关于此博客更名和改版的说明
- 虚拟机CentOS启动报错-entering emergency mode解决办法
- 数字认证是做什么的?数字认证有什么用?
- Access 密码破解原理- -
- 华为无线设备WLAN QoS配置命令
- == 和 ===区别
- 10 常见网络攻击案例
- 合肥达内培训php,合肥达内PHP培训php7扩展声明与获取ini配置