分析页面:借助开发者工具(F12)

找规律,爬虫:模拟开发者工具鼠标点击html效果帮我们找到想要的文字**

1. Headers内容,让对方服务器接收到我们的请求时,可以了解我们是什么状态

General

Request URL: #请求路径
Request Method: OPTIONS #请求方法
Status Code: 200 #响应状态码,200表示请求成功

200(状态码) OK(原因短语)
301 - 资源(网页等)被永久转移到其它URL
404 - 请求的资源(网页等)不存在
500 - 内部服务器错误

Remote Address: 120.192.82.68:443 #远程(移动端)地址,端口和ip
Referrer Policy: strict-origin-when-cross-origin #引用站点策略

Response Headers
#响应标头,我们发给服务器的,告诉服务器返回给我们的内容应该适配什么条件

access-control-allow-headers: Range
#用于 preflight request (预检请求)中,列出了将会在正式请求的 Access-Control-Request-Headers 字段中出现的首部信息。
access-control-allow-methods: GET, OPTIONS
#在对 preflight request.(预检请求)的应答中明确了客户端所要访问的资源允许使用的方法或方法列表。

access-control-allow-origin: https://www.bilibili.com
#访问控制允许同源,这是由于ajax跨域访问引起的
#所谓跨域就是,在a.com域下,访问b.com域下的资源;出于安全的考虑,浏览器允许跨域写,而不允许跨域读,写就是上行,发送请求,send request,读就是下行,接受响应,receive response;

access-control-expose-headers: Content-Length, Content-Range, x-service-module
#列出了哪些首部可以作为响应的一部分暴露给外部。
默认情况下,只有七种 simple response headers (简单响应首部)可以暴露给外部

content-length: 0 # HTTP消息长度
content-type: video/mp4 #接收的返回的类型,服务端发送的文件类型及采用的编码方式
access-control-max-age: 21600
#这个响应头表示 preflight request (预检请求)的返回结果(即 Access-Control-Allow-Methods 和Access-Control-Allow-Headers 提供的信息) 可以被缓存多久。

alt-svc: h3-Q050=":443"; ma=2592000,h3-29=":443"; ma=2592000,h3-27=":443"; ma=2592000,h3-T051=":443"; ma=2592000,h3-T050=":443"; ma=2592000,h3-Q046=":443"; ma=2592000,h3-Q043=":443"; ma=2592000, quic=":443"; ma=2592000; v=“46,43” #替代服务,为了让服务器可以告诉客户端 “看,我在这个主机的这个端口用这个协议提供相同的服务” 而设计的

expires: -1 # 链接过期,-1不过期
date: Thu, 05 Nov 2020 07:24:49 GMT #客户端请求服务端的时间
server: openresty #服务器名标示自己用的是什么web服务器,一个成熟的网络平台
status: 200 #表示服务器成功处理了请求的状态代码
x-service-module: bvc-quic-server
Transfer-Encoding:chunked #分块传递数据到客户端

Request Headers
#请求标头

:authority: cn-sdjn2-cmcc-v-09.bilivideo.com # 请求的域名(对方的服务器地址)
:method: OPTIONS # 请求方法,一般浏览器访问网站使用GET请求

:path: /upgcxcode/22/01/167220122/167220122_nb2-1-30064.m4s? expires=1604568289&platform=pc&ssig=YotuN8CULI93G6pq2ij_WA&oi=1863431941&trid=ff4f8402c504405e8349fa87cc867884u&nfc=1&nfb=maPYqpoel5MI3qOUX6YpRA==&cdnid=6613&mid=479743063&orderid=0,3&agrr=1&logo=80000000 # 请求路径

:scheme: https # 请求的协议,这里使用https协议
accept: / # 请求文件类型
accept-encoding: gzip, deflate, br # 压缩类型,支援gzip,deflate,br 压缩方式
accept-language: zh-CN,zh;q=0.9 #客户端接收的语言类型
access-control-request-headers: range
access-control-request-method: GET
origin: https://www.bilibili.com
#Connection:keep-alive

#Cookie: #服务器为了能够标识每一个客户端,登录信息,行为信息,保存在本地的很多内容(内容是加密的)
#登陆以后才能看到的爬取,必须学会存储和读取cookie,如果没有Cookie网站会认为你没有登录

#param: # 缓存来源
referer: https://www.bilibili.com/
sec-fetch-dest: empty # sec-fetch-* 意为如何使用返回的参数
sec-fetch-mode: cors
sec-fetch-site: cross-site
user-agent(什么类型版本的游览器,可以接收什么水平的消息): Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36

有的时候还会出现下面信息
其实就是get请求中url后面要带的参数。
也就是说,向对应网址服务器传递这些参数就可以获得请求的内容,属于爬虫的基础知识。

Query String Parameters
expires: 1604568289
platform: pc
ssig: YotuN8CULI93G6pq2ij_WA
oi: 1863431941
trid: ff4f8402c504405e8349fa87cc867884u
nfc: 1
nfb: maPYqpoel5MI3qOUX6YpRA==
cdnid: 6613
mid: 479743063
orderid: 0,3
agrr: 1
logo: 80000000
‘’’
如,根据上面内容,可以这么传递参数

data={'expires':1604568289,'platform':'pc',……
}url='http……………………/?'+urlencode(data)#将字典对象转化为url的请求参数
response=requests.get(url)

不同时间发送的请求不同

当前鼠标悬停位置的层级

2.NetWork中各种信息的意思相关推荐

  1. network中的请求信息,headers中的每一项分别是什么意义?

    这里是修真院前端小课堂,每篇分享文从 [背景介绍][知识剖析][常见问题][解决方案][编码实战][扩展思考][更多讨论][参考文献] 八个方面深度解析前端知识/技能,本篇分享的是: [network ...

  2. 【模型解读】network in network中的1*1卷积,你懂了吗

    文章首发于微信公众号<与有三学AI> [模型解读]network in network中的1*1卷积,你懂了吗 这是深度学习模型解读第二篇,本篇我们将介绍Network InNetwork ...

  3. 运筹学作业——社会网络中的信息传播优化问题

    去年写的,今年发一下. 社会网络 社会网络是指社会个体成员之间因为互动而形成的相对稳定的关系体系.社会网络以个人为节点(node)构成社会结构,人与人之间通过相互依赖关系联结起来.相互依赖关系可能是朋 ...

  4. chrome浏览器F12 Network中Timing参数含义

    前言 Chrome浏览器开发者工具Network窗口下,Timing中显示资源在整个请求生命周期过程中各部分花费的时间. Timing各参数截图如下: 参数具体含义: Queueing:请求文件顺序的 ...

  5. WebRTC 中 SDP 信息解析

    TL;NR 更详细的 WebRTC SDP 解析请参考 https://tools.ietf.org/html/draft-ietf-rtcweb-sdp-14 0x00 前言 SDP (Sessio ...

  6. c++读取文本文件里的指定位置的字符_利用FSO对象向文本文件中写入信息

    大家好,我们今日讲解"VBA信息获取与处理"教程中第十八个专题"FSO对象对文件及文件夹的处理"的第五节"用FSO对象向文本文件中写入信息" ...

  7. 研究揭示大脑在工作记忆中存储信息的神经机制

    来源:中国科学院脑科学与智能技术卓越创新中心(神经科学研究所) 3月5日,<神经元>期刊在线发表了题为<无颗粒岛叶皮层瞬时性神经元活动调控学习新任务时的工作记忆存储>的研究论文 ...

  8. 发掘数据中的信息 -- 数据探索之描述性统计

    在如今这个大数据时代,数据的价值得到普遍的认可.可是,数据为什么有价值呢?如果,数据只是静静地躺在服务器中,又或是默默地流淌在网络中,它们又能带来什么? 数据就如同海边的沙子,潮起潮落,岁月轮转,它们 ...

  9. python中读取word信息_Python实现批量读取word中表格信息的方法

    本文实例讲述了Python实现批量读取word中表格信息的方法.分享给大家供大家参考.具体如下: 单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个py ...

最新文章

  1. 2020秋季-人工神经网络课程报告
  2. entity framework6 edmx文件详解
  3. 小程序开发(6)-之自定义导航栏
  4. 排列组合(HDU-1521)
  5. VMware产品互操作性列表
  6. c语言验证鼓角猜想,患者,男,43岁,交通警察。下肢酸胀、沉重6年,活动或休息后减轻。体格检:小腿外侧有蚓状团块,足靴区...
  7. python itertools模块_Python标准模块--itertools
  8. 应用场景|R包分类整理
  9. SQL知识点脑图(一张图总结SQL)
  10. SpringMvc上传文件遇到重复读取InputStream的问题
  11. Windows环境下用nmake编译libevent
  12. ​smooth-signature​.js: 前端canvas实现H5带笔锋手写签名,支持PC端和移动端使用,无框架限制,Vue、React等均可使用
  13. 小i机器人登陆美股,乘ChatGPT的东风能走多远?
  14. 详解matlab均衡算法equalize()
  15. 三张图解释静态NAT、动态NAT、PAT
  16. python之json扩展
  17. 硬盘突然变raw格式_磁盘变成RAW格式的两种解决办法
  18. 自定义resttemplate的ErrorHandler
  19. Mac有哪些解压缩软件,他们的优缺点是什么,哪款比较好用?
  20. 576芯SMC三网合一光缆交接箱

热门文章

  1. 微信小程序wx.showModal(不显示“取消”按钮,修改“确定”按钮名称)
  2. 302重定向与301重定向
  3. 解决在安卓系统微信中打开网页无法上传图片的问题
  4. 监控摄像头镜头可视距离和角度
  5. 训练过程中的train,val,test的区别
  6. Java网络编程之MINA框架(1)
  7. Python中常用的数据结构---链表
  8. 解决npm ERR! JSON.parse Failed to parse json
  9. Int 的范围 是 65535 还是2147483647
  10. js实现浅拷贝和深拷贝