Http协议和抓包工具
爬虫系列目录
1、HTTP协议和抓包工具
文章目录
- 爬虫系列目录
- 理解Http协议
- 常见请求头参数
- 常见响应状态码
- Chrome抓包工具的使用
理解Http协议
http: 80
https: 443端口; 在http下增加了SSL层。
URL: 统一资源定位符
1、Scheme
2、host
3、port
4、path
5、query string, 使用&拼接
6、anchor: 锚点,使用#,前端用来做页面定位的,现在一些前后端分离项目,也用锚点做导航。
在浏览器中请求一个url,浏览器会对url进行一个编码。除英文字母,数字和部分符号外,其他的全部使用百分号+十六进制码值进行编码。
常见请求头参数
1、User-Agent: 浏览器名称。如果不设置,就默认为Python,会被反爬虫识别。所以经常设置为一些浏览器的值,来伪装爬虫。
2、Referer 表明当前这个请求是从哪个url过来的。这个一般可以做反爬虫技术,如果不是从指定页面过来的,那么就不做相关的响应。
3、Cookie http协议是无状态的。也就是同一个人发送了两次请求,服务器没有能力知道这两个请求是否来自于同一个人。使用cookie做标识。一般想要做登录后才能访问的网站,就需要发送cookie信息。
常见响应状态码
状态码 | 注释 |
---|---|
200 | 正常 |
301 | 永久重定向 |
302 | 临时重定向,比如访问一个需要登录的页面的时候,而此时没有登录,就会重定向到登录页面。 |
400 | 请求的url在服务器上找不到,就是请求url错误 |
403 | 服务器拒绝访问,权限不够 |
500 | 服务器内部错误,可能是服务器出现bug了 |
Chrome抓包工具的使用
1、Elements
显示背后的源代码
可以帮助分析网页结构,获取我们想要的数据。但是呈现是最终网页数据,有时网页数据是通过ajax请求得到的,因此elements的数据不能完全相信。
可以安装插件测试query结果(插件待补充)
2、Console
用来打印网页的一些信息。
3、Sources
网页加载的所有文件:js,css, 图片这些。
对应的是最开始的网页源代码。
通过ajax动态添加数据到elements显示的页面中。
4、Network
可以看到网页发送的所有页面请求。
XHR: Ajax请求获取到的数据。
Http协议和抓包工具相关推荐
- HTTP、HTTPS协议以及抓包工具
文章目录 前言 一.HTTP 1.HTTP是什么? 2.HTTP工作过程 3.HTTP协议格式 (1)HTTP请求(request) URL 方法(method):最主要的有get/post 报头(h ...
- HTTP协议和抓包工具Fiddler
HTTP,Fiddler 1.HTTP是什么 2.HTTP协议与客户端和服务器 3.HTTP协议的报文格式 1.抓包工具 2.HTTP报文格式 1.HTTP请求的报文格式 2.HTTP响应的报文格式 ...
- “软件测试工程师”面试复习之《HTTP协议及抓包工具Fiddler》
供面试复习使用,内容主要来自<HTTP抓包实战 作者:肖佳>和<图解HTTP 作者:日本上野宣> 关于HTTP协议 一.web网页是如何显示出来的? 1.打开浏览器,输入url ...
- MySQL抓包工具:MySQL Sniffer
简介 MySQL Sniffer 是一个基于 MySQL 协议的抓包工具,实时抓取 MySQLServer 端的请求,并格式化输出.输出内容包访问括时间.访问用户.来源 IP.访问 Database. ...
- MySQL抓包工具:MySQL Sniffer【转】
本文来自:https://github.com/Qihoo360/mysql-sniffer 简介 MySQL Sniffer 是一个基于 MySQL 协议的抓包工具,实时抓取 MySQLServer ...
- mysql抓包_mysql抓包工具
简介 MySQL Sniffer 是一个基于 MySQL 协议的抓包工具,实时抓取 MySQLServer 端或 Client 端请求,并格式化输出.输出内容包括访问时间.访问用户.来源 IP.访问 ...
- Fiddler抓包工具保姆级使用教程(超详细)
超文本传输协议(HTTP)是一个简单的请求-响应协议,其主要是基于TCP来实现的,可以通过Chrome开发者工具或者Wireshark或者Fiddler抓包,以便分析 HTTP 请求/响应的细节,本篇 ...
- vc mysql sniffer_MySQL抓包工具:MySQL Sniffer
简介 MySQL Sniffer 是一个基于 MySQL 协议的抓包工具,实时抓取 MySQLServer 端的请求,并格式化输出.输出内容包访问括时间.访问用户.来源 IP.访问 Database. ...
- charles抓包工具_HTTP协议抓包工具:Charles for Mac
Charles mac版对于开发者来说应该都不会陌生,这是一款非常实用的HTTP信息抓包工具,可以帮助开发人员查看其机器和Internet之间的所有HTTP和SSL / HTTPS流量,让你可以快速诊 ...
最新文章
- 从字符串指定位置删除指定个数的字符
- openssh for windows
- PHP Mysql-创建数据表
- CLI下的网页浏览器之二——Lynx
- JavaScript 中遍历对象的属性 1
- 仿手环运动app的html,连接手环.html
- AjaxControlToolKit之AutoCompleteExtender用法
- atitit prj mnrs 项目中的几种经理角色.docx
- 计算机win7截长屏,怎么用截图工具截比电脑屏幕长的图片?-WIN7截长图,win7怎么滚动截长图...
- rainmeter使用教程_如何使用Rainmeter自定义Windows桌面
- sgx使用记录(Windows开发环境搭建以及sgx的简单介绍)1
- 程序员必读书单 1.0
- 解决pychram:卡在Updating Python Interpreter
- 关闭Win10锁屏的防暴力破解功能
- Java面试题——Spring
- 微信自定义分享的那些坑!
- fla文件中切记不能使用TLF文本
- oracle 结果集已耗尽_java.sql.SQLException: 结果集已耗尽,该怎么解决
- NET MVC5第三方验证——FluentValidation
- 黑苹果万能声卡diskpart_大家的黑苹果都修炼到什么程度了,进来看一下你在哪个等级,撰写你的黑苹果大神修仙记...