爬虫系列目录

1、HTTP协议和抓包工具

文章目录

  • 爬虫系列目录
  • 理解Http协议
    • 常见请求头参数
    • 常见响应状态码
  • Chrome抓包工具的使用

理解Http协议

http: 80
https: 443端口; 在http下增加了SSL层。

URL: 统一资源定位符
1、Scheme
2、host
3、port
4、path
5、query string, 使用&拼接
6、anchor: 锚点,使用#,前端用来做页面定位的,现在一些前后端分离项目,也用锚点做导航。

在浏览器中请求一个url,浏览器会对url进行一个编码。除英文字母,数字和部分符号外,其他的全部使用百分号+十六进制码值进行编码。

常见请求头参数

1、User-Agent: 浏览器名称。如果不设置,就默认为Python,会被反爬虫识别。所以经常设置为一些浏览器的值,来伪装爬虫。
2、Referer 表明当前这个请求是从哪个url过来的。这个一般可以做反爬虫技术,如果不是从指定页面过来的,那么就不做相关的响应。
3、Cookie http协议是无状态的。也就是同一个人发送了两次请求,服务器没有能力知道这两个请求是否来自于同一个人。使用cookie做标识。一般想要做登录后才能访问的网站,就需要发送cookie信息。

常见响应状态码

状态码 注释
200 正常
301 永久重定向
302 临时重定向,比如访问一个需要登录的页面的时候,而此时没有登录,就会重定向到登录页面。
400 请求的url在服务器上找不到,就是请求url错误
403 服务器拒绝访问,权限不够
500 服务器内部错误,可能是服务器出现bug了

Chrome抓包工具的使用

1、Elements
 显示背后的源代码
 可以帮助分析网页结构,获取我们想要的数据。但是呈现是最终网页数据,有时网页数据是通过ajax请求得到的,因此elements的数据不能完全相信。

 可以安装插件测试query结果(插件待补充)

2、Console
  用来打印网页的一些信息。
3、Sources
  网页加载的所有文件:js,css, 图片这些。
  对应的是最开始的网页源代码。

  通过ajax动态添加数据到elements显示的页面中。

4、Network
  可以看到网页发送的所有页面请求。
  XHR: Ajax请求获取到的数据。

Http协议和抓包工具相关推荐

  1. HTTP、HTTPS协议以及抓包工具

    文章目录 前言 一.HTTP 1.HTTP是什么? 2.HTTP工作过程 3.HTTP协议格式 (1)HTTP请求(request) URL 方法(method):最主要的有get/post 报头(h ...

  2. HTTP协议和抓包工具Fiddler

    HTTP,Fiddler 1.HTTP是什么 2.HTTP协议与客户端和服务器 3.HTTP协议的报文格式 1.抓包工具 2.HTTP报文格式 1.HTTP请求的报文格式 2.HTTP响应的报文格式 ...

  3. “软件测试工程师”面试复习之《HTTP协议及抓包工具Fiddler》

    供面试复习使用,内容主要来自<HTTP抓包实战 作者:肖佳>和<图解HTTP 作者:日本上野宣> 关于HTTP协议 一.web网页是如何显示出来的? 1.打开浏览器,输入url ...

  4. MySQL抓包工具:MySQL Sniffer

    简介 MySQL Sniffer 是一个基于 MySQL 协议的抓包工具,实时抓取 MySQLServer 端的请求,并格式化输出.输出内容包访问括时间.访问用户.来源 IP.访问 Database. ...

  5. MySQL抓包工具:MySQL Sniffer【转】

    本文来自:https://github.com/Qihoo360/mysql-sniffer 简介 MySQL Sniffer 是一个基于 MySQL 协议的抓包工具,实时抓取 MySQLServer ...

  6. mysql抓包_mysql抓包工具

    简介 MySQL Sniffer 是一个基于 MySQL 协议的抓包工具,实时抓取 MySQLServer 端或 Client 端请求,并格式化输出.输出内容包括访问时间.访问用户.来源 IP.访问 ...

  7. Fiddler抓包工具保姆级使用教程(超详细)

    超文本传输协议(HTTP)是一个简单的请求-响应协议,其主要是基于TCP来实现的,可以通过Chrome开发者工具或者Wireshark或者Fiddler抓包,以便分析 HTTP 请求/响应的细节,本篇 ...

  8. vc mysql sniffer_MySQL抓包工具:MySQL Sniffer

    简介 MySQL Sniffer 是一个基于 MySQL 协议的抓包工具,实时抓取 MySQLServer 端的请求,并格式化输出.输出内容包访问括时间.访问用户.来源 IP.访问 Database. ...

  9. charles抓包工具_HTTP协议抓包工具:Charles for Mac

    Charles mac版对于开发者来说应该都不会陌生,这是一款非常实用的HTTP信息抓包工具,可以帮助开发人员查看其机器和Internet之间的所有HTTP和SSL / HTTPS流量,让你可以快速诊 ...

最新文章

  1. 从字符串指定位置删除指定个数的字符
  2. openssh for windows
  3. PHP Mysql-创建数据表
  4. CLI下的网页浏览器之二——Lynx
  5. JavaScript 中遍历对象的属性 1
  6. 仿手环运动app的html,连接手环.html
  7. AjaxControlToolKit之AutoCompleteExtender用法
  8. atitit prj mnrs 项目中的几种经理角色.docx
  9. 计算机win7截长屏,怎么用截图工具截比电脑屏幕长的图片?-WIN7截长图,win7怎么滚动截长图...
  10. rainmeter使用教程_如何使用Rainmeter自定义Windows桌面
  11. sgx使用记录(Windows开发环境搭建以及sgx的简单介绍)1
  12. 程序员必读书单 1.0
  13. 解决pychram:卡在Updating Python Interpreter
  14. 关闭Win10锁屏的防暴力破解功能
  15. Java面试题——Spring
  16. 微信自定义分享的那些坑!
  17. fla文件中切记不能使用TLF文本
  18. oracle 结果集已耗尽_java.sql.SQLException: 结果集已耗尽,该怎么解决
  19. NET MVC5第三方验证——FluentValidation
  20. 黑苹果万能声卡diskpart_大家的黑苹果都修炼到什么程度了,进来看一下你在哪个等级,撰写你的黑苹果大神修仙记...

热门文章

  1. 用python做数值计算_用python进行数据分析的基本步骤和方法
  2. HTML Parser Jsoup - 网页抓取百度百科信息的例子
  3. lib库反编译C语言,C语言静态链接库(lib)与动态链接库(dll)
  4. 全文检索-ElasticSearch入门
  5. SQL server 数据库关系图及数据完整性设计
  6. 高电压超低功耗低压差电压调节器 MST53XXB系列芯片
  7. 人工智能还能研究古文字?
  8. 计算机二级网上哪里学,计算机二级学习网址
  9. 抢先体验TPS轻松过万的SDAG区块链(二)
  10. 验证性分析---相关