前言

一个成功的渗透测试人员,在进行一次成功的渗透测试之前,必须能够获得尽可能多的信息。有时候复制组织的整个网站进行离线评估更有效。这可以使用自动化工具设定搜索条件,或者仅对当前站点改变的敏感信息进行镜像复制。当离线时,拥有 一份镜像进行持续观察很有效。Wooyun被封杀,现在网上还有很多Wooyun镜像站来继续发挥Wooyun的预热那样。镜像网站不会复制动态内容,也不会复制网站的中间件,比如:数据库等,因此,这并不是对所有渗透测试环境都适用。我个人一般都是用这些工具来 "盗取" 炫酷的html5网站(嘘 ~~~),有时候用它离线存储一些网站,总之挺实用的。

使用wget复制克隆网站

介绍

Kali linux默认按照了wget工具,它简单使用,Pentest Box中也集成了wget。只要在终端下敲几个命令,就可以下载整个网站的html文件。wget不能复制服务器的程序页面,例如PHP脚本页面。

使用方法

终端下输入:

wget -m -p -E -k -K -np -v http://www.baidu.com

这样就会把百度的首页复制下来,就是这么简单粗暴。这里使用了一连串的参数,可以使用man命令来查看 wget的手册:

man wget

wget的主要参数如下:

m:镜像,选择该选项适用于Web站点
p页面获先决条件,该选项确保 包含了请求的   图片和css脚本文件被下载(这样可以更好的复制 html5的站点)
E:适用扩展,这可以在本地另存为一个html文件
k:转换链接,确保文件被转换,用于本地浏览
K:转换备份文件,将会以orig为后缀作为原始文件    

从组织的Web服务器传送的文件将会存储在复制的网站名称命名的文件夹中。复制网站时,可能会发生错误,尤其是在复制动态脚本页面的时候,这是因为生成页面的大部分代码是有动态脚本创建的,大部分站点的应用程序是不能访问到的。

注:文件一旦被下载,切忌不可以让其他人浏览和重新发布站点,这回违反版权法。

实战克隆

下面来 实战用wget来克隆 小米官方HTML5引导页:

使用HTTrack复制克隆网站

介绍

HTTrack是一款免费的离线浏览器工具,和wget克隆复制镜像差不多,从服务器抓取HTML文件、图片、以及其他css文件并存储到你的计算机上。Kali 2.0起默认预装了 HTTrack

使用方法

终端下输入:

httrack

如果没有安装这个工具的话,那就现场安装一下吧,只需要2个命令:

apt-get update
apt-get install httrack

这里提示要输入项目名称、存放网站的路径(默认为 /root/website) 和要克隆的目标站 我们这里以 搜狗浏览器官网为例
我们自定义输入test 然后 按下 回车

sougou

然后默认路径 回车

输入想要克隆的网站

http://ie.sougou.com

下面HTTrack提供了一些选项,我们一般选择第二本选项 Mirror Web Site(s) with Wizard(具有向导递归层级的镜像网站) 输入:2
回车 回车 回车 后面的一些基本设置 一般一直回车下去 直到网站开始克隆为止,HTTrack 就开始进行网站克隆了。

小结

个人认为:wget操作简单方便,但是克隆效果不及 HTTrack;HTTrack虽然比wget稍微繁琐了一点,但是在爬一个大型网站上面完整性要优于wget。 对了,最后再提醒一下:注意版权。

转载于:https://www.cnblogs.com/sqlsec/p/webclone.html

信息收集之网站镜像克隆相关推荐

  1. 单域名PHP网站镜像克隆程序网站源码

    介绍: 单域名介绍:PHP镜像克隆程序是一个以php进行开发的镜像网站源码. 程序的安装: 1.上传目录中的文件到服务器(请确保支持伪静态) 2.后台管理 http://您的域名/admin/ 3.默 ...

  2. 渗透测试如何学习? (*╹▽╹*) 信息收集 ~ 其一

    文章目录 简介 本博客学习基础 收集信息简介 收集那些信息 信息收集一(域名信息收集) 收集目标相关子域名 被动方式收集信息 方法一:Google语法 方法二:使用第三方网站接口查询 方法三:使用网络 ...

  3. 信息收集的方法有哪些

    众所周知渗透测试的本质是信息收集,在渗透测试中信息收集的质量直接关系到渗透测试成果的与否.在对系统进行渗透测试前的信息收集是通过各种方式获取所需要的信息,收集的信息越多对目标进行渗透的优势越有利.通过 ...

  4. 【网络安全】内网介绍+windows信息收集(含命令)

    目录 前言 一.内网渗透测试是什么? 1.介绍 2.内外网区别 3.工作组是什么? 4.域是什么? 5.域的知识点 6.活动目录  7.活动目录主要功能 8.域权限 二.windows信息收集 (1) ...

  5. 渗透测试前期——信息收集

    目录 概述 1.域名发现 1.1子域名枚举 1.2 巧用搜索引擎 1.3 第三方平台发现 1.4 证书透明性信息查询 1.5 DNS域传送漏洞 2.IP资源收集 2.1 CDN隐秘背后的真实秘密 2. ...

  6. 渗透测试之信息收集(超完整版)

    目录 前言: 一.正面信息收集 1. 网站页面信息收集 2. 域名信息 (1)端口 (2)子域名 (3)C段旁注 (4)目录(敏感信息) (5)URL请求 3.web组件 (1)操作系统 (2)数据库 ...

  7. 信息收集之Github搜索语法

    目录 使用 Github 进行邮件配置信息收集 使用Github进行数据库信息收集 使用Github进行 SVN 信息收集 使用Github进行综合信息收集 在渗透测试的信息收集阶段,可以去Githu ...

  8. 【经验】渗透测试信息收集步骤、网站、工具分享

    渗透测试信息收集步骤.网站.工具分享 刚刚参加完一次大型活动,感觉这个暑假自己的成长很明显.虽然之前的假期也有打算做些什么或者也确实做了什么,但收效甚微.也许人性如此吧,总是要有什么理由推着自己才能前 ...

  9. 信息收集渠道:文本分享类网站Paste Site

    信息收集渠道:文本分享类网站Paste Site Paste Site是一种专门的文本分享的网站.用户可以将一段文本性质的内容(如代码)上传到网站,然后通过链接分享给其他用户.这一点很类似于现在的优酷 ...

  10. 『信息收集』GoogleHacking快速定位目标网站

    第一次接触到"GoogleHacking"是在学校初次Geek大赛上. 很有意思的一道题目,网页中原题大致是这样的: 下面是数学之美(吴军著)的封面,请找出这本书的ISBN码(这一 ...

最新文章

  1. android layout analyze
  2. ps制作html图标素材,如何用PS制作一个简单的扁平化图标?
  3. lambda表达式_Lambda表达式详解
  4. 搭建于 Cubieboard 之上的超小型实时监控平台 - mjpg篇
  5. 解决问题:pycharm中SSH报错failed:<br/>Authentication failure
  6. Winform 事件
  7. 关于范数与正则化详解(转)
  8. 剑指Offer之翻转单词顺序列
  9. [控件] 将字符串转换成贝塞尔曲线并执行动画
  10. ORACLE RAC 视频教程
  11. Fragstats 提示错误与警告
  12. SMA、SMB、SMC封装的二极管尺寸区分
  13. 编辑PDF的软件哪个好 如何修改PDF文件
  14. 淘宝客推广平台软件源码
  15. Ubuntu 16.04 LTS 完善解决亮度调整
  16. Ubuntu16.04中修复Pycharm问号图标问题
  17. AppleScript(0) : 文档与语法
  18. 小学计算机技术感想,小学信息技术教学经验总结(精选5篇)
  19. Android开发实现人脸识别
  20. TeamViewer轻松解决企业远程办公安全隐患

热门文章

  1. python源文件是什么意思_.py文件是什么?
  2. 计算机表格斜杠怎么打,【2人回答】Excel表格中如何输入斜杠?-3D溜溜网
  3. Adobe Photoshop CC已停止工作重装显卡驱动解决方法
  4. 求取scores最近邻的方法之二开始新的实践Chorus
  5. uniapp app中导出手机号码到通讯录
  6. 批量(或选择)导出数据库表中的数据生成Excel文件
  7. java数字时钟代码_Java编程小实例—数字时钟的实现代码示例
  8. KT148A电子语音芯片ic方案适用的场景以及常见产品类型
  9. 使用nvim来代替VSCode,神操作
  10. TI DSP COFF->EABI输出格式切换