windows使用wget扒取整个网页代码

问题:有时候看到比较喜欢的网站,想下载下来参考或使用相关的CSS,这个时候去下载网页只能F12去保存部分代码,这样很难获取全部的网页。


文章目录

  • windows使用wget扒取整个网页代码
  • 前言
  • 一、安装、测试 chocolatey
  • 二、下载网页
  • 总结

前言

本文主要介绍如何根据网址获取你想要的网页,提示:以下是本篇文章正文内容,下面案例可供参考

一、安装、测试 chocolatey

代码如下(示例):本文以win10为例,安装wget,通过超级管理员权限cmd窗口下载想要的网页。使用cmd安装(必须使用超级管理员权限打开cmd窗口)

@"%SystemRoot%\System32\WindowsPowerShell\v1.0\powershell.exe" -NoProfile -InputFormat None -ExecutionPolicy Bypass -Command "iex ((New-Object System.Net.WebClient).DownloadString('https://chocolatey.org/install.ps1'))" && SET "PATH=%PATH%;%ALLUSERSPROFILE%\chocolatey\bin"

安装完成后,用 choco -v 命令检查有没有安装成功,安装成功显示当前版本号

二、下载网页

代码如下(示例):填写需要下载的网址 https://www.xxx.com ; 下载的地址:E:\website\xxx,回车执行等待下载完

wget -m -U “Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; GTB5)” -r -k -nc -P E:\website\xxx https://www.xxx.com

如果提示“‘wget’ 不是内部或外部命令,也不是可运行的程序”。
解决方法:
1、官网GNU Wget 1.21.3 for Windows下载wget(选.exe格式)
2、将下载好的wget.exe放到 C:/windows/System32文件夹下
3、在cmd中输入wget --version 有如下输出表示安装成功
重新执行wget下载网页步骤,等待下载完成


总结

wget命令本来是在linux、unix中使用的命令,用户从网络上下载,但是安装到windows中也是可以使用的,只要正确安装,可以很好的解决我们遇到的问题。

windows使用wget扒取整个网页代码相关推荐

  1. 利用wget 抓取 网站网页 包括css背景图片

    利用wget 抓取 网站网页 包括css背景图片 wget是一款非常优秀的http/ftp下载工具,它功能强大,而且几乎所有的unix系统上都有.不过用它来dump比较现代的网站会有一个问题:不支持c ...

  2. 仿站小工具的使用---扒取别人前端代码

    1.下载仿站小工具: 点击跳转  仿站小工具下载链接 2.查看配置,如果不需要改变路径也可不设置, 输入网址 输入保存目录,开扒 首页扒取结果: 打开index.html,可正常访问 逐个界面扒取,, ...

  3. ASP.NET抓取其他网页代码

    在.Net 平台下,创建一个ASP.Net的程序 1.引用两个NAMESPACE       using System.Text     //因为用了Encoding类       using Sys ...

  4. python 爬虫(一) requests+BeautifulSoup 爬取简单网页代码示例

    以前搞偷偷摸摸的事,不对,是搞爬虫都是用urllib,不过真的是很麻烦,下面就使用requests + BeautifulSoup 爬爬简单的网页. 详细介绍都在代码中注释了,大家可以参阅. # -* ...

  5. python 爬虫(一) requests+BeautifulSoup 爬取简单网页图片代码示例

    最近学习了Python,借助各个大神的文章,自己写了以下代码,来爬取网页图片,希望可以帮助到大家. 工具是 idea #coding=utf-8 import requests from bs4 im ...

  6. chrome动态ip python_用Python爬虫爬取动态网页,附带完整代码,有错误欢迎指出!...

    系统环境: 操作系统:Windows8.1专业版 64bit Python:anaconda.Python2.7 Python modules:requests.random.json Backgro ...

  7. java爬虫,提供链接直接爬取网页代码

    其实我只想要爬到整个网页的源代码的就好.通过java的一个包jsoup,就可以直接爬取了,后面有下载源代码(含jsoup包)的链接. 输入:网页链接 输出:网页源代码 代码比较简单,解析都在代码中: ...

  8. 从网页上直接扒取latex格式的公式

    latex是写公式非常方便的格式,很多具有专业性质的网站,发布者在发布公式内容时都采用的latex的形式.但是我们读者看的时候这些公式是图片的形式,不方便扒取下来进行编辑.最近写作业的时候遇到这个问题 ...

  9. python爬虫网页中的图片_Python爬虫爬取一个网页上的图片地址实例代码

    本文实例主要是实现爬取一个网页上的图片地址,具体如下. 读取一个网页的源代码: import urllib.request def getHtml(url): html=urllib.request. ...

最新文章

  1. 用于RGB-D显著目标检测的自监督表示学习
  2. NSAttributedString 详解
  3. 二分查找对应的二叉树的成功和失败ASL
  4. php5时区,[摘]PHP5.1时区设置
  5. openfalcon 组件监控_open-falcon监控业务URL探测
  6. 13c语言中的文件是一种流式文件,读写时均以字符为单位.,C语言判断题部分.doc...
  7. SQL Server字符串处理函数大全
  8. Atitit 六种知识表示法 目录 1. 知识的静态描述和动态描述 1 1.状态空间表示 以状态和运算符(operator) 1 2.问题归约表示(函数式?? 1 (1)一个初始问题描述; 2 (2)
  9. 【是程序猿就干了这碗心灵鸡汤】我们这一代人的困惑
  10. Java FX swt_转: JAVA_SWT常用事件, 和方法
  11. DirectX SDK 安装时出现错误 [Error Code:S1023] 的解决方案
  12. hustoj 忘记admin密码的解决方案
  13. 五 常见的计算机故障有哪些,六大常见的电脑故障原因
  14. 北卡罗来纳州立大学计算机科学,NCSU的CS「北卡罗来纳州立大学罗利分校计算机科学系」...
  15. virtualbox 菜单栏不见了
  16. 云服务器带宽是什么 云服务器带宽怎么选
  17. 问答学习系统 - 针式PKM V8.20新增功能
  18. 安装及配置 Mac 上的 Rime 输入法——鼠鬚管 (Squirrel)(也适用于小狼豪)
  19. 程序员笑话:只有程序猿才看得懂
  20. Adobe Premiere Pro 2020 系统兼容性报告:不支持的视频驱动程序

热门文章

  1. 第一天开博,发篇搞笑的。
  2. Java版工程项目管理系统平台+java版企业工程系统源码+助力工程企业实现数字化管理
  3. python矩阵归一化方法_python之sklearn常见数据预处理归一化方式解析
  4. JUSTICE∶What’s the Right Thing to Do 正义∶一场思辨之旅. 公正:该如何做是好?
  5. 面试官:了解Fuzzing Test吗?
  6. 第五章 1 图层蒙版的使用方法
  7. MQTT客户端工具介绍
  8. 装linux系统能办公吗,Linux转正日常办公电脑到底行不行
  9. C语言之递归——以n级台阶为例
  10. C语言中if和switch语句的基本用法