wget是在Linux下开发的开放源代码的软件,作者是Hrvoje Niksic,后来被移植到包括Windows在内的各个平台上。它有以下功能和特点:

  (1)支持断点下传功能;这一点,也是网络蚂蚁和FlashGet当年最大的卖点,现在,Wget也可以使用此功能,那些网络不是太好的用户可以放心了;
  (2)同时支持FTP和HTTP下载方式;尽管现在大部分软件可以使用HTTP方式下载,但是,有些时候,仍然需要使用FTP方式下载软件;
  (3)支持代理服务器;对安全强度很高的系统而言,一般不会将自己的系统直接暴露在互联网上,所以,支持代理是下载软件必须有的功能;
  (4)设置方便简单;可能,习惯图形界面的用户已经不是太习惯命令行了,但是,命令行在设置上其实有更多的优点,最少,鼠标可以少点很多次,也不要担心是否错点鼠标;
  (5)程序小,完全免费;程序小可以考虑不计,因为现在的硬盘实在太大了;完全免费就不得不考虑了,即使网络上有很多所谓的免费软件,但是,这些软件的广告却不是我们喜欢的;

wget虽然功能强大,但是使用起来还是比较简单的,基本的语法是:wget [参数列表] URL。下面就结合具体的例子来说明一下wget的用法。
1、下载整个http或者ftp站点。
wget http://place.your.url/here
这个命令可以将http://place.your.url/here 首页下载下来。使用-x会强制建立服务器上一模一样的目录,如果使用-nd参数,那么服务器上下载的所有内容都会加到本地当前目录。

wget -r http://place.your.url/here
这个命令会按照递归的方法,下载服务器上所有的目录和文件,实质就是下载整个网站。这个命令一定要小心使用,因为在下载的时候,被下载网站指向的所有地址同样会被下载,因此,如果这个网站引用了其他网站,那么被引用的网站也会被下载下来!基于这个原因,这个参数不常用。可以用-l number参数来指定下载的层次。例如只下载两层,那么使用-l 2。

要是您想制作镜像站点,那么可以使用-m参数,例如:wget -m http://place.your.url/here
这时wget会自动判断合适的参数来制作镜像站点。此时,wget会登录到服务器上,读入robots.txt并按robots.txt的规定来执行。

2、断点续传。
当文件特别大或者网络特别慢的时候,往往一个文件还没有下载完,连接就已经被切断,此时就需要断点续传。wget的断点续传是自动的,只需要使用-c参数,例如:
wget -c http://the.url.of/incomplete/file
使用断点续传要求服务器支持断点续传。-t参数表示重试次数,例如需要重试100次,那么就写-t 100,如果设成-t 0,那么表示无穷次重试,直到连接成功。-T参数表示超时等待时间,例如-T 120,表示等待120秒连接不上就算超时。

3、批量下载。
如果有多个文件需要下载,那么可以生成一个文件,把每个文件的URL写一行,例如生成文件download.txt,然后用命令:wget -i download.txt
这样就会把download.txt里面列出的每个URL都下载下来。(如果列的是文件就下载文件,如果列的是网站,那么下载首页)

4、选择性的下载。
可以指定让wget只下载一类文件,或者不下载什么文件。例如:
wget -m --reject=gif http://target.web.site/subdirectory
表示下载http://target.web.site/subdirectory,但是忽略gif文件。--accept=LIST 可以接受的文件类型,--reject=LIST拒绝接受的文件类型。

5、密码和认证。
wget只能处理利用用户名/密码方式限制访问的网站,可以利用两个参数:
--http-user=USER设置HTTP用户
--http-passwd=PASS设置HTTP密码
对于需要证书做认证的网站,就只能利用其他下载工具了,例如curl。

6、利用代理服务器进行下载。
如果用户的网络需要经过代理服务器,那么可以让wget通过代理服务器进行文件的下载。此时需要在当前用户的目录下创建一个.wgetrc文件。文件中可以设置代理服务器:
http-proxy = 111.111.111.111:8080
ftp-proxy = 111.111.111.111:8080
分别表示http的代理服务器和ftp的代理服务器。如果代理服务器需要密码则使用:
--proxy-user=USER设置代理用户
--proxy-passwd=PASS设置代理密码
这两个参数。
使用参数--proxy=on/off 使用或者关闭代理。
wget还有很多有用的功能,需要用户去挖掘。

附录:

命令格式:
  wget [参数列表] [目标软件、网页的网址]

  -V,--version 显示软件版本号然后退出;
  -h,--help显示软件帮助信息;
  -e,--execute=COMMAND 执行一个 “.wgetrc”命令

  -o,--output-file=FILE 将软件输出信息保存到文件;
  -a,--append-output=FILE将软件输出信息追加到文件;
  -d,--debug显示输出信息;
  -q,--quiet 不显示输出信息;
  -i,--input-file=FILE 从文件中取得URL;

  -t,--tries=NUMBER 是否下载次数(0表示无穷次)
  -O --output-document=FILE下载文件保存为别的文件名
  -nc, --no-clobber 不要覆盖已经存在的文件
  -N,--timestamping只下载比本地新的文件
  -T,--timeout=SECONDS 设置超时时间
  -Y,--proxy=on/off 关闭代理

-nd,--no-directories 不建立目录
  -x,--force-directories 强制建立目录

--http-user=USER设置HTTP用户
  --http-passwd=PASS设置HTTP密码
  --proxy-user=USER设置代理用户
  --proxy-passwd=PASS设置代理密码

-r,--recursive 下载整个网站、目录(小心使用)
  -l,--level=NUMBER 下载层次

-A,--accept=LIST 可以接受的文件类型
  -R,--reject=LIST拒绝接受的文件类型
  -D,--domains=LIST可以接受的域名
  --exclude-domains=LIST拒绝的域名
  -L,--relative 下载关联链接
  --follow-ftp 只下载FTP链接
  -H,--span-hosts 可以下载外面的主机
  -I,--include-directories=LIST允许的目录
  -X,--exclude-directories=LIST 拒绝的目录

中文文档名在平常的情况下会被编码, 但是在 --cut-dirs 时又是正常的,
wget -r -np -nH --cut-dirs=3 ftp://host/test/
测试.txt
wget -r -np -nH -nd ftp://host/test/
%B4%FA%B8%D5.txt
wget "ftp://host/test/*"
%B4%FA%B8%D5.txt

由於不知名的原因,可能是为了避开特殊档名, wget 会自动将抓取档名的部分用 encode_string 处理过, 所以该 patch 就把被 encode_string 处理成 "%3A" 这种东西, 用 decode_string 还原成 ":", 并套用在目录与档案名称的部分,decode_string 是 wget 内建的函式。

使用wget下载需要用户名和密码访问的网站资源相关推荐

  1. Elasticsearch增加访问权限:使用用户名和密码访问

    elasticsearch服务安装成功后,默认可以在浏览器输入地址直接访问: 现对elasticsearch增加访问权限,使用用户名和密码访问,操作步骤: 在elasticsearch安装目录的con ...

  2. 连接工作组计算机用户名和密码,访问局域网中工作组的电脑需要用户名和密码...

    日常工作中经常要建设局域网,但是建设成功后,我们发现局域网中的电脑之间访问存在一些问题.访问局域网中工作组的电脑时提示需要用户名和密码我们的解决办法及措施.下面是学习啦小编收集整理的访问局域网中工作组 ...

  3. 怎么知道本台计算机的用户名和密码,访问其它电脑时“开始-运行-\输入要连接的电脑的IP,用户名和密码输入什么?...

    访问其它电脑时"开始-运行-\输入要连接的电脑的IP",用户名和密码输入什么?以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让 ...

  4. 工作组计算机用户名和密码,访问局域网工作组需要用户名和密码怎么办

    在日常工作中经常要建设局域网,如果访问局域网中工作组的电脑时提示需要用户名和密码怎么办?下面是小编给大家整理的一些有关访问局域网工作组需要用户名和密码的解决方法,希望对大家有帮助! 访问局域网工作组需 ...

  5. apache用户名和密码验证

    一.Apache服务器已经内置用户验证机制 大家只要适当的加以设置,便可以控制网站的某些部分要用户验证.前期准备,必须已经安装apache,如果还没安装,或者对安装很模糊的话,      第1步:我们 ...

  6. win7计算机的用户名和密码,win7系统电脑,如何设置共享,共享计算机的用户名和密码...

    win7系统电脑,如何设置共享,共享计算机的用户名和密码 (6页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 15.9 积分 百度文库的东西 自己能找到方 ...

  7. Raspberry - 解决中兴(ZTE)摄像头无法使用密码访问树莓派上的samba共享(NAS)

    摄像头型号:中兴(ZTE)小兴看看Memo 树莓派上的samba版本:4.5.12-Debian 问题描述: 1. 使用正确的用户名和密码访问树莓派上的samba共享,提示账号密码不正确,无法访问. ...

  8. UOS共享功能如何使用账号密码访问

    UOS共享功能如何使用账号密码访问 使用系统自带的共享功能时,如果勾选上了允许匿名访问选项后选择匿名访问可以正常访问到共享文件目录,但是如果不开放匿名访问权限,采用账号验证登录的方式访问是无法用当前系 ...

  9. 利用浏览器开发者工具查看网站登录时的用户名和密码

    本文介绍的这种方法对于我们有时候忘记了登陆用户名和密码很有帮助,但是也从侧面透露着我们在其它设备上登录我们自己的社交网站的信息是多么的不安全,换句话说,任何人都可以轻易地获取你的账户信息. 在我们登录 ...

最新文章

  1. linux服务器lvs,Linux的企业-LVS(Linux虚拟服务器)及FULLNAT设置
  2. 赛门铁克:“高度怀疑”WannaCry的幕后黑手是朝鲜
  3. python多维数组筛选
  4. mysql常用语句整理
  5. 在非activity类调用startActivityForResult
  6. 深入理解python特性_深入理解Python特性(7)
  7. access开发精要(3)-子数据表
  8. 「Apollo」protobuf报错No module named ‘google‘
  9. 请求库-selenium 模块
  10. JavaScript--在页面的下拉框控件中遍历出日期--先天下能力工场
  11. 我的首页收藏链接之07年前的LIST
  12. 如何利用shell脚本和client-go实现自己的k8s调度器
  13. Jenkins-CI 远程代码执行漏洞复现(CVE-2017-1000353)
  14. phpExcel与jq的ajax
  15. 柯特斯公式 | 数值积分
  16. dhcp failover linux,Centos7 安装 DHCP 4.1 服务器配置及热备
  17. 速学TypeScript-精简划重点手册-中册
  18. 微信小程序实现素材旋转——非canvas
  19. 魅族容器云平台基于Kubernetes自动化运维实践
  20. php期末作业报告,期末作业(最终版).php

热门文章

  1. App Bundles
  2. java遍历list删除数据,遍历删除List中的元素方法
  3. 中国“灯塔工厂”增至50座全球第一,联合利华天津食品工厂等8家新入选 | 美通社头条...
  4. 计算机在食品科学中的应用统计学,计算机在食品研究中的应用现状分析
  5. python数据工程师薪资待遇怎么样_Python工程师工资待遇是多少
  6. VI 编辑器的一些配置
  7. 谷粒商城P139集——云服务器frp内网穿透+nginx
  8. 算法训练第十一天|力扣20. 有效的括号,1047. 删除字符串中的所有相邻重复项,150. 逆波兰表达式求值
  9. 电网招聘考试其他工学类难吗?考什么?怎么备考?
  10. 年度最具创意十佳网名 你见过几个