jsoup爬取王者荣耀所有英雄背景图片


import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;import java.io.*;
import java.net.MalformedURLException;
import java.net.URL;public class wzry {static String url = "https://pvp.qq.com/web201605/herolist.shtml";static String path = "d://img/";public static void getImgs(String url) {try {//加载对应网址上的HTML代码Document document = Jsoup.connect(url).userAgent("Mozilla/4.0(compatible;MSIE 9.0;Windows NT 6.1;Trident/5.0)").get();System.out.println(document);//查找显示图片的ul标签Elements s = document.select("[class=herolist clearfix]");//在ul标签中查找li标签Elements i = s.select("li");//for循环,遍历所有的li标签,获取详情页地址,以及头像图片(forEach)for (Element e : i) {//找到英雄详情页地址//从li标签中找到a标签,并且获取到里面href属性值String h = e.select("a").attr("href");//获取英雄名称text();获取标签中的文本内容String hm = e.select("a").text();//拼接详情页的地址String de = "https://pvp.qq.com/web201605/" + h;Document d2 = Jsoup.connect(de).userAgent("Mozilla/4.0(compatible;MSIE 9.0;Windows NT 6.1;Trident/5.0)").get();Elements div = d2.select("[class=zk-con1 zk-con]");String bg = div.attr("style");//System.out.println(bg);//substring(起始位置,终止位置);String heroImgURL = bg.substring(16, bg.length() - 11);System.out.println(heroImgURL);String urlimg = path + hm + ".jpg";//download(下载地址URL,保存路径);download("http:" + heroImgURL, urlimg);}} catch (IOException e) {e.printStackTrace();}}public static void download(String u, String path) {try {URL url = new URL(u);//输入流DataInputStream dataInputStream = new DataInputStream(url.openStream());//输出流FileOutputStream fileOutputStream = new FileOutputStream(path);ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();byte[] buffer = new byte[1024];int length = 0;while ((length = dataInputStream.read(buffer)) != -1) {byteArrayOutputStream.write(buffer, 0, length);}fileOutputStream.write(byteArrayOutputStream.toByteArray());fileOutputStream.close();dataInputStream.close();byteArrayOutputStream.close();} catch (MalformedURLException e) {e.printStackTrace();} catch (FileNotFoundException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();}}public static void main(String[] args) {long start = System.currentTimeMillis();getImgs(url);long end = System.currentTimeMillis();System.out.println("图片下载完毕!一共耗时:" + (end - start) / 1000.0);}
}

jsoup爬取王者荣耀所有英雄背景图片相关推荐

  1. Python爬取王者荣耀全英雄全皮肤图片

    Python爬取王者荣耀全英雄全皮肤图片 前言 思路 分析 编码 案例源码 附图 总结 前言 以前写过类似的博客,利用Java爬取王者荣耀全英雄全皮肤图片,当时是利用 jsoup包来对目标网页进行解析 ...

  2. python爬虫-20行代码爬取王者荣耀所有英雄图片,小白也轻轻松松

    1.环境 python3.6 需要用到的库: re.os.requests 2.简介 王者荣耀可以算得上是比较受欢迎的手游之一了,应该有不少的人都入坑过农药,我们今天的目的就是要爬取王者荣耀的高清英雄 ...

  3. python爬虫爬取图片代码_python爬虫-20行代码爬取王者荣耀所有英雄图片,小白也轻轻松松...

    1.环境python3.6 需要用到的库: re.os.requests 2.简介 王者荣耀可以算得上是比较受欢迎的手游之一了,应该有不少的人都入坑过农药,我们今天的目的就是要爬取王者荣耀的高清英雄壁 ...

  4. Java爬取王者荣耀全英雄全皮肤图片

    编码前准备: 导入maven依赖: <!-- https://mvnrepository.com/artifact/org.jsoup/jsoup --><dependency> ...

  5. python爬取王者_python爬取王者荣耀APP英雄皮肤-Go语言中文社区

    我们用fillder抓包下载,>>fillder软件下载 1.下载安装软件,设置Tools >> HTTPS里面全部勾选 2.options >> connecti ...

  6. python爬取王者皮肤_Python爬取王者荣耀所有英雄以及高清大图

    爬虫的原理: 模拟浏览器的行为,通过网络请求将目标网页抓取到本地. 使用一定的匹配规则,将目标网页中需要的数据提取出来,把不需要的过滤掉. 根据需求,把提取出来的数据存储到磁盘中(json.csv.e ...

  7. python爬取王者_Python爬取王者荣耀所有英雄以及高清大图

    爬虫的原理: 模拟浏览器的行为,通过网络请求将目标网页抓取到本地. 使用一定的匹配规则,将目标网页中需要的数据提取出来,把不需要的过滤掉. 根据需求,把提取出来的数据存储到磁盘中(json.csv.e ...

  8. 通过进程池爬取王者荣耀所有英雄皮肤和技能详情

    首先设置UA池 def UserAgent():list = ['Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like ...

  9. Python爬取王者荣耀所有英雄以及高清大图

    转自 https://www.jianshu.com/p/93aba4661652

最新文章

  1. 输入三个字符串按由小到大输出
  2. epoll_data_t里面的void *ptr; int fd; u32; u64 分析
  3. Zend Framework 的 PHP 编码标准
  4. C++ vector中的resize,reserve,size和capacity函数讲解
  5. ArcGIS特殊标注效果的简单实现
  6. 【算法竞赛学习】气象海洋预测-Task5 模型建立之 SA-ConvLSTM
  7. 【ArcGIS微课1000例】0004:值提取至点(Extract value to point)
  8. 开课吧Java教程什么是类集接口
  9. 互联网转型需要微服务架构
  10. CIO圈子—CIO成长交流的平台
  11. 2014.01.25 JFinal 使用经验积累
  12. 数模(6):Leslie矩阵人口模型
  13. 目标识别—SSD网络详解
  14. React H5图片压缩上传
  15. 苹果手机又刷屏啦!!它是如何做到的?
  16. 虾扑 - 货源采集便捷无忧
  17. 弹簧振子运动方程推导
  18. 都2022年了 究竟什么叫旗舰手机?
  19. python怎么安装turtle_Turtle模块安装
  20. 上传图片到OSS,并按指定大小范围压缩图片。完整工具类+三层调用

热门文章

  1. 23.5 MySQL架构
  2. kafka(15) Kafka Connect
  3. 视频教程-Ajax+jquery从入门到精通2017视频教程-JavaScript
  4. 实现对 2:3 或者3:2的图片进行1:1裁剪
  5. Veins/OMNeT/SUMO:SUMO坐标转Veins项目地图中的坐标
  6. 可积 连续 可微 可导关系
  7. 美国顶级在线教育平台泄露22TB数据
  8. RT-Thread 4.1.0 开启 PM 电源管理框架
  9. 靶机16 GROTESQUE: 2
  10. NiFi Registry元数据详细介绍