Java,jsoup天龙八部畅易阁爬虫
获取角色元宝数量和采矿等级。
public class Changyige {public static void main(String[] args) throws InterruptedException {for (int i =2; i < 22; i++) {String htmlAdress = "http://tl.cyg.changyou.com/goods/selling?world_id=5121&world_name=%25E6%25B8%2585%25E6%25AD%258C%25E9%2581%25A5%25E6%259C%259B%25E6%259C%2588&area_name=%25E7%25BA%25B5%25E6%25A8%25AA%25E5%258F%258C%25E7%25BA%25BF&have_chosen=&page_num="+i;Document doc = null;try {doc = Jsoup.connect(htmlAdress).get();} catch (IOException e) {System.out.println(i);e.printStackTrace();}Elements link = doc.select("a");//查找第一个a元素Set<String> s = new TreeSet<>();for (int j = 0; j < link.size(); j++) {String linkHref = link.get(j).attr("href"); // "http://example.com/"//取得链接地址//System.out.println(linkHref);if(j>=123 && j<=181) { s.add(linkHref); }}for (String address : s) {Document docc = null;try {docc = Jsoup.connect(address).get();} catch (IOException e) {System.out.println(address);e.printStackTrace();}try {//if(getYBCount(docc)>4000 ) {// System.out.println(address);//}if( getLifeCount(docc) >6) {System.out.println(" - "+address);}} catch (IOException e) {e.printStackTrace();}Thread.sleep(1000l);}Thread.sleep(200l);}}//获取元宝数量public static int getYBCount(Document doc) throws IOException {//201909212135597616Elements links = doc.getElementsByClass("row2");String linkText = links.get(29).text();int count = Integer.valueOf(linkText.substring(5));return count;}//获取采矿等级public static int getLifeCount(Document doc) throws IOException{Elements elements = doc.getElementsByTag("script");String text = elements.get(8).data();Document document = Jsoup.parse(text);Elements links = document.getElementsByClass("method-info");String text2 = links.get(links.size()-6).text();int level = Integer.valueOf(text2.substring(6));return level;}}
Java,jsoup天龙八部畅易阁爬虫相关推荐
- 畅易阁老是显示服务器忙,畅易阁全服开放 盘点天龙玩家卖号的几大原因
相信不少需要卖号的玩家或者需要买号,或者是关注畅易阁已久的人都相当兴奋!不过之前关于畅易阁的报导太多太多了,在这里轩轩想掰一掰哪些卖号的原因. 卖号原因之一:现实过于忙碌 其实现实过于忙碌分好多好多种 ...
- Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索
Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索 一.资源 为什么接下来的代码中要使用el.getElementsByTa ...
- java jsoup 网络爬虫 jsoup解析html Java爬虫 Jsoup爬虫 jsoup例子
java jsoup 网络爬虫 java jsoup 网络爬虫 学习例子(一)抓取豆瓣电影名称+推荐星级 java jsoup 网络爬虫 学习例子(二)只抓取豆瓣电影5星(力荐)电影名称 java j ...
- java jsoup 多线程爬虫Miner
java jsoup 多线程爬虫Miner 需要配置项: 1.URL包含关键字. 2.存储方式:DB-数据库存储;FILE-文件存储. 3.爬取页面最大深度. 4.下载页面线程数. 5.分析页面线程数 ...
- java毕业设计——基于java+Jsoup+HttpClient的网络爬虫技术的网络新闻分析系统设计与实现(毕业论文+程序源码)——网络新闻分析系统
基于java+Jsoup+HttpClient的网络爬虫技术的网络新闻分析系统设计与实现(毕业论文+程序源码) 大家好,今天给大家介绍基于java+Jsoup+HttpClient的网络爬虫技术的网络 ...
- java jsoup 网络爬虫 学习例子(八)京东和淘宝商品比价 PhantomJS
java jsoup 网络爬虫 学习例子(八)京东和淘宝商品比价 PhantomJS /** filename getHtml.js* phantomjs.exe 2.0.0* author InJa ...
- Java+Jsoup爬虫小红书
源码链接:https://pan.baidu.com/s/1oOAxJqSMCyVJPNv-iAYW7A 提取码:1co9 Java+Jsoup爬虫小红书,微博,B站 爬取地址:https://www ...
- Java+Jsoup爬虫微博
源码链接:https://pan.baidu.com/s/1oOAxJqSMCyVJPNv-iAYW7A 提取码:1co9 Java+Jsoup爬虫小红书,微博,B站 爬取地址:https://wei ...
- java jsoup 网络爬虫 学习例子(六)京东和当当商品比价
java jsoup 网络爬虫 学习例子(六)京东和当当商品比价 package com.iteye.injavawetrust.jdvsdd;import java.util.List;/*** * ...
最新文章
- R语言使用hexSticker包将ggplot2包可视化的结果转换为六角图(六角贴、六角形贴纸、ggplot2 plot to hex sticker)、并自定义设置文本的内容、文本对应的字体
- 使用LitePal操作数据库(CRUD增删改查) 项目已上传GitHub
- Centos7安装apt-get 在centos下用yum install xxx 不是使用apt-get
- vscode 标准库位置_如何在VSCode中使用标准
- feach同步 git_git fetch 更新远程代码到本地仓库
- Spring4.x(9)--Spring的Hibernate事务-XML
- 遍历map时删除不需要的元素方法
- vscode中控制台不能输入_vscode控制台不能输入怎么办
- JS获取页面 GET 方式请求的参数
- 数字电压表设计程序用c语言at89c51 adc0808,51单片机的ADC0808数字电压表设计
- 115怎么利用sha1下载东西_用于批量倾倒和提取的115 sha1工具
- android加速传感器应用,如何在android智能手机中使用加速计传感器查找位移距离?...
- 数据结构练习题――中序遍历二叉树
- 打开php文件url格式,url格式是什么
- (转)一位计算机牛人的心得,谈到计算机和数学,很实用
- DLL输出类使用研究手记(ZZ)
- Linux 从入门到了解
- 密度峰值聚类算法介绍(DPC)
- HG6543C1(3) --- 配置frp
- eMule连接到进ed2k网络分析