Jsoup抓取到页面A标签中的href路径
博客地址:博客地址
直接上代码,注释很全乎
public static void main(String[] args)throws Exception{//抓取的网址String url = "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/index.html";//编码格式的转换Document document = Jsoup.parse(new URL(url).openStream(), "GBK", url);//根据class获取到 页面的 元素内容Elements tables = document.getElementsByClass("provincetr");//根据td标签来划分Elements td = tables.select("td");for(int j=0;j<td.size();j++){//获取到标签中的内容String text = td.get(j).text();System.out.println(text);//获取A标签的href 网址 select 获取到当前A标签 attr href 获取到地址String s = td.get(j).select("a").attr("href");System.out.println(s);}}
<!-- https://mvnrepository.com/artifact/org.jsoup/jsoup --><dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.11.3</version></dependency>
需要引入以上jar包
也可以去这个网址下载,
输出的时候会抓到 "" 空字符串,大家自己判断下就好了
Jsoup抓取到页面A标签中的href路径相关推荐
- 【HTML学习笔记】link标签中的href路径
在index.html中引用外部css样式,需要索引css文件路径,但是css文件可能在不同目录下,需要根据具体情况写路径. [情况1]css文件在同一个目录下,直接写文件名即可<link re ...
- html: a标签中的href的作用
原文路径:https://blog.csdn.net/u010297791/article/details/52784879 a标签的最重要功能是实现超链接和锚点. 一.Js的几种调用方法 1.a h ...
- A标签中通过href和onclick传递的this对象实现思路
想传递当前对象给一个函数,于是就将这个URL写成"JavaScript:shoControlSidebar(this)",可是结果发现这并不可行,接下来为大家详细介绍下解决方法 在 ...
- 浏览器对HTML5中track标签中src属性路径vtt文件错误,Unsafe attempt to load URL vtt
一.出现的错误 这是我运行之后在浏览器中看不到想要的效果(没有字幕),然后查看控制台,发现有一个浏览器的拦截错误 二.寻找原因 下面这是我写的 html 文件,想要给 video 视频添加字幕 < ...
- 使用Jsoup技术获取`阿里拍卖`中法院拍卖的所有拍卖品
文章目录 前言 最终效果 效果演示 爬取所有记录 根据条件爬取 项目仓库 项目前准备 技术选型 开发工具 用到的jar包 爬取所有数据 页面分析 第一步:获取所有省份列表 代码实现 进入主页 解析页面 ...
- Java正则获取a标签href_正则表达式,同时获取a标签里的href,text 的值
string pattern = @"]+href=\s*(?:'(?[^']+)'|""(?[^""]+)""|(?[^> ...
- vue项目,webpack中配置src路径别名及使用
默认会有'@'别名,指向src目录,还可以添加自定义别名等等. 使用方法 使用别名一般就三种情况:在js中用,在css中用,在html文档内用 js中用,最简单: import {getName} f ...
- 转:MSDN Visual系列:MOSS企业级搜索之一——在搜索中心里创建自定义搜索页面和标签选项卡...
MSDN Visual系列:MOSS企业级搜索之一--在搜索中心里创建自定义搜索页面和标签选项卡 原文:http://msdn2.microsoft.com/en-us/library/bb42885 ...
- Html A标签中 href 和 onclick用法、区别、优先级别
http://gocom.primeton.com/blog21307_27051.htm 我以前在写<A>的href和onclick一直很随意,后来出过几次问题,以后才开始重视这个问题: ...
最新文章
- 2017年软件工程第四次作业-4每周例行报告
- python基础教程第4版-Python基础教程(第3版) 笔记(四)
- php使用curl下载指定大小的文件
- java代码分类_08 java代码块的概述和分类
- 【MySql】mysql-5.7.20-winx64安装配置
- Django框架之DRF 认证组件源码分析、权限组件源码分析、频率组件源码分析
- Juster的MVP奋斗之路
- php stream encoding,PHP之mb_check_encoding使用方法分享
- 【已解决】双系统 ubuntu wifi 图标消失,无法连接无线网,查询无线网卡型号安装驱动(含网络备用方案)
- C语言|控制台小游戏|打飞机(基础功能版)
- Python实现回文
- C语言发展史——程序猿抗争史
- 杭州-SQL杭州国迈软件有限公司笔试题
- 联通光猫 nat转发 - 虚拟主机设置
- HTTP(9):新增功能协议
- 【吊打面试官系列】APP测试常见面试题解析
- IntelliJ IDEA 中设置左菜单字体, 编辑器字体和控制台的字体
- 41个搜索引擎免费登陆入口大全
- error C2899: 不能在模板声明之外使用类型名称
- 如何看懂电路图--电源电路单元