博客地址:博客地址

直接上代码,注释很全乎

    public static void main(String[] args)throws Exception{//抓取的网址String url = "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/index.html";//编码格式的转换Document document = Jsoup.parse(new URL(url).openStream(), "GBK", url);//根据class获取到 页面的 元素内容Elements tables = document.getElementsByClass("provincetr");//根据td标签来划分Elements td = tables.select("td");for(int j=0;j<td.size();j++){//获取到标签中的内容String text = td.get(j).text();System.out.println(text);//获取A标签的href 网址  select 获取到当前A标签 attr href 获取到地址String s = td.get(j).select("a").attr("href");System.out.println(s);}}
        <!-- https://mvnrepository.com/artifact/org.jsoup/jsoup --><dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.11.3</version></dependency>

需要引入以上jar包

也可以去这个网址下载,

输出的时候会抓到  ""  空字符串,大家自己判断下就好了

Jsoup抓取到页面A标签中的href路径相关推荐

  1. 【HTML学习笔记】link标签中的href路径

    在index.html中引用外部css样式,需要索引css文件路径,但是css文件可能在不同目录下,需要根据具体情况写路径. [情况1]css文件在同一个目录下,直接写文件名即可<link re ...

  2. html: a标签中的href的作用

    原文路径:https://blog.csdn.net/u010297791/article/details/52784879 a标签的最重要功能是实现超链接和锚点. 一.Js的几种调用方法 1.a h ...

  3. A标签中通过href和onclick传递的this对象实现思路

    想传递当前对象给一个函数,于是就将这个URL写成"JavaScript:shoControlSidebar(this)",可是结果发现这并不可行,接下来为大家详细介绍下解决方法 在 ...

  4. 浏览器对HTML5中track标签中src属性路径vtt文件错误,Unsafe attempt to load URL vtt

    一.出现的错误 这是我运行之后在浏览器中看不到想要的效果(没有字幕),然后查看控制台,发现有一个浏览器的拦截错误 二.寻找原因 下面这是我写的 html 文件,想要给 video 视频添加字幕 < ...

  5. 使用Jsoup技术获取`阿里拍卖`中法院拍卖的所有拍卖品

    文章目录 前言 最终效果 效果演示 爬取所有记录 根据条件爬取 项目仓库 项目前准备 技术选型 开发工具 用到的jar包 爬取所有数据 页面分析 第一步:获取所有省份列表 代码实现 进入主页 解析页面 ...

  6. Java正则获取a标签href_正则表达式,同时获取a标签里的href,text 的值

    string pattern = @"]+href=\s*(?:'(?[^']+)'|""(?[^""]+)""|(?[^> ...

  7. vue项目,webpack中配置src路径别名及使用

    默认会有'@'别名,指向src目录,还可以添加自定义别名等等. 使用方法 使用别名一般就三种情况:在js中用,在css中用,在html文档内用 js中用,最简单: import {getName} f ...

  8. 转:MSDN Visual系列:MOSS企业级搜索之一——在搜索中心里创建自定义搜索页面和标签选项卡...

    MSDN Visual系列:MOSS企业级搜索之一--在搜索中心里创建自定义搜索页面和标签选项卡 原文:http://msdn2.microsoft.com/en-us/library/bb42885 ...

  9. Html A标签中 href 和 onclick用法、区别、优先级别

    http://gocom.primeton.com/blog21307_27051.htm 我以前在写<A>的href和onclick一直很随意,后来出过几次问题,以后才开始重视这个问题: ...

最新文章

  1. 2017年软件工程第四次作业-4每周例行报告
  2. python基础教程第4版-Python基础教程(第3版) 笔记(四)
  3. php使用curl下载指定大小的文件
  4. java代码分类_08 java代码块的概述和分类
  5. 【MySql】mysql-5.7.20-winx64安装配置
  6. Django框架之DRF 认证组件源码分析、权限组件源码分析、频率组件源码分析
  7. Juster的MVP奋斗之路
  8. php stream encoding,PHP之mb_check_encoding使用方法分享
  9. 【已解决】双系统 ubuntu wifi 图标消失,无法连接无线网,查询无线网卡型号安装驱动(含网络备用方案)
  10. C语言|控制台小游戏|打飞机(基础功能版)
  11. Python实现回文
  12. C语言发展史——程序猿抗争史
  13. 杭州-SQL杭州国迈软件有限公司笔试题
  14. 联通光猫 nat转发 - 虚拟主机设置
  15. HTTP(9):新增功能协议
  16. 【吊打面试官系列】APP测试常见面试题解析
  17. IntelliJ IDEA 中设置左菜单字体, 编辑器字体和控制台的字体
  18. 41个搜索引擎免费登陆入口大全
  19. error C2899: 不能在模板声明之外使用类型名称
  20. 如何看懂电路图--电源电路单元

热门文章

  1. 系统分析师学习笔记(二十)
  2. 魔兽转移账号的服务器,《魔兽世界》经典怀旧服免费角色转移
  3. python-函数参数
  4. python可变参数报错_Python之可变参数,*参数,**参数,以及传入*参数,进行解包...
  5. 线性回归拟合优度度量
  6. 根除任务栏天猫618超级狂欢红包广告方法,亲测有用
  7. react将前端Blob类型文件传到后台
  8. BIM家装族库丨柜子族
  9. 怎么将OFD电子发票免费转换PDF或Word文档
  10. 移动互联改变了我们的生活