在解析获得一个Document实例对象,并查找到一些元素之后,我们如何取得在这些元素中的数据呢???

使用Jsoup抽取属性,一般方法如下:
1.要取得一个属性的值,可以使用Node.attr(String key) 方法
2.对于一个元素中的文本,可以使用Element.text()方法
3.对于要取得元素或属性中的HTML内容,可以使用Element.html(), 或 Node.outerHtml()方法

示例

String html = "<p>An <a href='http://baidu.com/'><b>baidu</b></a> link.</p>";
Document doc = Jsoup.parse(html);//解析HTML字符串返回一个Document实现
Element link = doc.select("a").first();//查找第一个a元素</pre>String text = doc.body().text(); // "An baidu link"//取得字符串中的文本
String linkHref = link.attr("href"); // "http://baidu.com/"//取得链接地址
String linkText = link.text(); // "baidu""//取得链接地址中的文本</pre>String linkOuterH = link.outerHtml();
// "<a href="http://baidu.com"><b>baidu</b></a>"
String linkInnerH = link.html(); // "<b>baidu</b>"//取得链接内的html内容

解说:
 上述方法是元素数据访问的核心办法。此外还其它一些方法可以使用:

Element.id()
Element.tagName()
Element.className() and Element.hasClass(String className)

这些访问器方法都有相应的setter方法来更改数据.

Jsoup从元素中抽取属性 文本和HTML相关推荐

  1. HTML元素中的属性2(路径详解)—零基础自学网页制作

    相对路径与绝对路径的使用方法 在<HTML元素中的属性1-零基础自学网页制作>这一篇教程最后内容中,我们详细展示了"绝对路径"与"相对路径"在写法上 ...

  2. input眼睛显示 vue_修改表单元素中placeholder属性样式、清除IE浏览器中input元素的清除图标和眼睛图标...

    一.修改input元素placeholder属性样式 在做项目的时候,一般表单元素的placeholder属性样式都是使用浏览器默认的,但有时候为了追求设计上的美感需要修表单元素的placeholde ...

  3. java vtd-xml_在java中使用vtd-xml获取xml中的属性文本

    给出以下xml: Lorem ipsum... .... ... 我正在使用带有XPath的vtd-xml来检索'textGoal',如下所示: VTDGen vg = new VTDGen(); v ...

  4. HTML中td元素的nowrap属性

    HTML中td元素的nowrap属性表示禁止单元格中的文字自动换行. 但使用时要注意的是,td元素中nowrap属性的行为与td元素的width属性有关.如果未设置td宽度,则nowrap属性起作用的 ...

  5. jsoup 获取html中body内容_jsoup实现java抓取网页内容

    jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址.HTML文本内容.它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据.jsoup ...

  6. ​​​​​​​​​​​​​​使用dom方式遍历文档||获取元素||从元素中获取数据

    使用dom方式遍历文档 获取元素 根据id查询元素getElementById 根据标签获取元素getElementsByTag 根据class获取元素getElementsByClass 根据属性获 ...

  7. php js怎么去掉类属性,如何修改DOM中的属性,类和样式

    通过jQuery来获取要修改的DOM元素,然后通过JavaScript中方法来对属性.类以及样式进行修改 今天在本篇文章中将分享的是如何通过修改html元素节点的样式,类和属性来进一步的更改dom,, ...

  8. 单击时选择HTML文本输入中的所有文本

    我有以下代码在HTML网页中显示文本框. <input type="text" id="userid" name="userid" v ...

  9. html常用语义化元素和全局属性整理

    WWW www其实是World Wide Web 的缩写,它是一个由许多互相链接的超文本组成的系统,通过互联网访问, 在汉语中,www 被翻译成(web 万维网 全球广域网). <HTML> ...

最新文章

  1. mysql 相除 取整数位,psql除法保留小数,实现向上取整和向下取整操作_PostgreSQL_数据库...
  2. 【小白学习PyTorch教程】四、基于nn.Module类实现线性回归模型
  3. python写入一个文件之前可以不打开_如何用python实现真正的打开和关闭文件
  4. PHP函数,方法,接口
  5. 乱查征信,贷款不想要了吗?
  6. 夺命雷公狗---linux NO:19 linux下的vi交换文件
  7. windows 下安装nodejs及其配置环境
  8. 7 php程序的调试方法_PHP 程序员的调试技术
  9. Java数据结构:双向链表Double Linked List基础笔记
  10. 23个Python爬虫开源项目代码:微信、淘宝、豆瓣、知乎、微博等。我要做马来人...
  11. 校园学生疫情防范监控小程序 毕业设计-附源码281444
  12. J2SE 1.5的for增强循环
  13. [详解] iphone手机备份、升级流程
  14. 20090726选股
  15. 【计算机基础】-2万字总结《计算机速成课》全集笔记
  16. STM32跳入HardFault Handler中断分析
  17. 细菌觅食算法(Bacterial Foraging Optimization)
  18. metascape没有输出通路图
  19. Windows便捷长时间检测网络丢包
  20. Docker精华问答 | Docker commit如何用?

热门文章

  1. dw中html颜色的设置颜色代码,Dreamweaver 如何编辑字体大小颜色
  2. edge浏览器下载位置设置在哪里设置
  3. 日志中出现乱码_合宙Luat | 乱码搞得一团糟?开源神器帮你轻松修复
  4. qtabwidget放大_Qt自定义弹窗屏蔽父窗口(QWidget设置setWindowModality(Qt::ApplicationModal);以后再show)...
  5. 为什么要用枚举实现单例模式(避免反射、序列化问题)
  6. 学习Spring Boot:(十八)Spring Boot 中session共享
  7. 学习Spring Boot:(一)入门
  8. Java操作Excel中HSSFCell.CELL_TYPE_STRING、BOOLEAN、NUMERIC无定义解决方法
  9. php 域名白名单,域名白名单验证
  10. 机器视觉 光学工程专业_瑞士Idonus MEMS制造设备 创新技术 机器视觉测量(远心光学)...