大家好

我有html / text之类的东西:

first text

one: second texttwo: third textthree: fourth textfive: fifth text

我想在上面的html内容中提取名为“第一个文本”的文本

注意:此html内容不是静态的,而是动态的,因此一般的想法是获取html文本中的第一个纯文本

解决方法:

您标记了jsoup,所以您正在使用Jsoup.这已经是一个不错的选择;)

使用Jsoup的方法如下:

String html = "

first text

one: second texttwo: third textthree: fourth textfive: fifth text
";

Document document = Jsoup.parse(html);

String firstText = document.select(":containsOwn(text)").first().ownText();

System.out.println(firstText);

结果:

first text

也可以看看:

标签:jsoup,html-parsing,java,jsoup

来源: https://codeday.me/bug/20191102/1995108.html

java html2text_java-如何在html / text内容中获取文本?相关推荐

  1. html 获取文本框值,html - 如何在JavaScript中获取文本框值

    html - 如何在JavaScript中获取文本框值 我正在尝试使用JavaScript从HTML文本框中获取值,但值不是在空格之后 例如: 我只得到:上面的"软件". 我正在使 ...

  2. Microsoft Excel 教程:如何在 Excel 单元格中设置文本格式?

    欢迎观看 Microsoft Excel 教程,小编带大家学习 Microsoft Excel 的使用技巧,了解如何在 Excel 单元格中设置文本格式. 设置文本或数字的格式可以使文本或数字更明显, ...

  3. 服务器如何获取客户端证书,如何在Go HTTPS服务器中获取客户端证书

    我在尝试了解如何在Go Web服务器中获取客户端证书.这里是一个服务器代码:如何在Go HTTPS服务器中获取客户端证书 package main import ( "log" & ...

  4. python获取文本框内容_jquery获取文本框的内容

    使用jquery获取文本框的内容有以下几种: 1.根据ID取值(id属性): // javascript function getUserName(){ var username= $("# ...

  5. spark rdd map java_如何在spark RDD(JavaRDD)中获取记录的文件名

    我正在使用多个文件加载到 JavaRDD中 JavaRDD allLines = sc.textFile(hdfs://path/*.csv); 加载文件后,我修改每条记录并想保存它们.但是,我还需要 ...

  6. 头信息_如何在 Spring REST Controller 中获取 HTTP 头信息

    介绍 在本篇文章中,我们将研究如何在 Spring Rest Controller 中访问 HTTP 头信息. 首先,我们将使用 @RequestHeader 注解分别或同时读取 HTTP 头信息. ...

  7. java memcached 存储对象_java – 从Memcache中获取低级别数据存储区实体对象时的慢速反序列化...

    事实证明,检索存储内存缓存的低级数据存储实体非常缓慢.由于objectify将实体缓存为低级数据存储区实体类型,因此当使用objectify从memcache中获取许多实体时,这会导致性能不佳. 真正 ...

  8. Android中获取文本宽度和高度

    本文罗列Android中字体宽度和高度的相关概念,及测量方法 . 原文请参考Android_FontMetrics.Android字符串进阶之三:字体属性及测量(FontMetrics). Andro ...

  9. alert获取输入框内容_JS获取文本框值

    一.获取文本框/编辑框/隐藏域框 function Mycheck(){ var checkstr="获取内容如下:\n"; if (document.form1.文章作者.val ...

最新文章

  1. Docker学习(6)——registry私有仓库工作原理(续)
  2. 利用Python在Jetson TX2上抓取和显示摄像头影像
  3. sql 存储过程学习
  4. 一步一步创建ASP.NET MVC5程序[Repository+Autofac+Automapper+SqlSugar](三)
  5. Linux下用来获取各种系统信息的C++类
  6. 阿尔法狗要逆天!韩专家称其故意输李世石一局
  7. Algorithm:C++语言实现之链表相关算法(链表相加、链表的部分翻转、链表划分、链表去重、重复元素全部删除)
  8. 短代码 html,WordPress的短代码问题嵌入HTML格式
  9. 刚学会 HTML5 不久,最近用 CSS3 实现了热点地图动画
  10. 利用Redis实现消息队列原理
  11. jrebel 远程部署 配置记录
  12. timespan怎么比较大小_万能小哥丨厨房墙砖哪种好?厨房墙砖怎么挑选?
  13. 有效电子邮件地址的最大长度是多少?
  14. 在一线城市做Java开发如何月薪达到两万,需要技术水平达到什么程度?
  15. 百度螺旋桨PaddleHelix论道“AI+生物计算”,加速推进多维价值释放
  16. 电子签章引入jar包
  17. OpenJudge 1.6.4
  18. NetSuite 合并报表之外币折算差异(CTA)
  19. html帮助文档怎么翻译,HTML文档,HTML document,音标,读音,翻译,英文例句,英语词典
  20. 无线数字DR平板探测器维修瓦里安PaxScan 4030X分析

热门文章

  1. Linux思维导图及命令速查表8张
  2. UNIX网络编程:unpv13e编译错误:net/if_dl.h:没有那个文件或目录
  3. 越狱后必装软件_iOS 13全系统越狱详细教程疑难解答
  4. IDEA打包jar包(打包可运行jar,外部引用jar包版)
  5. mybatis--properties以及别名定义(四)
  6. 单片机与普通微型计算机不同在于,单片机与普通计算机的不同之处在于什么,单片机与普通微型计算机的不同...
  7. 三角形周长最短问题_2019年中考数学压轴题分析——最短路径问题8:造桥选址...
  8. android动态设置全屏,Android开发之全屏与非全屏的切换设置方法小结
  9. 使用Angular和ASP.net Core的Raw Websockets迷你游戏
  10. 从零开始实现ASP.NET Core MVC的插件式开发(一) - 使用ApplicationPart动态加载控制器和视图