import org.jsoup.nodes.Element; //导入方法依赖的package包/类

public static String parseForContent(String key, Element seItemBody) {

String content = seItemBody.outerHtml();

// check if key is found and remove everything in front

int keyOccurrence = content.toLowerCase().indexOf(key);

if (keyOccurrence == -1) {

return "";

} else {

content = content.substring(keyOccurrence + key.length());

}

// check if line break is found and remove everything in front

// assumption: content is right after the key and on new line

int firstLineBreak = content.indexOf("
");

if (firstLineBreak == -1) {

return "";

} else {

content = content.substring(firstLineBreak + 4);

}

content = content.replaceAll("\r", "");

content = content.replaceAll("\n", "");

// only read until the next line break

Pattern patternLineBreak = Pattern.compile("(.+?)
.*");

Matcher matcherLineBreak = patternLineBreak.matcher(content);

// if no line break tag is found just read until the next html tag occurs

Pattern patternTag = Pattern.compile("(.+?)<.>.*");

Matcher matcherTag = patternTag.matcher(content);

if (matcherLineBreak.find()) {

content = matcherLineBreak.group(1);

} else if (matcherTag.find()) {

content = matcherTag.group(1);

} else {

LOG.debug("No end html tag for key '{}' in [{}] parsed from [{}]", key, content, seItemBody.outerHtml());

}

content = content.trim();

return content;

}

java htmlelement_Java Element.outerHtml方法代码示例相关推荐

  1. java getdocument_Java Element.getDocument方法代码示例

    import javax.swing.text.Element; //导入方法依赖的package包/类 /** * Writes out all empty elements (all tags t ...

  2. java kryo_Kryo框架使用方法代码示例

    Kryo框架的source已移至https://github.com/EsotericSoftware/kryo ,进入此页面,然后点击右边的Download Zip按钮,就能下载到最新版本的Kryo ...

  3. java readtimeout_Java HttpURLConnection.getReadTimeout方法代码示例

    import java.net.HttpURLConnection; //导入方法依赖的package包/类 /** * 得到响应对象 * * @param urlConnection * @retu ...

  4. java invalidate_Java Component.invalidate方法代码示例

    import java.awt.Component; //导入方法依赖的package包/类 /** Installs the component we will embed to display t ...

  5. java hasmoreelements_Java IOException.hasMoreElements方法代码示例

    import java.io.IOException; //导入方法依赖的package包/类 /** * fileName���� ���� package �������� ������ ���� ...

  6. java methode_Java Method.getTypeParameters方法代码示例

    import java.lang.reflect.Method; //导入方法依赖的package包/类 private void validateRuleMethod(MethodRuleDefin ...

  7. java locationuitool_Java JavaUI.getLibraryJavadocLocation方法代码示例

    import org.eclipse.jdt.ui.JavaUI; //导入方法依赖的package包/类 /** * Shows the UI for configuring a javadoc l ...

  8. java setmethod_Java Operation.setJavaMethod方法代码示例

    import com.sun.tools.internal.ws.processor.model.Operation; //导入方法依赖的package包/类 private void createJ ...

  9. java cancel_Java RunnableFuture.cancel方法代码示例

    import java.util.concurrent.RunnableFuture; //导入方法依赖的package包/类 @Test public void testSnapshotAsyncC ...

  10. java getevent_Java ActionEvent.getWhen方法代码示例

    import java.awt.event.ActionEvent; //导入方法依赖的package包/类 @Override final public void actionPerformed(A ...

最新文章

  1. linux fedora自带终端字体间距过大问题解决
  2. 推荐一款优雅的日历控件
  3. python3.5 pip安装_用python3.5 pip安装Numpy
  4. Qt总结二十一:Qt控件一(QWidget)
  5. Docker实践 -- 安装Docker
  6. 扩展JavaScript数组(Array)添加删除元素方法
  7. qtcpserver无法启动监听_EOS基础全家桶(四)启动节点
  8. vscode vue项目设置代理为locahost 始终无法连接本地项目
  9. 【郝斌C语言课程】学习笔记
  10. Linux核心进程管理命令
  11. 如何写出一份好的解决方案
  12. wps使用切片器,解决切片器灰色问题
  13. 声纹识别技术简介——化繁为简的艺术
  14. 电视盒子显示ntp服务器异常,云计算-更换VRM主节点所在服务器主板后,出现VRM与NTP服务器状态异常的处理方法...
  15. swiper网格布局
  16. PyCharm2017破解教程
  17. BAPI货物移动时报错
  18. 随着窗体大小变化改变控件的大小和字体
  19. 查看Windows10系统版本的方法
  20. kickstart自动化系统安装_自动化运维之kickstart自动化部署安装操作系统

热门文章

  1. 系统架构师必须掌握的英语单词
  2. Raspberry 4B 2G Shairport-sync Airplay
  3. 躲避方块的球——C语言游戏
  4. 安装和使用华三HCL模拟器的常见问题总结
  5. [转] 如何把书上的字弄到电脑上
  6. 让以前的淘帝起死回生,淘客帝国 n…
  7. 筹备酒吧之路——音响篇
  8. DllRegisterServer调用失败的解决办法
  9. Allegro封装制作
  10. 常用元器件封装的命名规范-002