剩者为王的一段解析html代码:(项目地址:https://github.com/WuXiaolong/WeWin)

                    mDocument = Jsoup.parse(doc);if (isFirst) {titleData = new ArrayList<String>();Elements es = mDocument.getElementsByClass("xlistju");for (Element e : es) {titleData.add(e.text());}}hrefData = new ArrayList<String>();Elements es1 = mDocument.getElementsByClass("chromeimg");for (Element e : es1) {hrefData.add(e.attr("src"));}data = new ArrayList<Map<String, Object>>();for (int i = 0; i < hrefData.size(); i++) {map = new HashMap<String, Object>();if (isFirst) {map.put("title", titleData.get(i));}map.put("imgUrl", hrefData.get(i));data.add(map);}mData.addAll(data);

上面代码中第一行的html(String:doc)的一部分源码如下:

  <div class="views-field-phpcode"><div class="views-field-phpcode"><a href="/ju/59993?juzipic=jdzrma6" title="查看本句" rel="nofollow"><img class="chromeimg" alt="美图美句_小清新图片_jdzrma6" src="http://file.juzimi.com/weibopic/jdzrma6.jpg" width="298px" height="198px" /></a></div><div class="views-field-phpcode-1"><a href="/ju/59993?juzipic=jdzrma6" title="查看本句" class="xlistju" rel="nofollow" >第一,她离开。
<br/>第二,他永别。
<br/>第三,不入局。
<br/>第四,放桓远。</a></div><div class="xqjulistwafo">——<a href="/writer/天衣有风" rel="tag" title="原作者:天衣有风" class="views-field-field-oriwriter-value">天衣有风</a><span class="views-field-field-oriarticle-value">《<a href="/article/凤囚凰" rel="tag" title="出自《凤囚凰》" class="active">凤囚凰</a>》</span></div><div class="views-field-name"><div class="views-field-xqname"><a title="发布人:别期有定 porvinci" href="/u/9751" class="xqusernpop" juuid="9751">别期有定 porvinci</a></div></div><div class="views-field-ops"><a href="/user/login?destination=ju/59993&me=flag" class="flag-action" rel="nofollow" title="喜欢本句">喜欢(37)</a></div><div class="views-field-field-addtoalbum-value"><div class="alllistaddtoalbum"><a href="/user/login?destination=ju/59993&me=addal" class="alllistatalink" title="把这个句子加入你的句集" rel="nofollow">加入句集</a></div></div><div class="views-field-comment-count"><div class="node-nid">59993</div><div class="user-uid">0</div><a href="/comment/reply/59993" class="comment-link">添加评论</a></div><div class="views-field-phpcode-2"><div class='meijusharlabel'>分享到: </div><a class="xqrlistshare_weixin" href="/fenxiangdaoweixin.php?url=ju/59993?juzipic=jdzrma6" title="分享到微信" target="_blank" rel="nofollow">分享到微信</a><div id="bdshare" class="bdshare_t bds_tools get-codes-bdshare" data="{'text':'第一,她离开。 第二,他永别。 第三,不入局。 第四,放桓远。 ——@天衣有风 《凤囚凰》','desc':'第一,她离开。 第二,他永别。 第三,不入局。 第四,放桓远。 ——天衣有风 《凤囚凰》','url':'http://www.juzimi.com/ju/59993','pic':'http://file.juzimi.com/weibopic/jdzrma6.jpg'}"><a class="bds_tsina"></a><a class="bds_tqq"></a><a class="bds_qzone"></a><a class="bds_renren"></a><a class="bds_douban"></a><a class="bds_tieba"></a><a class="bds_fbook"></a><span class="bds_more"></span><a class="shareCount"></a></div></div>  </div></div><div class="views-row views-row-4 views-row-even">

根据名称找到class列表

mDocument.getElementsByClass("xlistju");

e.text()拿出内容

e.attr("src")拿出src属性内容...

Jsoup解析html代码相关推荐

  1. 一步步教你为网站开发Android客户端---HttpWatch抓包,HttpClient模拟POST请求,Jsoup解析HTML代码,动态更新ListView...

    本文面向Android初级开发者,有一定的Java和Android知识即可. 文章覆盖知识点:HttpWatch抓包,HttpClient模拟POST请求,Jsoup解析HTML代码,动态更新List ...

  2. 关于Jsoup解析https网页的问题

    针对Jsoup解析https网页,网上的一段源码执行后并不能实现成功访问. import java.net.MalformedURLException; import java.net.URL; im ...

  3. Android开发探秘之三:利用jsoup解析HTML页面

    这节主要是讲解jsoup解析HTML页面.由于在android开发过程中,不可避免的涉及到web页面的抓取,解析,展示等等,所以,在这里我主要展示下利用jsoup jar包来抓取cnbeta.com网 ...

  4. Andorid中使用Jsoup解析库解析XML、HTML、Dom节点---第三方库学习笔记(三)

    XML介绍: XML简介: XML,可扩展标记语言,标准通用标记语言的子集. 一种用于标记电子文件使其具有结构性的标记语言. 它可以用来标记数据.定义数据类型 是一种允许用户对自己的标记语言进行定义的 ...

  5. XML解析——Jsoup解析器

    一.Jsoup解析器快速入门案例 Docement对象,文本对象,包含着各个Dom树结构 1.引入Jsoup解析器的jar包放在lib文件夹下后,写java代码 其中, 二.Jsoup对象 1.Jso ...

  6. Jsoup解析HTML实例及文档方法详解

    转载自  Jsoup解析HTML实例及文档方法详解 这篇文章主要介绍了Jsoup如何解析一个HTML文档.从文件加载文档.从URL加载Document等方法,对Jsoup常用方法做了详细讲解,最近提供 ...

  7. java jsoup解析_3使用Jsoup解析Java中HTML文件的示例

    java jsoup解析 HTML是Web的核心,无论您是通过JavaScript,JSP,PHP,ASP或任何其他Web技术动态生成的,您在Internet上看到的所有页面都是基于HTML的. 您的 ...

  8. jsoup html转义处理,jsoup解析网页出现转义符问题

    https://www.oschina.net/question/996055_136438 *************************************** 我要解析这个网页  htt ...

  9. Jsoup解析html某片段的问题

    案例 问题分析 解决办法 案例 在使用jsoup解析html中的某部分片段时,有时候会遇到解析不出字段.下面以案例进行讲解. <tr><td class='center'>&l ...

最新文章

  1. java注解的执行顺序_深入理解Spring的@Order注解和Ordered接口
  2. 字符串处理 回文串 说反话
  3. MPlayer在ARM上的移植(S5PV210开发板)
  4. Python使用LDAP做用户认证
  5. C#设计模式之0-简单工厂模式
  6. python从入门到精通百度云资源-Python从入门到精通(资源汇总)
  7. Suggestion: add 'tools:replace=android:value' to meta-data element at AndroidManifest.xml:25:5-2...
  8. IN改写关联注意事项!
  9. 标签打印软件如何灵活调整打印方向
  10. 处理 ps cs3 打开提示 产品已停止 故障
  11. 仿金蝶进销存源码(含数据库脚本)
  12. JavaScript中怪异现象true和false
  13. Chrome应用商店选择你想下载的插件
  14. 使用bug分类来设计更好的软件测试
  15. 随笔-给定两个字符串形式的非负整数 num1 和num2 ,计算它们的和
  16. ORACLE 统计男女数量
  17. 5口千兆工业以太网交换机宽温导轨式二层非网管全千兆工业级交换机
  18. Cisco ASA 5585 with firepower upgrade 升级 配置证书
  19. 期货破位(期货破位做单法)
  20. 同时设置伪类样式a:link和a:visited,a:link样式被a:visited样式覆盖问题

热门文章

  1. “an error occurred while processing this directive”的解决方法
  2. 微信昵称表情符号添加数据库报错问题
  3. Mysql索引失效场景集合
  4. C语言 | 异或运算符的妙用
  5. Blender和C4D有哪些不同?选Blender还是C4D?
  6. 【GD32F427开发板试用】+GD32F427开发以来遇到的问题以及解决方案
  7. 利用HTML实现弹幕滚动效果(跑马灯标签)
  8. netstream是什么?
  9. Ansible的管理变量、机密和事实
  10. 纸鸢|工业路由器的定位功能有什么作用