htmlparser的使用java_HTMLParser的使用
2008-04-17 18:20 | zzz
请问一下,怎样将修改过得html保存到文件中
code如下
parser = new Parser(getContentByLocalFile(file));
NodeFilter nt = new NodeClassFilter(ImageTag.class) ;
NodeList tmpImageList = (NodeList) parser.parse(nt);
/*linkTmpHash = new Hashtable();
for (int i = 0; i < length; i++) {
Element tmpElement = (Element) tmpNodeList.item(i);
String href = tmpElement.getAttribute("href");
if (href != null && !href.equals("")) {
linkTmpHash.put(href, "");
}
}
data.setHrefs((String[]) linkTmpHash.keySet().toArray(new String[linkTmpHash.size()]));*/
BufferedWriter writer = new BufferedWriter(new OutputStreamWriter (new FileOutputStream (file)));
linkTmpHash = new Hashtable();
for (int i = 0; i < tmpImageList.size(); i++) {
imgnode = (ImageTag)tmpImageList.elementAt(i);
String src = imgnode.getImageURL();
if (URLPathNameUtil.isAbsolutePath(src)) {
if (testAbsolutePath) {
testImagetag(file,src);
}
} else {
if (testRelativePath) {
testImagetag(file, src);
}
}
if(getRealPath()!=null){
imgnode.setImageURL(getRealPath());
writer.write(tmpImageList.toHtml());
}
/*if (src != null && !src.equals("")) {
linkTmpHash.put(src, "");
}*/
}
writer.flush();
writer.close ();
谢谢了 回复 更多评论
htmlparser的使用java_HTMLParser的使用相关推荐
- python htmlparser使用问题小结
基于HTMLParser的反复使用的问题 from HTMLParser import HTMLParserclass MyHTMLParser(HTMLParser):data = []def ha ...
- python模块学习---HTMLParser(解析HTML文档元素)
HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析. 本文主要简单讲一下HTMLParser的用法. 使用时需要定义一个从类HTMLParser继承的类,重定义 ...
- HTMLParser的初步学习
Python的自带模块--HTMLParser的初步学习 HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析. 本文主要简单讲一下HTMLParser的用法. ...
- java htmlparser 使用教程_Java解析HTML之HTMLParser使用与详解
HTMLParser将解析过的信息保存为一个树的结构.Node是信息保存的数据类型基础.请看Node的定义:public interface Node extends Cloneable;Node中包 ...
- 基于htmlparser实现网页内容解析
网页解析,即程序自动分析网页内容.获取信息,从而进一步处理信息. 网页解析是实现网络爬虫中不可缺少而且十分重要的一环,由于本人经验也很有限,我仅就我们团队开发基于关键词匹配和模板匹配的主题爬虫的经验谈 ...
- 在.net中运用HTMLParser解析网页的原理和方法
本文介绍了.net 版的一个HTMLParser网页解析开源类库(Winista.HTMLParser)的功能特性.工作原理和使用方法.对于使用.net进行Web信息提取的开发人员进行了一次HTMLP ...
- python模块之HTMLParser之穆雪峰的案例(理解其用法原理)
# -*- coding: utf-8 -*- #python 27 #xiaodeng #python模块之HTMLParser之穆雪峰的案例(理解其用法原理) #http://www.cnblog ...
- 使用ASIHTTPRequest 编译提示找不到libxml/HTMLparser.h的解决方法
使用ASIHTTPRequest xcode编译提示找不到"libxml/HTMLparser.h",解决方法如下: 1>.在xcode中左边选中项目的root节点,在中间编 ...
- HtmlParser中的各种Filter(1)
所有的Filter均实现了NodeFilter接口,此接口只有一个方法Boolean accept(Node node),用于确定某个节点 是否属于此Filter过滤的范围. HtmlParser在o ...
最新文章
- Mysql中的递归层次查询(父子查询,无限极查询)
- BZOJ1011 莫比乌斯反演(基础题
- python:dist-packages site-packages
- KindEditor中使用val()获取content内容后图片不显示
- ASP.NET MVC 3.0学习系列文章--Razor and ASP.NET MVC 3.0
- jmeterhttp代理服务器_Jmeter使用HTTP代理服务器录制
- 多线程下的生产者消费者(一个初始值为0的变量,两个线程一个加1一个减1,轮询5轮)
- Linux学习:第三章-Linux常用命令-2
- 警惕、曝光一个不好的现象
- 01-mysql数据库入门篇-认识mysql-01-05
- oracle oid 10G
- Process Kill Technology Process Protection Against In Linux
- 负载均衡的几种方式_负载均衡的几种类型
- “华硕zx50j,键盘背光灯无法显示,fn组合键不可用”解决办法
- 全球首个AI公园亮相北京海淀区
- 前端面经 | 腾讯实习生校招面试心路历程
- LSD-slam算法原理
- 深度学习基础知识点【更新中】
- 前端性能指标:白屏和首屏时间的计算
- 基于多传感器的AUV控制系统
热门文章
- Day 5 of Learning Python
- JCVideoPlayerStandard的视频播放
- first_week
- python如何画损失函数图_TensorFlow损失函数专题详解
- c语言item需要什么头文件,==把VIM打造成开发C的IDE==
- matlab解决奥数题,初中奥数简单计数问题练习题|初一奥数题100道及答案
- 开心的金明(动态规划 dp C++)
- JDK 1.8新特性Lambda入门
- 统计模型LM,GLM,GAM和GAMLSS
- 逐字稿整理-英/TED-Collaboration:Persuit of excellence(大花猫冯夏)