html解析工具-html解析器(HtmlCleaner)2.13 免费版手游最新版本

html解析工具-html解析器(HtmlCleaner)2.13 免费版手游最新版本

大小:904.9M 语言: 简体中文

类型:策略战棋游戏 系统:macOS

备案号:备案号:京7C-200760386-52W
简介 相关 评论(7)
热门游戏 竞技游戏 枪战游戏 枪械游戏大全

HtmlCleaner是一个免费开源的适用范围广的Java语言Html文档解析器,它能重新整理HTML文档的每个元素并生成结构良好(Well-Formed)的HTML文档。默认它遵循的规则是类似于大部份web浏览器为创文档对象模型所使用的规则,户可以提供自定义tag和规则组来进行过滤和匹配。

HtmlCleaner更新内容

1.HtmlCleaner的文档对象模型拥有了一些函数,处理节点和属性,所以在序列化之前搜索或者编辑是非常容易的。

2.提供基本HtmlCleanerDOM的XPath支持

3.使用XML配置文件让创建定制tag变得更加容易

4.修复多个bug以及API改进

HtmlCleaner软件特色

它被设计的小,快速,灵活而且独立。HtmlCleaner也可用在Java代码中,当命令行工具或Ant任务。解析后编程轻量级文档对象,能够很容易的被转换到DOM或者JDom标准文档,或者通过各种方式(压缩,打印)连续输出XML。

HtmlCleaner使用示例

写一个测试用的html文件:html-clean-demo.html慧择旅游保险4.1.0 安卓版

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd " >   

< html   xmlns = "http://www.w3.org/1999/xhtml "   xml:lang = "zh-CN"   dir = "ltr" >   

< head >   

< meta   http-equiv = "Content-Type"   content = "text/html; charset=GBK" />   

< meta   http-equiv = "Content-Language"   content = "zh-CN" />   

< title > html clean demo </ title >   

</ head >   

< body >   

< div   class = "d_1" >   

< ul >   

< li > bar </ li >   

< li > foo </ li >   

< li > gzz </ li >   

</ ul >   

</ div >   

< div >   

< ul >   

< li > < a   name = "my_href"   href = "1.html" > text-1 </ a > </ li >   

< li > < a   name = "my_href"   href = "2.html" > text-2 </ a > </ li >   

< li > < a   name = "my_href"   href = "3.html" > text-3 </ a > </ li >   

< li > < a   name = "my_href"   href = "4.html" > text-4 </ a > </ li >   

</ ul >   

</ div >   

</ body >   

</ html >   

Html代码

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">  

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="zh-CN" dir="ltr">  

<head>  

<meta http-equiv="Content-Type" content="text/html; charset=GBK"/>  

<meta http-equiv="Content-Language" content="zh-CN"/>  

<title>html clean demo</title>  

</head>  

<body>  

<div class="d_1">  

<ul>  

<li>bar</li>  

<li>foo</li>  

<li>gzz</li>  

</ul>  

</div>  

<div>  

<ul>  

<li><a name="my_href" href="1.html">text-1</a></li>  

<li><a name="my_href" href="2.html">text-2</a></li>  

<li><a name="my_href" href="3.html">text-3</a></li>  

<li><a name="my_href" href="4.html">text-4</a></li>  

</ul>  

</div>  

</body>  

</html>  

模拟需求:取出title,name="my_href"的链接,div的class="d_1"下的所有li内容。下面用htmlcleaner写代码,HtmlCleanerDemo.java

package  com.chenlb;  

import  java.io.File;  

import  org.htmlcleaner.HtmlCleaner;  

import  org.htmlcleaner.TagNode;  

/**  

* htmlcleaner 使用示例.  

*  

* @author chenlb 2008-11-26 下午02:12:02  

*/   

public   class  HtmlCleanerDemo {  

public   static   void  main(String[] args)  throws  Exception {  

HtmlCleaner cleaner = new  HtmlCleaner();  

TagNode node = cleaner.clean(new  File( "html/html-clean-demo.html" ),  "GBK" );  

//按tag取.   

Object[] ns = node.getElementsByName("title" ,  true );     //标题   

if (ns.length >  0 ) {  

System.out.println("title=" +((TagNode)ns[ 0 ]).getText());  

}  

System.out.println("ul/li:" );  

//按xpath取   

ns = node.evaluateXPath("//div[@class='d_1']//li" );  

for (Object on : ns) {  

TagNode n = (TagNode) on;  

System.out.println(" text=" +n.getText());  

}  

System.out.println("a:" );  

//按属性值取   

ns = node.getElementsByAttValue("name" ,  "my_href" ,  true ,  true );  

for (Object on : ns) {  

TagNode n = (TagNode) on;  

System.out.println(" href=" +n.getAttributeByName( "href" )+ ", text=" +n.getText());  

}  

}  

}  

Java代码  

package com.chenlb;  

import java.io.File;  

import org.htmlcleaner.HtmlCleaner;  

import org.htmlcleaner.TagNode;  

/** 

* htmlcleaner 使用示例. 

* @author chenlb 2008-11-26 下午02:12:02 

*/  

public class HtmlCleanerDemo {  

public static void main(String[] args) throws Exception {  

HtmlCleaner cleaner = new HtmlCleaner();  

TagNode node = cleaner.clean(new File("html/html-clean-demo.html"), "GBK");  

//按tag取.  

Object[] ns = node.getElementsByName("title", true);    //标题  

if(ns.length > 0) {  

System.out.println("title="+((TagNode)ns[0]).getText());  

}  

System.out.println("ul/li:");  

//按xpath取  

ns = node.evaluateXPath("//div[@class='d_1']//li");  

for(Object on : ns) {  

TagNode n = (TagNode) on;  

System.out.println(" text="+n.getText());  

}  

System.out.println("a:");  

//按属性值取  

ns = node.getElementsByAttValue("name", "my_href", true, true);  

for(Object on : ns) {  

TagNode n = (TagNode) on;  

System.out.println(" href="+n.getAttributeByName("href")+", text="+n.getText());  

}  

}  

}  

cleaner.clean()中的参数,可以是文件,可以是url,可以是字符串内容。个人认为:比较常用的应该是evaluateXPath、getElementsByAttValue、getElementsByName方法了。另外说明下,htmlcleaner对不规范的html兼容性比较好。

展开全部
应用信息
用户评论 跟帖评论

热门评论

最新评论

2025/10/21 03:18
红魔馆传说是一款魔幻题材的游戏,画风非常的高清,用户可以选择二次元战斗的玩法,冒险战斗非常的多样,可以让你更好的去参与游戏的挑战,福利也非常的丰厚。红魔馆传说特...

支持( 162 ) 盖楼(回复)

2025/11/04 10:43
新绿茵、划时代;FIFPro未来足球正版授权正式上线,真实体验足球竞赛,这次,你不再是观众,而是置身于足球比赛之中的一员,主宰每一场比赛,运筹帷幄享受指尖操纵快...

支持( 102 ) 盖楼(回复)

2025/11/10 22:09
神州镇魔录是一款玄幻修仙手游,游戏中可以不断地进行升级成长,采用了平行制的玩法,可以收徒,仙风道骨,多种多种方式,参加非常多的活动来获得奖励。神州镇魔录手游介绍...

支持( 186 ) 盖楼(回复)

2025/11/01 05:53
摩托车驾照考证通app是一款非常实用的摩托车驾驶证学习软件,用户下载这款软件能够在上面进行非常优质的驾考学习,app涵盖了从学习到领证的全部过程,里面的学习题目...

支持( 20 ) 盖楼(回复)

2025/11/11 09:01
闪电搜题app会员版是一款面向学生和成人学习者的智能学习工具,提供拍照搜题、文字搜索等多种解题方式,涵盖全学科海量题库资源,并配有详细答案解析和在线老师讲解功能...

支持( 78 ) 盖楼(回复)

2025/10/22 19:44
信用精灵软件是一款专业信用管理软件,查看你的网贷记录,还有信用卡申请记录等等,只要关于信用的,都可以在这里轻松管理查询,非常方便的工具!信用精灵软件介绍信用精灵...

支持( 82 ) 盖楼(回复)

2025/11/07 18:02
PopOn练口语app是一款专业的口语练习软件,这里拥有专业的外教,帮助你学习口语知识,丰富的训练计划,快速帮助你提高口语能力!PopOn练口语app介绍Pop...

支持( 156 ) 盖楼(回复)

2025/10/25 03:19
你需要照顾一个人在家的宝贝,衣食住行,宝宝还有各种各样的需求,这款小游戏可以培养宝宝的责任心以及理解家长的一些辛苦,最好就是和父母一起互动,可以得到更好的效果。...

支持( 24 ) 盖楼(回复)

2025/10/27 11:59
三秦慈善项目app是一款专门建立慈善项目而设计的软件,下载这个软件可以在上面支援老年慈善大学,关爱儿童之家和更多慈善项目申报等,进行慈善扶贫。软件介绍以慈善老年...

支持( 113 ) 盖楼(回复)

2025/11/02 18:28
1.积木式编程理念,快速拼出您想要的工具,弥补某些软件自身的不足2.带给不懂编程人员也能享受快速插入代码编程的快感3.快速插入重复性很高的架构(譬如赋值、判断、...

支持( 51 ) 盖楼(回复)

2025/10/22 10:51
律学法考app是专为法律职业资格考试打造的法考学习软件,这里有海量丰富的考题学习软件超强的专业知识都尽可能满足大家不同的需求,还能有人工智能全天候给到不同的一对...

支持( 100 ) 盖楼(回复)

2025/10/24 05:19
大唐仙缘是一款以仙侠世界为背景的角色冒险类游戏,游戏画面精致美观,人物形象设计雕刻细腻。游戏含有丰富的游戏剧情和玩法,玩家可以随时体验修仙乐趣。游戏特色:1、天...

支持( 176 ) 盖楼(回复)

2025/10/21 05:11
网络诊断修复工具(NetAdapterRepairAllinOne)是一个全集成的网络故障辅助排查工具,使用者通过本软件能够简单的进行电脑的网络检验,通过扫描系...

支持( 50 ) 盖楼(回复)

2025/11/02 22:45
这是一篇关于武松醉打蒋门神的赏析ppt,该ppt共有16页对文章中出现的醉与酒都在出了赏析,以及文章中对各个精彩部分的解析,对水浒有兴趣的朋友们可以来下载学习!...

支持( 98 ) 盖楼(回复)

2025/11/11 03:19
《2020年烹饪比赛帝国》准备烹饪,学习更多的美味的配方,享受妈妈级别的美味佳肴,向世界顶级的厨师来学习,为你的客户来服务,学习做饭,提供更多有趣的方式,照顾客...

支持( 141 ) 盖楼(回复)