您的位置:程序门 -> java -> 框架、开源



关于htmlparser解析本地html文件的问题!


[收藏此页] [打印本页]选择字色:背景色:字体:[][][]


关于htmlparser解析本地html文件的问题!
发表于:2007-05-08 08:55:16 楼主
数据库记录文件远程url及本地保存路径。
我想通过htmlparser打开本地文件!
取出连接形式为相对地址(uri),然后用seturl设置url!
我的本意是给htmlparser指定一个baseurl,
结果发现,seturl把文件从远程重新下载了一次!
而不是我要的方式。我比较喜欢用httpclient下载文件!因为可能抓取和分析是异步发生的。

我的问题是   这个问题用htmlparser本身是不是可以解决?
发表于:2007-05-08 09:06:191楼 得分:0
可以。我以前做过。
htmlparser可以打开本地文件,你把uri写成本地绝对路径试试呢?
发表于:2007-05-08 09:52:012楼 得分:0
谢谢楼上兄弟的回答!问题我解决了!
事实上,我的问题是本地文件的相对连接,如何转换为绝对连接的问题!

分析本地文件,这个其实原本就可以!

解决办法
parser.getlexer().getpage().setbaseurl( "http://www.xxx.com ");
也可以用
parser.getlexer().getpage().seturl( "http://www.xxx.com ");
不知道这两个有什么区别!奇怪了!呵呵

发表于:2007-05-13 22:15:553楼 得分:0
该回复于2007-10-09 14:24:24被管理员删除
发表于:2007-06-13 15:19:044楼 得分:0
httpparser   解析html中的table的行列   手工设定需要解析的table  
http://blog.csdn.net/eqxu/archive/2007/06/06/1640699.aspx
用html   parser   来获取html网页中form的各个属性名   值组  
http://blog.csdn.net/eqxu/archive/2007/05/29/1629820.aspx


快速检索

最新资讯
热门点击