您的位置:程序门 -> java -> j2se / 基础类



求与网页相关的正则表达式


[收藏此页] [打印本页]选择字色:背景色:字体:[][][]


求与网页相关的正则表达式[已结贴,结贴人:dongle2001]
发表于:2007-02-15 20:06:20 楼主
我想把下载到的网页源代码里面的 <script> </script> 标记   ,href=javascript:   ( <a> )   属性   ,
控件的on...事件   ,
frame   iframe   frameset都去掉。
所以需要在string.replaceall函数里用到正则表达式,希望大家帮我想想。
发表于:2007-02-15 20:06:561楼 得分:0
对了还有样式表也要过滤掉
发表于:2007-02-16 09:32:052楼 得分:5
大过年的都happy去了,开年再说吧!
发表于:2007-02-16 11:45:123楼 得分:25
我想把下载到的网页源代码里面的 <script> </script> 标记   ,href=javascript:   ( <a> )   属性   ,
控件的on...事件   ,
frame   iframe   frameset都去掉。
1. <script> </script> --------------> (\\ <script\\> [^\\ <]*\\ <\\/script\\> )
2.href= "javascript: "---------------> \\ <a\s(href\\=\\ "javascript\\:[^\\ "]+\\ ")[^\\> ]+\\>
3.frame   iframe   frameset都去掉。(\\ <frame[^\\> ]+\\> ¦\\ <iframe[^\\> ]+\\> ¦\\ <frameset[^\\> ]+\\> )
发表于:2007-02-16 11:46:364楼 得分:0
modify
3.frame   iframe   frameset都去掉。(\\ <frame\\> [^\\> ]+\\> ¦\\ <iframe\\> [^\\> ]+\\> ¦\\ <frameset\\> [^\\> ]+\\> )
发表于:2007-02-16 16:21:385楼 得分:50
楼上的测试 <script> this   is   a   " < "   test </script> 一下会有问题的,其余类似...
给个简洁点的 <(script)> .*? <\/\1>   其余类似...
发表于:2007-02-16 16:23:446楼 得分:20
modify:)
(?s) <(script)> .*? <\/\1>
发表于:2007-02-16 16:42:077楼 得分:0
学习啊
发表于:2007-02-16 17:22:048楼 得分:0
to:hanjin26()   你说的是,学习


快速检索

最新资讯
热门点击