您的位置:程序门 -> .net技术 -> vb.net



如何实现:提供一个网址(如5566.net),然后提取该网页下所有自己想要的url.详情请进……


[收藏此页] [打印本页]选择字色:背景色:字体:[][][]


如何实现:提供一个网址(如5566.net),然后提取该网页下所有自己想要的url.详情请进……
发表于:2007-06-18 22:13:23 楼主
请问各位怎实现:点击按键启动新线程,再点击一下则关闭上一线程(即使任务还未完成),紧接着又一启动新线程

如何实现:提供一个网址(如5566.net),然后提取该网页下所有自己想要的url.详情请进……

现在假设我个网址为

        http://mp3.baidu.com/m?f=ms&rn=10&tn=baidump3lyric&ct=150994944&word= "hilary "&lm=-1

以下是这个网址对应的网页的源文件中的一个片段:

……
</div> <div   class= "bluebg "> <strong> 歌曲: </strong> <b> the   getaway </b> </div>
<div   style= "padding-top:10px;padding-left:15px ">
<strong> 歌手: </strong> <a   href= "http://mp3.baidu.com/m?tn=baidump3&ct=134217728&lm=-1&word=hilary+duff "> <font   style=color:#e10900> hilary </font>   duff </a>
<strong> 专辑: </strong> <a   href= "http://mp3.baidu.com/m?tn=baidump3&ct=134217728&lm=-1&word=hilary+duff "> <font   style=color:#e10900> hilary </font>   duff </a>
</div>
<br>
<div   class= "unnamed3 "   style= "float:right;width:240px;padding:5px;margin-right:10px;line-height:30px ">
<span   style= "font-size:12px; "> <img   src= "http://list.mp3.baidu.com/list/img/lrcdw.gif "   style= "padding-right:10px "   align= "absmiddle "> <a   href= "http://220.181.38.82/tl?filename=/lrc/528/the   getaway-hilary   duff.lrc "   > lrc歌词 </a> &nbsp; <sup> hot </sup> </span> <br>
……


我想编写一个vb.net程序提取片段中http://220.181.38.82/tl?filename=/lrc/528/the   getaway-hilary   duff.lrc那一部分

在我想要的这个程序中仅有
        一个文本框,一个按钮,一个列表框
动作:文本框中输入网址,然后点击按钮,列表框中将会列出在那个网页下找到的含“.lrc "后缀的url

请问各位高人如何实现(希望能够理解我的意思)

谢谢!
发表于:2007-06-18 22:16:591楼 得分:0
大家快上吧,事成马上有分加
发表于:2007-06-18 22:28:542楼 得分:0
自己去看看蜘蛛程序.
正则表达式也要熟悉
发表于:2007-06-18 22:37:343楼 得分:0
正则
发表于:2007-06-18 22:42:154楼 得分:0
有代码吗
发表于:2007-06-18 22:46:245楼 得分:0
我瑞对于这个一点儿都不晓
发表于:2007-06-18 23:17:216楼 得分:0
dim   m   as   match
                m   =   regex.match(richtextbox2.text,   "[\s\s]*(? <= <span\s+style= " "font-size:12px; " "> "   &   _
                " <img\s+src= " "http://list.mp3.baidu.com/list/img/lrcdw.gif " "\s+style= " "padding-right:10px " "\s+ "   &   _
                "align= " "absmiddle " "> <a\s+href= " ")(? <url> [^ " "]*) ",   regexoptions.ignorecase)
                if   m.success   then
                        messagebox.show(m.groups( "url ").value)
                end   if
发表于:2007-06-18 23:28:567楼 得分:0
'命名空间
imports   system.text.regularexpressions
发表于:2007-06-18 23:34:408楼 得分:0
等等,试一下先
发表于:2007-06-18 23:42:259楼 得分:0
没有反应呀
发表于:2007-06-19 00:13:5310楼 得分:0
我现在还没有得到网页的源码
发表于:2007-06-19 07:20:5111楼 得分:0
你必须先得到网页的源码,再用正则取里面的地址!
发表于:2007-06-19 07:53:3112楼 得分:0
我从网页上直接复制了一份源码,用你说的方法试了一下,只能找出一个url,但里面还有很多符合条件的url,在你的代码里是否一找到就退出来呢?能否添加个循环来查找呀?
发表于:2007-06-19 07:59:0613楼 得分:0
其实我想要的这个程序别人早已实现过了,但他没有提供源码,我在他的程序里面发现了一个这样的xml文件,用记事本打开得到如下:

<?xml   version= "1.0 "   encoding= "utf-8 "   ?>
<settings>
    <lyricssearchurlformatstring> <![cdata[http://mp3.baidu.com/m?f=ms&rn=10&tn=baidump3lyric&ct=150994944&word={0}&lm=-1]]> </lyricssearchurlformatstring>
    <lyricssearchurlregularexpression> <![cdata[ <a   href= "(http://.*) "\s*> lrc歌词 </a> ]]> </lyricssearchurlregularexpression>
    <lyricsplainregularexpression> <![cdata[ <div   style= "padding-left:10px;line-height:20px;padding-top:1px "> \s*(.*)\s* </div> ]]> </lyricsplainregularexpression>
</settings>

各位,这些东西会有什么帮助吗?怎么将这些信息写成正则表达式呀?
发表于:2007-06-19 12:38:4314楼 得分:0
怎么大家都沉默啦?现在沉默可不是金呀


快速检索

最新资讯
热门点击