您的位置:程序门 -> .net技术 ->



.net 如何分析搜索引擎结果


[收藏此页] [打印本页]选择字色:背景色:字体:[][][]


.net 如何分析搜索引擎结果[已结贴,结贴人:tooleave]
发表于:2007-12-10 10:49:36 楼主
具体要求大概是这样的,在google里输入一个关键字(比如'拖拉机'),然后所搜结果里肯定会有大片拖拉机生产厂家的信息,
然后比如有一个厂家的网址是www.tuolaji.com,公司名字叫拖垃圾,现在,boss要求我做的就是如何通过.net程序自动调用google
的查询,并返回分析查询结果,然后分析这些结果,比如,我要分析的就是   www.tuolaji.com   在总的查询结果的排名信息.
具体的思路该怎样呢?我从没做过这类似的,人还在试用期,boss拿这个来考验俺.help   ...

ps:我技术很烂,所以很少回答问题,貌似我一分都没,所以不能给分了..
发表于:2007-12-10 11:02:581楼 得分:0
早走人为好
发表于:2007-12-10 11:06:342楼 得分:0
不知道的更应该学了,谢过你友情up   ..
发表于:2007-12-11 09:12:083楼 得分:0
webclient获取网页结果
然后分析dom
发表于:2007-12-11 09:20:084楼 得分:0
mark...
发表于:2007-12-11 14:07:475楼 得分:0
知道方法了.
1,用google   公布的api直接调用,可以返回结果集,并且归类好,但速度实在太慢.且不稳定.
2,用webclient,传入搜索地址,如在google搜索"百度"的链接地址就是"http://www.google.cn/search?hl=zh-cn&q=%e7%99%be%e5%ba%a6&btng=google+%e6%90%9c%e7%b4%a2&meta=",
然后用正则过滤,得到想要的信息.
现在的问题是..
我只想得到"mp3.baidu.com/   -   15k","image.baidu.com/   -   10k",数字大小前面的这个链接,请问正则该怎么写..?
纯的url链接不行,因为页面里有太多链接导航了,我只需要拿每个结果的唯一链接..
up   ..
msn   tooleave#gmail.com     3q..


快速检索

最新资讯
热门点击