您的位置:程序门 -> .net技术 -> c#



网页抓取


[收藏此页] [打印本页]选择字色:背景色:字体:[][][]


网页抓取
发表于:2007-01-26 15:02:50 楼主
小弟我写了个下面的代码实现抓取网页,但是在richtextbox中显示时中文是乱码,哪位大哥或大姐给解决一下,非常感谢
public   void     snatchpage(string   webaddress)//抓取网页,取得网页源代码
              {
                      try
                      {
                              httpwebrequest   myhttpwebrequest   =   (httpwebrequest)httpwebrequest.create(webaddress);
                              httpwebresponse   myhttpwebresponse   =   (httpwebresponse)myhttpwebrequest.getresponse();
                              stream   mystream   =   myhttpwebresponse.getresponsestream();
                              byte[]   mybyte   =   new   byte[1024];
                              int   readl   =   0;
                              do
                              {
                                      readl   =   mystream.read(mybyte,   0,   1024);
                                    pagecontent   +=   encoding.utf8.getstring(mybyte,   0,   1024);
                              }   while   (readl   >   0);
                           
                              myhttpwebresponse.close();
                              mystream.close();
                      }
                      catch   (exception   e)
                      {
                              console.writeline(e.message);
                      }
              }
发表于:2007-01-26 15:24:531楼 得分:0
5分……
如果只是这点功能的话
system.net.webclient
这个类就足够了
system.net.webclient   client   =   new   system.net.webclient();
client.downloadstring();
发表于:2007-01-26 15:25:322楼 得分:0
楼主没有判断页面的编码
发表于:2007-01-26 15:29:113楼 得分:0
谢谢!


快速检索

最新资讯
热门点击