文章为本站乐博网( Lob.cn )成员Rock原创,可以自由转载和传播,转载请保留本站的作者和信息来源,谢谢!如果大家对.Net编程开发或者关于“WebBrowser抓取网页乱码”的话题感兴趣,就一起来www.SmallBasic.cn(乐博网旗下技术社区) 或者加入.Net超级QQ群 40797788 一起讨论,把他做得更完善吧!
WebBrowser控件在抓取网页后查看所抓取的html源代码,经常会发现页面源代码的中文部分乱码了,以下就是解决办法。
效果图:
添加一个WebBrowser控件命名为LOB_Browser,添加一个RichTextBox控件命名为RichTextBox1用来放html源码的。
解决乱码的VB.Net源代码如下:
Dim Obj_StreamReader As New System.IO.StreamReader(Me.LOB_Browser.DocumentStream, System.Text.Encoding.GetEncoding("GB2312")) Dim Str_LOBDocument As String Str_LOBDocument = Obj_StreamReader.ReadToEnd()
RichTextBox1.Text = Str_LOBDocument
解决乱码的C#源代码如下:
System.IO.StreamReader Obj_StreamReader = new System.IO.StreamReader(this.LOB_Browser.DocumentStream, System.Text.Encoding.GetEncoding("GB2312")); string Str_LOBDocument = null; Str_LOBDocument = Obj_StreamReader.ReadToEnd();
RichTextBox1.Text = Str_LOBDocument;
同时乐博网在07年还有一个文章有相关乱码的介绍,也不妨看看 地址如下:
VB.Net抓取网页乱码的解决方法[乐博网原创] |