C#中利用WebBrowser控件,获得HTML源码

本文介绍了作者遇到的一些老网页抓取程序失效的问题,并提供了一种新的解决方案,即使用WebBrowser控件来获取网页的HTML源码。这种方法类似于IE浏览器的工作方式,能够有效获取到网页<body>部分的源码。

最近获得网页的几个老程序都不能用了。

我原来用 如下代码获得网页html 源码:

<pre name="code" class="csharp">        <span style="font-family: Arial, Helvetica, sans-serif;">HttpWebRequest request = (HttpWebRequest)WebRequest.Create(httpUrl);</span>
HttpWebResponse response = (HttpWebResponse)request.GetResponse();


但是,现在不能用了,问了别人据说 是网站不关闭了申请。

用了WebBrowser控件,它类似于IE浏览器。

获得WebBrowser控件中网页<body>部分的HTML源码代码如下:

 String content = webBrowser1.Document.Body.InnerHtml; 

PS:只有<body>部分的HTML源码代码

不难,但是没有找到,记录一下吧。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值