首页 / C# / C#抓取AJAX页面的内容

C#抓取AJAX页面的内容

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了C#抓取AJAX页面的内容，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含860字，纯文字阅读大概需要2分钟。

内容图文

现在的网页有相当一部分是采用了AJAX技术,所谓的AJAX技术简单一点讲就是事件驱动吧(当然这种说法可能很不全面),在你提交了URL后,服务器发给你的并不是所有是页面内容,而有一大部分是JS脚本,即用<JAVASCRIPT标签表示的,这其中有些是链接了外部的JS文件,有些是内置的JS脚本,这些脚本是在客户端加载了服务器发回来的源码后才执行的,所以不管是采用C#中的WebClient还是HttpRequest都得不到正确的结果,因为这些脚本是在服务器发送完毕后才执行的!
但我们用IE浏览页面时是正常的,所以解决方法只有1个就是采用WebBrowser控件
但是使用Webbrowser你会发现,在DownloadComplete事件中,你根本无法知道页面何时才算是真正的加载完毕!
当然个别有Frame的网页可能会触发多次Complete,即使你采用计数器的办法,即在Navigated事件中++,而在DownloadComplete中做--,也仍然不能得到JS完成执行后的结果,我开始也感觉到非常奇怪,直到后来GG了相关AJAX的文章,明白了其中原委.
最终解决方案就是利用WebBrowser+Timer来解决抓取页面的问题
而其中的关键仍然是页面状态,我们可以利用webBrowser1.StatusText,如果返回"完成",表示页面加载完毕!
示例代码如下:
private void timer1_Tick(object sender, EventArgs e)
         {
             webBrowser1.Navigate(Url);
             if (webBrowser1.StatusText == "完成")
             {
                 timer1.Enabled = false;
                 //页面加载完成,做一些其它的事
             }
       }

原文：http://www.cnblogs.com/lonelyxmas/p/3820158.html

内容总结

以上是互联网集市为您收集整理的C#抓取AJAX页面的内容全部内容，希望文章能够帮你解决C#抓取AJAX页面的内容所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1269050.html

来源：【匿名】

【下一篇】assemblyinfo.csC#Assembly类访问程序集信息

更多 ►

【C#抓取AJAX页面的内容】教程文章相关的互联网学习教程文章

C#抓取AJAX页面的内容

原文 C#抓取AJAX页面的内容现在的网页有相当一部分是采用了AJAX技术,所谓的AJAX技术简单一点讲就是事件驱动吧(当然这种说法可能很不全面),在你提交了URL后,服务器发给你的并不是所有是页面内容,而有一大部分是JS脚本,即用<JAVASCRIPT标签表示的,这其中有些是链接了外部的JS文件,有些是内置的JS脚本,这些脚本是在客户端加载了服务器发回来的源码后才执行的,所以不管是采用C#中的WebClient还是HttpRequest都得不到正确的结果,因为这些...

c#抓取网页内容乱码的解决方案【代码】

写过爬虫的同学都知道，这是个很常见的问题了，一般处理思路是: 使用HttpWebRequest发送请求，HttpWebResponse来接收，判断HttpWebResponse中”Content-Type”中的具体编码，再利用StreamReader 将信息流转为具体的编码就OK了。下面提供第一种思路的一般方法：c#抓取网页内容乱码的解决方案这种方法基本上解决了大部分的编码问题。之所以说基本上也是因为有一些网页，在HttpWebResponse 返回的头部中”Content-Type” 有时候不能正...

抓取网页数据C#文件

using System;using System.Collections.Generic;using System.Linq;using System.Web;using System.Web.Mvc;using System.Collections.Generic;using System.Text.RegularExpressions;using System.Text;using System.Net;using System.IO;namespace WebJSON.Controllers{ public class LibraryController : Controller { // // GET: /Library/ public String Index( ) { string pa...

C#使用Selenium+PhantomJS抓取数据【代码】【图】

C#使用Selenium+PhantomJS抓取数据参考：https://www.cnblogs.com/endlock/p/6423613.html 非原创，来自上面的链接手头项目需要抓取一个用js渲染出来的网站中的数据。使用常用的httpclient抓回来的页面是没有数据。上网百度了一下，大家推荐的方案是使用PhantomJS。PhantomJS是一个没有界面的webkit浏览器，能够和浏览器效果一致的使用js渲染页面。Selenium是一个web测试框架。使用Selenium来操作PhantomJS绝配。但是网上的例子多...

C# .net 抓取网页内容

ASP.NET 中抓取网页内容是非常方便的，而其中更是解决了 ASP 中困扰我们的编码问题。1、抓取一般内容需要三个类：WebRequest、WebResponse、StreamReader所需命名空间：System.Net、System.IO核心代码： WebRequest 类的 Create 为静态方法，参数为要抓取的网页的网址； Encoding 指定编码，Encoding 中有属性 ASCII、UTF32、UTF8 等全球通用的编码，但没有 gb2312 这个编码属性，所以我们使用 GetEncoding 获得 gb2312 ...

C#网页爬虫抓取行政区划【代码】【图】

借鉴C#网页爬虫抓取行政区划，从国家统计局获取了最新行政区域数据。以下为代码贴片：数据库类：publicclass City {publicdecimal ID { get; set; }publicstring Name { get; set; }publicstring Code { get; set; }publicstring Org_Level { get; set; }publicstring ParentCode { get; set; }publicdecimal ParentID { get; set; }publicstring Contry { get; set; }publicstring Loc_x { get; set; }publicstring Loc_y { get; ...

c#语言输入关键字，抓取你想要的所有网址【代码】

using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Windows.Forms; using mshtml; using System.Collections; using System.Threading;namespace 遍历百度网页 {publicdelegatevoid baidu111();publicpartialclass Form1 : Form{public Form1(){InitializeComponent();}privatevoid Form1_Load(object...

C# 实现抓取网站页面内容的实例方法【图】

抓取新浪网的新闻栏目，如图所示：使用谷歌浏览器的查看源代码：通过分析得知，我们所要找的内容在以下两个标签之间：代码如下: 内容。。。。 如图所示：内容。。。。使用VS建立一个如图所示的网站：我们下载网络数据主要通过 WebClient 类来实现。使用下面源代码获取我们选择的内容：代码如下...

asp.net c# 抓取页面信息方法介绍【图】

一：网页更新我们知道，一般网页中的信息是不断翻新的，这也要求我们定期的去抓这些新信息，但是这个“定期”该怎么理解，也就是多长时间需要抓一次该页面，其实这个定期也就是页面缓存时间，在页面的缓存时间内我们再次抓取该网页是没有必要的，反而给人家服务器造成压力。就比如说我要抓取博客园首页，首先清空页面缓存，从Last-Modified到Expires，我们可以看到，博客园的缓存时间是2分钟，而且我还能看到当前的服务器时间Da...

ASP.net(C#)从其他网站抓取内容并截取有用信息的实现代码

1. 需要引用的类库代码如下:using System.Net; using System.IO; using System.Text; using System.Text.RegularExpressions; 2. 获取其他网站网页内容的关键代码代码如下:WebRequest request = WebRequest.Create("http://目标网址.com/"); WebResponse response = request.GetResponse(); StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312")); //reader.ReadToEnd() 表...

C#正则解析HTML抓取所有的图片_html/css_WEB-ITnose

抓取html中的所有图片，目前img标签中的已经能够拿出来了，但是还有一些是这样写的比如或者是这种写法也有可能不是div，可能是td，或者其他标签。弄了半天，始终没弄好。求大神帮助。回复讨论(解决方案) 有的图片是流输出的也是要考虑的说起来，感觉你去抓取这些没有意义的啊，大部分的背景图片，都是以class中加载过来的。一般不写在标签中的啊。说起来，...

C#运用实例.读取csv里面的词条，对每一个词条抓取百度百科相关资料，然后存取到数据库【代码】【图】

将CSV文件的数据读取到DataTable中/// CSV文件路径/// 返回读取了CSV数据的DataTablepublic DataTable OpenCSV(string fileName){DataTable dt = new DataTable();FileStream fs = new FileStream(fileName, System.IO.FileMode.Open, System.IO.FileAccess.Read);StreamReader sr = new StreamReader(fs, System.Text.Encoding.Default);//记录每次读取的一行记录string strLine = "";//记录每行记录中的各字段内容string[] aryLi...

C#用HttpWebRequest通过代理服务器验证后抓取网页内容【图】

内网用户或代理上网的用户使用 using System.IO; using System.Net; public string get_html() { string urlStr = "http://www.domain.com"; //設定要獲取的地址 HttpWebRequest hwr = (HttpWebRequest)HttpWebRequest.Create(urlStr); //建立HttpWebRequest對象 hwr.Timeout = 60000; //定義服務器超時時間 WebProxy proxy = new WebProxy(...

C# FiddlerCore 抓取

原文:C# FiddlerCore 抓取C# FiddlerCore 抓取本文目的情景介绍添加引用初始化FiddlerCore实现事件处理启动、停止冷启动彻底停止热启动、停止方式一：解绑事件处理函数方式二：解除系统代理终端设置抓取本机请求抓取非本机请求保证目标终端与代理机处于同一网段下载证书安装证书设置代理真正开始抓取待实现项目合作本文目的记录FiddlerCore怎样实现以下功能：抓取本机的请求响应抓取本机局域网内其它设备的请求响应情景介绍用...

c#批量抓取免费代理并验证有效性【代码】【图】

之前看到某公司的官网的文章的浏览量刷新一次网页就会增加一次，给人的感觉不太好，一个公司的官网给人如此直白的漏洞，我批量发起请求的时候发现页面打开都报错，100多人的公司的官网文章刷新一次你给我看这个，这公司以前来过我们学校宣传招人+在园子里搜招聘的时候发现居然以前招xamarin，挺好奇的，所以就关注过。好吧不说这些了，只是扯扯蛋而已，回归主题，我想说的是csdn的文章可以通过设置代理ip刷新文章的浏览量，所以首先...

C# - 技术教程分类

C# 教程 C# 简介 C# 环境 C# 程序结构 C# 基本语法 C# 数据类型 C# 类型转换 C# 变量 C# 常量 C# 运算符 C# 判断 C# 循环 C# 封装 C# 方法 C# 可空类型 C# 数组（Array） C# 字符串（String） C# 结构体（Struct） C# 枚举（Enum） C# 类（Class） C# 继承 C# 多态性 C# 运算符重载 C# 接口（Interface） C# 命名空间（Namespace） C# 预处理器指令 C# 异常处理 C# 特性（Attribute） C# 反射（Reflection） C# 属性（Property） C# 索引器（Indexer） C# 委托（Delegate） C# 事件（Event） C# 集合（Collection） C# 泛型（Generic） C# 匿名方法 C# 不安全代码 C# 多线程 c# 全部

C# - 最热教程

c#编程连接oracle数据库无法加载DLL(oc...一个适合新手C#程序员编写练习的小项目...C# 异步UDP发送接收数据 C#程序执行时间长和慢查询解决：线程并...c# aspose操作word文档 C#继承讲解以及对象的创建 jquery+ajax+C#实现无刷新操作数据库数...C#精髓 GridView72大绝技学习gridview...c# static的全部用法收集整理 js模拟实现类似c#下的hashtable的简单功...

首页 / C# / C#抓取AJAX页面的内容

C#抓取AJAX页面的内容

内容导读

内容图文

内容总结

内容备注

内容手机端

【C#抓取AJAX页面的内容】教程文章相关的互联网学习教程文章

C# - 技术教程分类

C# - 最新教程

C# - 最热教程