首页 / HTML / 在c#中模拟无限滚动以获取页面的完整html

在c#中模拟无限滚动以获取页面的完整html

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了在c#中模拟无限滚动以获取页面的完整html，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1501字，纯文字阅读大概需要3分钟。

内容图文

有很多网站使用这种(imo)恼人的“无限滚动”风格.
例如tumblr,twitter,9gag等网站.

我最近尝试使用HtmlAgilityPack以编程方式从这些网站中删除一些图片.
像这样：

HtmlWeb web = new HtmlWeb();  
HtmlDocument doc = web.Load(url);
var primary = doc.DocumentNode.SelectNodes("//img[@class='badge-item-img']");
var picstring = primary.Select(r => r.GetAttributeValue("src", null)).FirstOrDefault();

这工作正常,但当我尝试从某些网站加载HTML时,我注意到我只收回了少量内容(比如前10个“帖子”或“图片”,或其他什么……)
这让我想知道是否可以在c#中模拟页面的“向下滚动”.

这不仅仅是我以编程方式加载html的情况,当我只是去tumblr这样的网站时,我检查firebug或只是“查看源代码”,我预计所有内容都会在某处,但很多好像是用javascript隐藏/插入. HTML源中只显示我的屏幕上实际可见的内容.

所以我的问题是：是否可以模拟无限滚动到页面,并用c#(最好)加载到那个HTML？

(我知道我可以使用API??用于tumblr和twitter,但我只是想和HtmlAgilityPack一起玩一些有趣的黑客攻击)

解决方法:

除了嵌入网络浏览器(通常无法在无头环境中工作)之外,没有办法一次性可靠地为所有这些网站做到这一点.

您应该考虑做的是查看网站的JavaScript,以便在用户向下滚动时查看用于获取内容的AJAX查询.

或者,在浏览器中使用Web调试器(例如Chrome中包含的调试器).这些调试器通常具有“网络”窗格,您可以使用它来检查页面执行的AJAX请求.在向下滚动时查看这些请求应该为您提供足够的信息来编写模拟这些请求的C#代码.

然后,您将必须解析来自这些请求的响应,因为特定API提供的内容类型可能是JSON或XML,但几乎肯定不是HTML. (无论如何,这对你来说可能更好,因为它可以节省你必须解析面向显示的HTML,而AJAX API将为你提供更容易使用的数据对象.)

内容总结

以上是互联网集市为您收集整理的在c#中模拟无限滚动以获取页面的完整html全部内容，希望文章能够帮你解决在c#中模拟无限滚动以获取页面的完整html所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/823326.html

来源：【匿名】

【上一篇】如何解析java中的准html文本？【下一篇】PHP 和 HTML

更多 ►

【在c#中模拟无限滚动以获取页面的完整html】教程文章相关的互联网学习教程文章

Spring MVC 以.html为后缀名访问获取数据，报406 Not Acceptable错误。【代码】【图】

如题，最近以spring mvc作为后台框架，前端异步获取数据时（.html为后缀名的访问方式），报406 Not Acceptable错误。当初都不知道啥原因，前后台都没报错就是返回不了数据，于是查了下http 406响应码：406 (SC_NOT_ACCEPTABLE)表示请求资源的MIME类型与客户端中Accept头信息中指定的类型不一致。下面请看出错的操作流程及代码：1、先配置spring mvc 核心servlet （DispatcherServlet）至web.xml中，其中配置可以以.html和.do为后缀...

html textarea 获取换行显示

html textarea 获取换行显示参考资料：http://www.cnblogs.com/zhenmingliu/archive/2011/12/27/2303931.html原文：http://www.cnblogs.com/springlight/p/6109389.html

HTML5 获取用户坐标方法【代码】

1function GetLocation() {2if (navigator.geolocation) {3var locationOptions = {4//是否使用高精度设备，如GPS。默认是true 5 enableHighAccuracy: true,6//超时时间，单位毫秒，默认为0 7 timeout: 5000,8//使用设置时间内的缓存数据，单位毫秒9//默认为0，即始终请求新数据 10//如设为Infinity，则始终使用缓存数据11 maximumAge: 012 }; 13//只...

html5+jquery获取微信openid【图】

最近在修改一个移动商城，由于wap端是HTML5的，还大量使用了art模板技术，一开始修改很不适应，而且实现HTML5取openid一直没能实现很好的实现，经过对获取原理的理解和学习，终于还是实现了HTML获取微信openid,而且改动不大，闲话少说，直接上干货：一、写个js,用于取accesscode,并直接通过openid读取用户表中的注册信息$(function () {var wxopenid=getcookie('wxopenid');var key=getcookie('key');if (key==''){var access_code...

jQuery设置和获取HTML、文本和值【代码】

jQuery设置和获取HTML、文本和值按 Ctrl+C 复制代码 <script type="text/javascript">//<![CDATA[$(function(){//获取<p>元素的HTML代码$("input:eq(0)").click(function(){alert( $("p").html() );});//获取<p>元素的文本$("input:eq(1)").click(function(){alert( $("p").text() );});//设置<p>元素的HTML代码$("input:eq(2)").click(function(){$("p").html("<strong>你最喜欢的水果是?</strong>");}); //设置<p>元素的文本...

HTML 获取select标签内option对应得值

示例代码：<h3>视频标题：<select id="l_id">{% for item in ress %}<option value="{{ item.id }}" >{{ item.leibie }}</option>{% endfor %}</select></h3> script中获取选中得值var type_id = $("#l_id option:selected").val() 原文：https://www.cnblogs.com/wjohh/p/10816448.html

html5中checkbox的选中状态的设置与获取【代码】

获取checkbox是否选中：$("#checkbox").is(":checked");获得的值为true或false。设置checkbox是否选中：$("#checkbox").attr("checked", true);//设置为选中状态 $("#checkbox").attr("checked", false);//设置为未选中状态原文：https://www.cnblogs.com/lhlong/p/11253536.html

php操作mysql获取html标签<select>下拉列表数据【图】

650) this.width=650;" src="/upload/getfiles/default/2022/11/13/20221113025755550.jpg" title="psb (1)_副本.png" />650) this.width=650;" src="/upload/getfiles/default/2022/11/13/20221113025756099.jpg" title="psb_副本.png" />650) this.width=650;" src="/upload/getfiles/default/2022/11/13/20221113025756585.jpg" title="psb (2)_副本.png" />本文出自 “IT5808” 博客，请务必保留此出处http://it5808.blog.5...

js获取Html元素的实际宽度高度

情况一：宽高都写在样式表里，即外部样式或嵌入式样式，比如#div1{width:120px;}。这种情况通过#div1.style.width拿不到宽度，而通过#div1.offsetWidth才可以获取到宽度。情况二：宽和高是写在行内中，即内联式样式，比如style="width:120px;"，这中情况通过上述2个方法都能拿到宽度。因为id.offsetWidth和id.offsetHeight无视样式写在样式表还是行内，所以我们获取元素宽和高的时候最好用这2个属性。注意如果不是写在行内style中的...

页面爬虫(获取其他页面HTML)加载到自己页面示例

复制代码代码如下://前台 <div id="showIframe"></div> $(document).ready(function() { var url = "@Url.Action("GetPageHtml","Catalog")"; $.ajax({ url: url, type: "POST", dataType:"json", data: { url: "http://www.baidu.com" }, error: function () { alert("bbb"); }, success: function (data) { $("#showIframe").append(data); //$("#showIframe div").hide(); //$("#showIframe>#container").show(); //$("#showIf...

HTML5页面直接调用百度地图API,获取当前位置，直接导航目的地

<!DOCTYPE html> <html lang="zh-cmn-Hans"> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width,initial-scale=1,user-scalable=0"> <title>HTML5页面直接调用百度地图API,获取当前位置，直接导航目的地</title> <script type="text/javascript" src="http://api.map.baidu.com/api?v=2.0&ak=wDYEcxgRRheZwyC9jpN1Tt7fzr2zjosZ"></script> <script src="http://cdn.bootcss.c...

jQuery获取自身HTML【代码】

1 <html>2 <head>3 <title>jQuery获取自身HTML</title>4 <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />5 <meta http-equiv="Content-Language" content="zh-CN" />6 <script type="text/javascript" src="http://files.cnblogs.com/Zjmainstay/jquery-1.6.2.min.js"></script>7 </head>8 <body>9 <div class="aa" style="border:1px solid #ABC;width:200px;text-align:center;">点击获...

[转] HTML 获取屏幕、浏览器、页面的高度宽度【图】

本篇主要介绍Web环境中屏幕、浏览器及页面的高度、宽度信息。目录1. 介绍：介绍页面的容器(屏幕、浏览器及页面)、物理尺寸与分辨率、展示等内容。2. 屏幕信息：介绍屏幕尺寸信息；如：屏幕、软件可用以及任务栏的高度和宽度。3. 浏览器信息：介绍浏览器尺寸信息；如：浏览器、内部页面以及工具栏的高度和宽度。4. 页面信息：介绍HTML页面尺寸信息；如：body总的、展示的高度和宽度。一、介绍1. 容器一个页面的展示，从外到内的容器...

基于 html5 geolocation来获取经纬度地址(copy)

geolocation来获取经纬度地址以前如果要获取互联网用户所在地都是根据用户的IP地址来获取地理位置，这样获取到的数据和真实数据有很大的偏差。为了获取更加精确的位置，可以使用了html5的geolocation来获取经纬度，然后再获取所在地理位置，如何获取，我在下面会说到。先说下基本概念。　　Geolocation在的navigator 对象中，我们可以通过 navigator.geolocation 来使用它。不支持 geolocation 的浏览器并不包含这一对象，那么可以...

Jquery 选择html 标签获取值【图】

https://zhidao.baidu.com/question/299628455.html 这个问题包含两个方面：jquery选择器（即针对你指定的那个input元素）和获取内容（即获得输入的值），所以综合起来有如下代码可以实现$("input#test").val(); // 推荐这种方式，因为id是唯一的$("input[name=‘test‘]").val(); // 此时需要注意是否有同名的input元素$("input:text").val(); // 这种方式只有整个网页只有一个文本输入框才是正确的下面给出示例：...

HTML - 技术教程分类

HTML 教程 HTML 简介 HTML 编辑器 HTML 基础 HTML 元素 HTML 属性 HTML 标题 HTML 段落 HTML 文本格式化 HTML 链接 HTML 头部 HTML CSS HTML 图像 HTML 表格 HTML 列表 HTML 区块 HTML 布局 HTML 表单 HTML 框架 HTML 颜色 HTML 颜色名 HTML 颜色值 HTML 脚本 HTML 字符实体 HTML URL HTML 速查列表 HTML 总结 XHTML 简介 HTML 媒体(Media) HTML 插件 HTML 实例 HTML 标签列表（功能排序） HTML 属性 HTML 事件 HTML 画布 HTML 音频/视频 HTML 颜色名 HTML 字符集 HTML ASCII HTML ISO-8859-1 HTML 符号 HTML 语言代码 html 全部

HTML - 最热教程

html5代码如何实现进度条功能？（示例）javascript中html字符串转化为jquerydo...HTML5实战与剖析之CSS选择器——getEle...html5中设置或返回音频/视频是否应该被...HTML5获取设备信息 jQuery打印指定区域Html页面并自动分页...jQuery+HTML5+CSS3制作支持响应式布局时...JS+HTML5实现上传图片预览效果完整实例...php删除html标签和标签内的内容的方法总...XMLHttpRequest中responseText如何获取...

首页 / HTML / 在c#中模拟无限滚动以获取页面的完整html

在c#中模拟无限滚动以获取页面的完整html

内容导读

内容图文

内容总结

内容备注

内容手机端

【在c#中模拟无限滚动以获取页面的完整html】教程文章相关的互联网学习教程文章

Spring MVC 以.html为后缀名访问获取数据，报406 Not Acceptable错误。【代码】【图】

html textarea 获取换行显示

HTML5 获取用户坐标方法【代码】

html5+jquery获取微信openid【图】

jQuery设置和获取HTML、文本和值【代码】

HTML 获取select标签内option对应得值

html5中checkbox的选中状态的设置与获取【代码】

php操作mysql获取html标签<select>下拉列表数据【图】

js获取Html元素的实际宽度高度

页面爬虫(获取其他页面HTML)加载到自己页面示例

HTML5页面直接调用百度地图API,获取当前位置，直接导航目的地

jQuery获取自身HTML【代码】

[转] HTML 获取屏幕、浏览器、页面的高度宽度【图】

基于 html5 geolocation来获取经纬度地址(copy)

Jquery 选择html 标签获取值【图】

HTML - 相关标签

HTML - 技术教程分类

HTML - 最新教程

HTML - 最热教程