php-将内容从网站加载到MATLAB,包括内部框架(iframe)
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了php-将内容从网站加载到MATLAB,包括内部框架(iframe),小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2449字,纯文字阅读大概需要4分钟。
内容图文
![php-将内容从网站加载到MATLAB,包括内部框架(iframe)](/upload/InfoBanner/zyjiaocheng/678/d74d2fac75e24f728894d28500728f20.jpg)
我在MATLAB中使用urlread加载网站的内容,然后搜索该内容以供进一步使用.
但是,我遇到了一个站点,在该站点上,我需要的内容位于特定的内部框架中,该内部框架通过< iframe>嵌入到index.php中.
当我将urlread与看似嵌入在主文件中的文件的url一起使用时,我仍然只获得该index.php的内容,而不是targetframecontent.php的内容.
我猜urlread可能不是正确的工具,否则我可能忽略了其他使我的尝试失败的事情.
有没有办法将这样一个内部框架的内容导入MATLAB?
编辑:更精确一点:
我通常会使用以下内容将网站内容读入我的MATLAB工作区:
data = urlread('http://[...]index.php')
但是这样做只能得到父index.php的内容,而不是嵌入式targetframecontent.php的内容.我在浏览网站源代码时发现了这一点,其中包含我感兴趣的内容的网站部分被加载到具有以下内容的框架中:
<iframe src="http://[...]targetframecontent.php" width="850px" height="1000px" border="0" frameborder="0"></iframe>
因此,我尝试将urlread直接与特定目标框架中加载的url一起使用.
但是,当我这样做时,我仍然获得与仍在加载index.php相同的内容.
因此,每当我尝试使用targetframecontent.php的直接URL时,似乎将urlread重定向回index.php.这也是我尝试在浏览器中加载targetframecontent.php时发生的情况.
谢谢你的帮助.
解决方法:
看起来site in question正在检查HTTP请求的引荐来源网址.使用wget,如果您传递–referer选项,则可以下载< iframe> ;:
$wget --referer="http://www.sf.tv/sfmeteo/lokalprognosen/index.php?q=Gen%C3%A8ve" -O test_ref "http://www.sf.tv/sfmeteo/lokalprognosen/detailprognose.php?id=&q=Gen%C3%A8ve&max=&drs=0&kiosk=&js=&deeplink=&f="
$cat test_ref
[...]
<body class="sf">
<!-- referrer:http://www.sf.tv/sfmeteo/lokal -->
<script type="text/javascript"> <!--
var keineprognose = '0';
// -->
</script>
<p class="inv">
<a href="#anker_cm">zum Inhalt</a><br />
</p>
但是,如果wget没有发送引荐来源网址,则会得到:
wget -O test_noref "http://www.sf.tv/sfmeteo/lokalprognosen/detailprognose.php?id=&q=Gen%C3%A8ve&max=&drs=0&kiosk=&js=&deeplink=&f="
<body class="sf" role="application">
<p class="inv">
<a href="#anker_cm">zum Inhalt</a><br />
</p>
<!--googleoff: all--> <div id="HEADWRAP" class="sf-header">
<div class="INNERWRAP">
<h1 class="inv">SF Schweizer Fernsehen - Navigation</h1>
这是原始的父页面.
因此,要将其吸收到MATLAB中,您需要设置Referer HTTP标头.不幸的是,我现在还没有MATLAB,但是此页面似乎很好地介绍了如何使用MATLAB HTTP请求发送标头:http://undocumentedmatlab.com/blog/expanding-urlreads-capabilities/
编辑:因为从该页面来看不是很明显,所以这里是urlread2函数的链接,其中还包括一些示例:http://www.mathworks.com/matlabcentral/fileexchange/35693-urlread2/content/urlread2.m
内容总结
以上是互联网集市为您收集整理的php-将内容从网站加载到MATLAB,包括内部框架(iframe)全部内容,希望文章能够帮你解决php-将内容从网站加载到MATLAB,包括内部框架(iframe)所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。