【php信息采集采不到内容?】教程文章相关的互联网学习教程文章

初级的用php写的采集程序_php技巧【图】

可以先用这个采集然后在用帝国处理 #################################################################################### #作者:9elong #网站:个人小站不值一提 #时间:2007-01-01 #声明:仅用于学习php之用。 #功能:采集单页面图片。 #说明:3个示范表单已经写好正则用来示范。没有任何功能说明,一切都在源代码里。附加论坛图片采集正则示范 ##########################################################################...

dede3.1分页文字采集过滤规则详说(图文教程)续二_php技巧【图】

稍微了解dede采集规则的朋友上篇内容完全可以略过,下面看看如何以静制动、以不变就万变地解决分页采集问题。二、采集新目标目标地址:1、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/index.html2、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/2007-2/9/20070209110903558.html之所以选取两个目标页面,是因为以上的两个页面一个有分页,而另一个没有,并且在分页和全文取样部分有较大的差别。以下的说明是在为采集目...

dede3.1分页文字采集过滤规则详说(图文教程)_php技巧【图】

本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题一、范例部分范例分页区域代码:范例分页区域代码:范例分页区域取样代码: 分页区域取样(匹配): 范例分页内容过滤规则:分页内容过滤规则: 范例采集内容预览:范例采集内容预览:范例全代码(说明:此代码为在原基础上进行更改后的代码,原代码版本不同,直接导入后无效,因此在dede论坛中有许多朋友说过‘直接...

手把手教你使用DedeCmsV3的在线采集图文教程_php技巧【图】

这是我们要采集的目标网址-------------------------------------------------------------看看分页是怎么设置的---------------------------------------------------标题里有些多出来的东西处理一下---------------------------------------------------------其它内容---------------------------------文章body部份--------------------------------------------结束-----------------------------------测试采集-------------...

解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法_php技巧

-------------------------------------------------------- 风十三 落伍首发 转载请注明作者和出处 ------------------------------------------------------ 1.如何修改默认发布为动态页; 这个其实很简单,会改html就可以了!把dede文件夹打开,用编辑器打开article_add.php,找到发布选项: 生成HTML 仅动态浏览 修改为: 发布选项: ...

中国站长站ForDede4.0采集规则_php技巧

转载请注明出自落伍im286.com,本贴地址:http://www.im286.com/viewthread.php?tid=1991813 只差两分就落伍了,特献出中国站长站 For Dede4.0 的采集规则,希望大家能够支持我落伍,谢谢了!!! 下面的规则为网站运营 >> 搜索优化 的采集规则,其他栏目的规则只要把“来源网址”和“文章网址需包含”这两项改成你想采集栏目的网址和目录。 如想采集站长在线 >> 好站推荐 这个栏目,你只要做如下更改: 来源网址:[url]http://www....

利用PHP制作简单的内容采集器的代码_php技巧

采集器,通常又叫小偷程序,主要是用来抓取别人网页内容的。关于采集器的制作,其实并不难,就是远程打开要采集的网页,然后用正则表达式将需要的内容匹配出来,只要稍微有点正则表达式的基础,都能做出自己的采集器来的。   前几天做了个小说连载的程序,因为怕更新麻烦,顺带就写了个采集器,采集八路中文网的,功能比较简单,不能自定义规则,不过大概思路都在里面了,自定义规则可以自己来扩展。   用php来做采集器主要用...

php不用正则采集速度探究总结_php技巧

注意:下面的所有函数都没有用正则。 以上为取出第一个匹配的三个函数,实现相同的目的 代码如下:function str_cut($str ,$start, $end) {//取出第一个匹配,效率最高,先分割再替换 $content = strstr( $str, $start ); $content = substr( $content, strlen( $start ), strpos( $content, $end ) - strlen( $start ) ); return $content; } function str_cut1($str ,$start, $end) {//取出第一个匹配,效率中,直接查找替换 ...

php采集速度探究总结(原创)_php技巧

注意:下面的所有函数都没有用正则。 以上为取出第一个匹配的三个函数,实现相同的目的 function str_cut($str ,$start, $end) {//取出第一个匹配,效率最高,先分割再替换 $content = strstr( $str, $start ); $content = substr( $content, strlen( $start ), strpos( $content, $end ) - strlen( $start ) ); return $content; } function str_cut1($str ,$start, $end) {//取出第一个匹配,效率中,直接查找替换 $x = strpos($st...

利用PHP制作简单的内容采集器的原理分析_php技巧

前几天做了个小说连载的程序,因为怕更新麻烦,顺带就写了个采集器,采集八路中文网的,功能比较简单,不能自定义规则,不过大概思路都在里面了,自定义规则可以自己来扩展。   用php来做采集器主要用到两个函数:file_get_contents()和preg_match_all(),前一个是远程读取网页内容的,不过只在php5以上的版本才能用,后一个是正则函数,用来提取需要的内容的。   下面就一步一步来讲功能实现。   因为是采集小说,所以首先要...

PHP采集程序常用函数_php技巧

当前的脚本网址 function get_php_url(){ if(!empty($_SERVER["REQUEST_URI"])){ $scriptName = $_SERVER["REQUEST_URI"]; $nowurl = $scriptName; }else{ $scriptName = $_SERVER["PHP_SELF"]; if(empty($_SERVER["QUERY_STRING"])) $nowurl = $scriptName; else $nowurl = $scriptName."?".$_SERVER["QUERY_STRING"]; } return $nowurl; } //把全角数字转为半角数字 function GetAlabNum($fnum){ $nums = array("0","1","2","...

php采集书并合成txt格式的实现代码_php技巧

/** * @name 采集书.php * @date Sun Mar 01 22:48:02 CST 2009 * @copyright 马永占(MyZ) * @author 马永占(MyZ) * @link http://blog.csdn.net/mayongzhan/ */ //header('Content-Type:text/html;charset=utf8'); header('Content-Type:text/html;charset=gb2312'); error_reporting(E_ALL); date_default_timezone_set('Asia/Shanghai'); set_time_limit(0); function writer($content,$url) { $fp = fopen($url, 'ab'); fwrite...

php信息采集程序代码_php技巧

代码如下://采集首页地址 $url="http://emotion.pclady.com.cn/skills/"; //获取页面代码 $rs=file_get_contents($url); //设置匹配正则 //$fp=fopen("text.txt","a"); //$fw=fwrite($fp,$rs); //fclose($fp); /*href="http://emotion.pclady.com.cn/skills/0903/376476.html" target=_blank>留住你身边的好男人*/ $preg='/]+\">(.*)/i'; //进行正则搜索 preg_match_all($preg,$rs,$title); //计算标题数量 $count=count($title[0]...

PHP采集心得技巧_php技巧

1.获取远程文件源代码(file_get_contents或用fopen). 2.分析代码得到自己想要的内容(这里用正规匹配,一般是得到分页)。 3.跟根得到的内容进行下载入库等操作。   在这里第二步有可能要重复的操作好几次,比如说要先分析一下分页地址,在分析一下内页的内容才能取得我们想要的东西。   代码:   记的以前发部过部分的代码今天我在这里在简单的发部一下   复制PHP内容到剪贴板   PHP代码: @$nl=file_get_contents($rs...

PHP文章中的远程图片采集到本地的代码_php实例【图】

第一步. 先从文章中把所有 用正则 抠出来. 代码如下:$message //文章内容 //正则(这个还不是) $reg = "/<img[^>]*src=\"(http:\/\/(.+)\/(.+)\.(jpg|gif|bmp|bnp))\"/isU"; //把抠出来的 img 地址存放到 $img_array 变量中 preg_match_all($reg, $message, $img_array, PREG_PATTERN_ORDER); //过滤重复的图片 $img_array = array_unique($img_array[1]); 第二步. 把$img_array 数组循环一下. 做图片保存和文章位置替换 代码如下...