【DEDE采集大师官方留后门的删除办法】教程文章相关的互联网学习教程文章

一个php文本采集类

$C = new Collection();$C->url = http://bbs.it-home.org/subject_search?cat=1001&search_text=%E5%B9%B4%E8%BD%BB%E4%BA%BA;$C->startFlag = ;$C->endFlag = ;$C->init();$C->regExp = "|(.*)(.*)|Uis";$C->parse();print_rr($C->result);*/php文本采集类文件:<%/**模块名:php文本采集类**/class Collection{//入口 公有var $url; //欲分析的url地址var $content; //读取到的内容var $regExp; //要获取部分的正则...

一个比较全面的截取函数(多用于采集内容的分析)

/*采集截取函数,主要用于分析采集的内容getcon - 截取后去掉html字符,并去掉空格getcon2 - 单纯截取,直接返回截取内容。参数:$par可接受两种格式:1.前面字符{DATA}后面字符2.正则表达式*/function getcon($pat,$str){ $title_var=explode("{DATA}",$pat); if(count($title_var)>1){ $title_1=explode($title_var[0],$str); $title_2=explode($title_var[1],$title_1[1]); return stri...

采集邮箱php代码

由于搞了个群发邮件的程序,当然没邮箱不行,所以写了个采集邮箱程序. 转载自: http://www.tongqiong.com/read.php?tid-35-ds-1.html //作者:www.tongqiong.com$url='http://www.tongqiong.com/read.php?tid-1-ds-1.html'; //这个网页里绝对含有邮件地址。$content=file_get_contents($url);//echo $content;function getEmail($str) { //$pattern = "/([a-z0-9]*[-_\.]?[a-z0-9]+)*@([a-z0-9]*[-_]?[a-z0-9]+)+[\.][a-z]{2,3...

php写的文章采集URL补全函数(FormatUrl)【图】

$surl="http://bbs.it-home.org/";$gethtm = '首页解决方案';echo formaturl($gethtm,$surl);?>输出:首页解决方案 --------- 演示实例 ------------ 原始路径代码:http://www.newnew.cn/newnewindex.aspx 输出演示代码:http://www.maifp.com/aaa/test.php 函数代码:function formaturl($l1,$l2){if (preg_match_all("/(]+src=\"([^\"]+)\"[^>]*>)|(]+href=\"([^\"]+)\"[^>]*>)|(]+src='([^']+)'[^>]*>)|(]+href='([^']+)'[^>]*...

PHP图片采集程序--图片采集类

代码来自本人博客: http://www.taoniwu.com/archives/3234.html各位大神如果有什么好的建议,感谢提出~~~~~ ?class Collection{ protected $url; //采集地址 protected $prefix; //重命名文件前缀 protected $style; //需要采集的图片格式,传入一个数组 const prel = '/(?:http?|https?):\/\/(?:[^\.\/\(\)\?]+)\.(?:[^\.\/]+)\.(?:com|cn|net|org)\/(?:[^\.:\"\'\(\)\?]+)\.(jpg|png|gif)/i'; //采集规则 //构造函...

最近采集写的一个超简单实用的HTML解析类

$xp = new xf_HtmlDom(); $xp->loadHtml(http://dealer.bitauto.com/100040078/cars.html); $rows = $xp->find(dl/dd/a, 0)->innertext; print_r($rows); <?php$oldSetting = libxml_use_internal_errors( true ); libxml_clear_errors();/** * * -+----------------------------------- * |PHP5 Framework - 2011 * |Web Site: www.iblue.cc * |E-mail: mejinke@gmail.com * |Date: 2012-10-12 * -+----------------------------...

PHP采集图片函数一例

PHP 采集图片函数一例 <p><? /** * 采集图片函数 * func: getimg * params: $url 网址 $filepath 图片文件的路径 * by bbs.it-home.org */ function getimg($url, $filepath) { </p> <p> if ($url == ) { return false; } $ext = strrchr($url, .); </p> <p> if ($ext != .gif && $ext != .jpg) { return false; } </p> <p> //判断路经是否存在 !is_dir($filepath)?mkdir($filepath):null; </p> <p> //获得随机的图片名,并加上后辍...

PHP采集远程图片的实例代码

function make_dir($path){ if(!file_exists($path)){//不存在则建立 $mk=@mkdir($path,0777); //权限 @chmod($path,0777); } return true; }函数read_filetext()取得图片内容。 使用fopen打开图片文件,然后fread读取图片文件内容。function read_filetext($filepath){ $filepath=trim($filepath); $htmlfp=@fopen($filepath,"r"); //远程 if(strstr($filepath,"://")){ whi...

PHP采集网页图片保存到本地的示例代码

/** * 保存网页文件到本地(用于采集图片) * edit: bbs.it-home.org * @param 文件路径 $sUrl * @param 保存本地路径 $sSavePath * @return boolean */ function download_file($sUrl,$sSavePath='') { $sFileName = GetUrlFileExt($sUrl); $c = file_get_contents($sUrl); return file_put_contents($sSavePath.'/'.$sFileName,$c); } /** * 获取文件名 * * @param 网页URL $sUrl * @return string ...

phpcurl采集站外内容示例代码

<?php// 初始化一个 cURL 对象 $curl = curl_init(); // 设置你需要抓取的URL curl_setopt($curl, CURLOPT_URL, http://bbs.it-home.org); // 设置header curl_setopt($curl, CURLOPT_HEADER, 1); // 设置cURL 参数,要求结果保存到字符串中还是输出到屏幕上。 curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); // 运行cURL,请求网页 $data = curl_exec($curl); // 关闭URL请求 curl_close($curl);3、通过正则匹配找到关键数据<?p...

自己写的一个php基于phpQuery的通用采集类

还是小菜,第一次分享代码哈,这是自己以前写的一个php的采集类,自己一直在用,自我感觉很简单很强大,只要懂一点点选择器的知识就可以采集任何页面了,也支持https页面,做简单的采集足够用了。 <?php /** *通用列表采集类 *版本V1.3 *作者:JAE *博客:http://blog.jaekj.com */ require_once ../phpQuery/phpQuery/phpQuery.php; class QueryList{ private $pageURL; private $regArr = arra...

php简单实现通讯录采集,我的第一个php,适合新手

起源于要整理通讯录,原先用的是文件调查,现在学了php,就自己试一下.程序短小精悍,适于学习.有两个文件,bj.html用于显示和采集表单信息.bj.php用于处理数据和反馈结果.突出之处在于可以上传阅览头像.其实还有一个test.php,用于调试,中间处理.从这个开始先看.注释很详细,标签,函数不会的话右键搜索.因为web目录很多,放在./1/文件夹下,在火狐设一个书签方便访问部署时吧bj.html改成index.php原先想着搭建一个ipv6免费上网的应用平台(现...

PHP+jQuery+POST采集网页示例

利用JQuery强大的DOM操纵能力来采集页面数据,然后组织数据以POST的方式发送数据给自身,自身接收POST来的数据再以CSV格式写入到文件.声明:本程序仅作学习和演示之用,请勿频繁采集示例中的网址;以免给目标网站造成不必要的麻烦!欢迎大家提出意见<?phpset_time_limit(0);$num = range(0, 49100, 100);$base = http://www.zjchina.org/mspMajorIndexAction.fo?&startcount=;$page = isset($_GET[startcount]) ? $_GET[startcount] : 0;...

PHP采集腾讯微博只留文字部分

PHP采集腾讯微博只留文字部分 header("Content-type:text/html;charset=utf-8");$weibo = file_get_contents('http://t.qq.com/starank');$preg = '/(.*)/Uis';preg_match_all($preg, $weibo, $string);foreach ($string[1] as $key=>$value){ echo delhtml($value)."";}function delhtml($str) // 清除html标签{ $st = -1; //开始 $et = -1; //结束 $stmp = array(); $stmp[] = " "; $len = strlen($str); f...

PHP多线程批量采集下载图片的实现代码

使用curl的多线程,另外curl可以设置请求时间,遇到很慢的url资源,可以果断的放弃,这样没有阻塞,另外有多线程请求,效率应该比较高 /** * curl 多线程 * @param array $array 并行网址 * @param int $timeout 超时时间 * @return mix */ public function Curl_http($array,$timeout=15){ $res = array(); $mh = curl_multi_init();//创建多个curl语柄 foreach($array as $k=>$url){...

采集 - 相关标签