首页 / PHP / PHP远程获取网页内容
PHP远程获取网页内容
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了PHP远程获取网页内容,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2343字,纯文字阅读大概需要4分钟。
内容图文
![PHP远程获取网页内容](/upload/InfoBanner/zyjiaocheng/157/cb874193fe8c4f2a8fde91e615c8418a.jpg)
include 'StringBuilder.php'; class CutPage{ function __construct(){ } //方法一:连接 获取真个文件的文本内容 function getAllContent($url){ $resouce=fopen($url, "r") or die("文件打开失败!"); if(!$resouce){ echo "请求文件不存在!"; } //$allc//长度太短了取不全用自购建的stringbuilder $sb=new StringBuilder(); while(!feof($resouce)){ //如果没有到文件的结尾则继续向下执行 $line=fgets($resouce,4096); $sb->append($line); } fclose($resouce); return $sb->toString(); } //方法二:获取所有的文本进行文本title的匹配---------格式为:xxxx(xx)xxx的形式表达式 function matchContentTitle($content,$regex_title){ //echo "regex:".$regex_title; if(preg_match($regex_title, $content)){ $array=preg_split($regex_title, $content,-1,PREG_SPLIT_DELIM_CAPTURE); return $array[1]; }else{ echo "匹配失败!"; } } //匹配章节 返回携带章节的array function matchContentChapter($content,$regex_chapter){ if(preg_match_all($regex_chapter, $content,$matcher)){ return $matcher[1]; }else{ echo "匹配失败!"; return ; } } }
测试php文件
include 'CutPage.php'; class Test{ public static function start($url,$regex_title,$regex_chapter){ $cut=new CutPage(); $all=$cut->getAllContent($url); $returnTitle=$cut->matchContentTitle($all, $regex_title); echo "题目:".$returnTitle; $arrays=$cut->matchContentChapter($all, $regex_chapter); for($i=0;$i<count($arrays);$i++){ echo $arrays[$i]; } } } $url="http://www.quanben.com/xiaoshuo/12/12816/"; //正则表达式 $regex_title="/\s*[<]div id=\"title\">[<][h][1]>(\S+)[<]\/[h][1]>[<]\/div>\s*/"; $regex_chapter="/\s*[<]a href=\"\d{7}[.]html\"[>](\W+)[<]\/a>\s*/";//章 Test::start($url, $regex_title, $regex_chapter); //echo "cut".$return; //匹配汉字的正则表达式^[\u4E00-\u9FA5]+这里构建了一个类似JAVA中的一个StringBuilder类
class StringBuilder { const LINE="
"; protected $list= array(''); public function __construct( $str=NULL) { array_push($this->list,$str); } public function append($str) { array_push($this->list,$str); return $this; } public function appendLine($str) { array_push($this->list,$str.self::LINE); return $this; } public function appendFormat( $str,mixed $args) { array_push($this->list, sprintf($str,$args)); return $this; } public function toString() { return implode("",$this->list); } public function __destruct() { unset($this->list); } }
以上就介绍了PHP远程获取网页内容,包括了正则表达式方面的内容,希望对PHP教程有兴趣的朋友有所帮助。
内容总结
以上是互联网集市为您收集整理的PHP远程获取网页内容全部内容,希望文章能够帮你解决PHP远程获取网页内容所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。