首页 / PHP / php采集书并合成txt格式的实现代码_php技巧

php采集书并合成txt格式的实现代码_php技巧

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了php采集书并合成txt格式的实现代码_php技巧，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1473字，纯文字阅读大概需要3分钟。

内容图文

/**
* @name 采集书.php
* @date Sun Mar 01 22:48:02 CST 2009
* @copyright 马永占(MyZ)
* @author 马永占(MyZ)
* @link http://blog.csdn.net/mayongzhan/
*/
//header('Content-Type:text/html;charset=utf8');
header('Content-Type:text/html;charset=gb2312');
error_reporting(E_ALL);
date_default_timezone_set('Asia/Shanghai');
set_time_limit(0);
function writer($content,$url)
{
$fp = fopen($url, 'ab');
fwrite($fp, $content);
fclose($fp);
}
$folder = '2'; //文件夹
$book_base_url = 'xxxxxxxxxxxxxxxxxxxxx';
$book_url = 'yyyyyyyyyyyyy.html';
$main = file_get_contents($book_base_url.$book_url);
preg_match_all('/chapter_.*?\.html/', $main, $pages);
$pages = array_unique($pages[0]);
foreach ($pages as $value) {
writer(file_get_contents($book_base_url.$value), './'.$folder.'/'.$value.'.txt');
$str = file_get_contents('./'.$folder.'/'.$value.'.txt');
//print_r($str);
preg_match("/(

)(.?)(<\/h1>)(.?)()(.?)(<\/div>)/s",$str,$arr);
//print_r($arr);die();
$arr[6] = preg_replace("/(<span[^>]+>.?]+>)(.*?)(<\/a><\/span>)/s","$2",preg_replace("/
|<\/p>/","\r\n",$arr[6]));
$result = "\r\n------------------------------------------------\r\n------------------------------------------------\r\n------------------------------------------------\r\n----------------".$arr[2]."\r\n------------------------------------------------\r\n------------------------------------------------\r\n------------------------------------------------\r\n".$arr[6];
writer($result, './'.$folder.'/new.txt');
}
?>

内容总结

以上是互联网集市为您收集整理的php采集书并合成txt格式的实现代码_php技巧全部内容，希望文章能够帮你解决php采集书并合成txt格式的实现代码_php技巧所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/258475.html

来源：【匿名】

【上一篇】php删除记录实现代码_php技巧【下一篇】PHP 5 数据对象 (PDO) 抽象层与 Oracle

更多 ►

【php采集书并合成txt格式的实现代码_php技巧】教程文章相关的互联网学习教程文章

php 发送带附件邮件的实现代码【代码】【图】

php发送邮件，可以发送带附件邮件。1，emailclass.php<? class CMailFile {var$subject; var$addr_to; var$text_body; var$text_encoded; var$mime_headers; var$mime_boundary = "--==================_846811060==_"; var$smtp_headers;function CMailFile($subject,$to,$from,$msg,$filename,$downfilename,$mimetype = "application/octet-stream",$mime_filename = false) { $this->subject = $subject; $this->addr...

php简单浏览目录内容的实现代码

如下所示：复制代码代码如下:<?php$dir = dirname(__FILE__);$open_dir = opendir($dir);echo "<table border=1 borderColor=red cellpadding=6>";echo "<tr><th>文件名</th><th>大小</th><th>类型</th><th>修改日期</th></tr>";while ($file = readdir($open_dir)) { if ($file!= "." && $file != "..") { echo "<tr><td>" . $file . "</td>"; echo "<td>" . filesize($file) . "</td>"; echo "<td>" . filetype($file) . "</...

用PHP实现的四则运算表达式计算实现代码

PHP实现：复制代码代码如下:<?php /** * 计算四则运算表达式 */ error_reporting(E_ALL); $exp = ‘(1+2*(3+5)/4)*(3+(5-4)*2)‘; $arr_exp = array(); for($i=0;$i<strlen($exp);$i++){ $arr_exp[] = $exp[$i]; } $result = calcexp( array_reverse($arr_exp) ); echo $exp . ‘=‘ . $result; function calcexp( $exp ){ $arr_n = array(); $arr_op = array(); while( ($s = array_pop( $exp )) != ‘‘ ){ if( $s == ‘(‘ ){...

php中通过curl模拟登陆discuz论坛的实现代码

libcurl同时也支持HTTPS认证、HTTP POST、HTTP PUT、 FTP 上传(这个也能通过PHP的FTP扩展完成)、HTTP 基于表单的上传、代理、cookies和用户名+密码的认证。 php的curl真的是相当好用，网上一搜索相关文章都是关于curl模拟登陆的，很少人提供模拟discuz发贴的源码。复制代码代码如下:<?php $discuz_url = ‘http://127.0.0.1/discuz/‘;//论坛地址 $login_url = $discuz_url .‘logging.php?action=login‘;//登录页地址 $post_fi...

PHP中文分词的简单实现代码分享

当然，本文不是要对中文搜索引擎做研究，而是分享如果用 PHP 做一个站内搜索引擎。本文是这个系统中的一篇。我使用的分词工具是中科院计算所的开源版本的 ICTCLAS。另外还有开源的 Bamboo，我随后也会对该工具进行调研。从 ICTCLAS 出发是个不错的选择，因为其算法传播比较广泛，有公开的学术文档，并且编译简单，库依赖少。但目前只提供了 C/C++， Java 和 C# 版本的代码，并没有 PHP 版本的代码。怎么办呢? 也许可...

php 多线程上下文中安全写文件实现代码

复制代码代码如下:<?php /** * @usage: used to offer safe file write operation in multiple threads context, arbitory file type * @author: Rocky Zhang * @time: Nov. 11 2009 * @demo[0]: $handler = mfopen($file, ‘a+‘); * mfwrite($handler, $str); */ function mfopen($file, $mode=‘w+‘) { $tempfile = generateTempfile(‘./tempdir‘, $file); preg_match(‘/b/i‘, $mode) || ($mode .= ‘b‘); // ‘b‘ is r...

用php解析html的实现代码

最近想用php写一个爬虫，就需要解析html，在sourceforge上找到一个项目叫做PHP Simple HTML DOM Parser，它可以以类似jQuery的方式通过css选择器来返回指定的DOM元素，功能十分强大。首先要在程序的开始引入simple_html_dom.php这个文件复制代码代码如下:include_once(‘simple_html_dom.php‘); PHP Simple HTML DOM Parser提供了3种方式来创建DOM对象复制代码代码如下:// Create a DOM object from a string $html = str_ge...

php编写的简单页面跳转功能实现代码

不多说，直接上代码复制代码代码如下://链接数据库‘查询mysql_connect(‘localhost‘,‘username‘,‘userpwd‘)or die("数据库链接失败".mysql_error());mysql_select_db(‘库名‘);mysql_query(‘set names utf8‘);$sql1="select * from user ";$query1=mysql_query($sql1);$count=array();while($row=mysql_fetch_assoc($query1)){ $count[]=$row;}$totalnews=count($count);//判断pageif($_GET[‘page‘]){ $page=$_G...

PHP调用MySQL的存储过程的实现代码

MySQL好像从5.0开始才引入存储过程，反正以前做应用的时候从没碰过，不过现在因为主要作内部系统，所以很多应用都用到了存储过程，当然前台有时候也需要调用MySQL存储过程，PHP的MySQL Lib好像支持的不是很好，不过我搜索了些资料，虽然不多，但是还是尝试的使用了，现在介绍一下方法，以便用到的朋友不用再头疼。　　lMySQL扩展也是支持存储过程的，不过只支持无返回结果的存储过程，如果该存储过程存在输出，这个调用就会抛出一...

使用ThinkPHP自带的Http类下载远程图片到本地的实现代码

Http类在目录ThinkPHP/Lib/ORG/Net下面。接下来看看是如何调用的。复制代码代码如下:<?php import("Com.Buyback.QueryAmazon"); import("ORG.Net.Http"); class Image { public static function getImage($isbn) { $bookInformModel = D("bookinform"); $result = $bookInformModel->where("isbn=‘$isbn‘")->select(); if($result[0][‘image‘] == ""){ $data[‘inform_id‘] = $result[0][‘inform_id‘]; $remoteUrl = Quer...

PHP 遍历文件实现代码

复制代码代码如下:function Files($path) { foreach(scandir($path) as $line) { if($line==‘.‘||$line==‘..‘) continue; if(is_dir($path.‘/‘.$line)) Files($path.‘/‘.$line); else echo ‘<li>‘.$path.‘/‘.$line.‘</li>‘; } } PHP遍历文件及文件夹加入给定文件夹 C:\\Windows\\AppPatch 1.首先获取这个文件夹下面的所有东西，也就是文件，文件夹，放一个数组里面 $fileArr = array( ‘files‘ => array(), //文件...

PHP 多维数组排序实现代码

array_multisort (PHP 4, PHP 5) array_multisort -- 对多个数组或多维数组进行排序说明 bool array_multisort ( array ar1 [, mixed arg [, mixed ... [, array ...]]] ) 如果成功则返回 TRUE，失败则返回 FALSE。 array_multisort() 可以用来一次对多个数组进行排序，或者根据某一维或多维对多维数组进行排序。关联（string）键名保持不变，但数字键名会被重新索引。输入数组被当成一个表的列并以行来排序――这类似于 SQL 的...

PHP插入排序实现代码

算法描述：⒈ 从第一个元素开始，该元素可以认为已经被排序⒉ 取出下一个元素，在已经排序的元素序列中从后向前扫描⒊ 如果该元素（已排序）大于新元素，将该元素移到下一位置⒋ 重复步骤3，直到找到已排序的元素小于或者等于新元素的位置⒌ 将新元素插入到下一位置中⒍ 重复步骤2复制代码代码如下:<?php $arr =array(123,0,5,-1,4,15); function insertSort(&$arr){ //先默认第一个下标为0的数是排好的数 f...

php 结果集的分页实现代码

复制代码代码如下:<?php @mysql_connect("localhost", "root","1981427") //连接数据库服务器 or die("数据库服务器连接失败"); @mysql_select_db("test") //选择数据库mydb or die("数据库不存在或不可用"); $query = @mysql_query("select * from tablename1") //执行用于计算页数的SQL语句 or die("SQL语句执行失败"); $pagesize = 5; //设置每页记录数 $sum = mysql_numrows($query); //计算总记录数 if($sum % $pagesize == ...

PHP多线程批量采集下载美女图片的实现代码

使用curl的多线程，另外curl可以设置请求时间，遇到很慢的url资源，可以果断的放弃，这样没有阻塞，另外有多线程请求，效率应该比较高下面是代码实现/** * curl 多线程 * @author http://www.lai18.com* @param array $array 并行网址 * @param int $timeout 超时时间* @return mix */public function Curl_http($array,$timeout='15'){$res = array();$mh = curl_multi_init();//创建多个curl语柄foreach($array as $k=>$url){$co...

首页 / PHP / php采集书并合成txt格式的实现代码_php技巧

php采集书并合成txt格式的实现代码_php技巧

内容导读

内容图文

内容总结

内容备注

内容手机端

【php采集书并合成txt格式的实现代码_php技巧】教程文章相关的互联网学习教程文章

php 发送带附件邮件的实现代码【代码】【图】

php简单浏览目录内容的实现代码

用PHP实现的四则运算表达式计算实现代码

php中通过curl模拟登陆discuz论坛的实现代码

PHP中文分词的简单实现代码分享

php 多线程上下文中安全写文件实现代码

用php解析html的实现代码

php编写的简单页面跳转功能实现代码

PHP调用MySQL的存储过程的实现代码

使用ThinkPHP自带的Http类下载远程图片到本地的实现代码

PHP 遍历文件实现代码

PHP 多维数组排序实现代码

PHP插入排序实现代码

php 结果集的分页实现代码

PHP多线程批量采集下载美女图片的实现代码

PHP - 相关标签

采集 - 相关标签

格式 - 相关标签

PHP - 技术教程分类

PHP - 最新教程

PHP - 最热教程