首页 / PHP / 使用php搜索非常大的文件以非常有效地提取块

使用php搜索非常大的文件以非常有效地提取块

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了使用php搜索非常大的文件以非常有效地提取块，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1731字，纯文字阅读大概需要3分钟。

内容图文

我最近一直在解析视频文件中的元数据,并且发现部分问题是视频制作软件供应商(以及其他原因)无视各种标准(或者至少是互动的差异).

因此,我需要能够扫描各种格式,容器和编解码器的非常大的视频(和图像)文件,并挖掘出元数据.我已经有FFMpeg,ExifTool Imagick和Exiv2各自处理各种文件类型的不同类型的元数据,并通过各种其他选项填补其他一些空白(请不要建议库或其他工具,我已经尝试了所有： )).

现在我要扫描一个XMP块(通常由Adobe套件和其他软件写入电影文件)扫描大文件(每个高达2GB).我已经写了一个功能,但我担心它可以改进.

function extractBlockReverse($file, $searchStart, $searchEnd)
{
    $handle = fopen($file, "r");
    if($handle)
    {
        $startLen = strlen($searchStart);
        $endLen = strlen($searchEnd);

        for($pos = 0, 
                $output = '', 
                $length = 0, 
                $finished = false, 
                $target = '';
            $length < 10000 && 
                !$finished && 
                fseek($handle, $pos, SEEK_END) !== -1; 
            $pos--)
        {
            $currChar = fgetc($handle);
            if(!empty($output))
            {
                $output = $currChar . $output;
                $length++;

                $target = $currChar . substr($target, 0, $startLen - 1);
                $finished = ($target == $searchStart);
            }
            else
            {
                $target = $currChar . substr($target, 0, $endLen - 1);
                if($target == $searchEnd)
                {
                    $output = $target;
                    $length = $length + $endLen;
                    $target = '';
                }
            }
        }

        fclose($handle);
        return $output;
    }
    else
    {
        throw new Exception('not found file');
    }
    return false;
}

echo extractBlockReverse("very_large_video_file.mov", 
    '<x:xmpmeta', 
    '</x:xmpmeta>');

目前它还没问题,但我真的很想在这里充分利用php而不会削弱我的服务器,所以我想知道是否有更好的方法来做到这一点(或调整代码可以改善它)因为这种方法似乎有点过头了,就像找到几个字符串并在它们之间拉出任何东西一样简单.

解决方法:

您可以使用其中一种快速字符串搜索算法 – 例如Knuth-Morris-Pratt
或Boyer-Moore以查找开始和结束标记的位置,然后读取它们之间的所有数据.

你应该测量它们的性能,因为如此小的搜索模式可能会导致所选算法的常量不够好,值得它.

内容总结

以上是互联网集市为您收集整理的使用php搜索非常大的文件以非常有效地提取块全部内容，希望文章能够帮你解决使用php搜索非常大的文件以非常有效地提取块所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/791255.html

来源：【匿名】

【上一篇】php – 动态创建Yii FormModel对象(CFormModel)【下一篇】PHP 5 数据对象 (PDO) 抽象层与 Oracle

更多 ►

【使用php搜索非常大的文件以非常有效地提取块】教程文章相关的互联网学习教程文章

使用PHP 构建的Web 应用如何避免XSS 攻击

使用PHP 构建的Web 应用如何避免XSS 攻击Web 2.0 的发展为网络用户的互动提供了更多机会。用户通过在论坛发表评论，或是在博客发表留言都可能有意或无意输入一些破坏性的内容，从而造成网页不能正常显示，影响其它用户的使用。XSS 全称为Cross Site Scripting，因为CSS 已经用作样式表的简称，故称为XSS。XSS 是一种常见的网站攻击的方法。其原理是通过在网页的输入框输入一些恶意的内容，通常是JavaScript脚本片段，而这些恶意输入...

php header的使用，PHP常见header状态总结

<?php//200 正常状态header(‘HTTP/1.1 200 OK‘);// 301 永久重定向，记得在后面要加重定向地址 Location:$urlheader(‘HTTP/1.1 301 Moved Permanently‘);// 重定向，其实就是302 暂时重定向header(‘Location: http://www.maiyoule.com/‘);// 设置页面304 没有修改header(‘HTTP/1.1 304 Not Modified‘);// 显示登录框，header(‘HTTP/1.1 401 Unauthorized‘);header(‘WWW-Authenticate: Basic realm="登录信息"‘);echo ‘...

如何使用PHP Embed SAPI实现Opcodes查看器【代码】

PHP提供了一个Embed SAPI，也就是说，PHP容许你在C/C++语言中调用PHP/ZE提供的函数。本文就通过基于Embed SAPI实现一个PHP的opcodes查看器。首先，下载PHP源码以供编译，我现在使用的是PHP5.3 alpha2进入源码目录： ./configure --enable-embed --with-config-file-scan-dir=/etc/php.d --with-mysql --with-config-file-path=/etc/ ./make ./make install最后，记得要将生成的libphp5.so复制到运行时库的目录，我直接拷贝到了...

使用php下载的文件打不开，自己用着没问题，客户用就不行？

1 现象：　　开发的时候用的好好的文件下载功能，部署到客户那边就不好使了，几乎所有从服务器下载下来的文件都不能打开。　　比较了上传前的文件、上传后服务器端的文件、下载后本机的文件，发现同一个文件，上传后还好好的，通过PHP下载下来就多了3个字节。　　使用uediter用16进制模式打开文件发现文件头部多了“EF BB BF”这三个字节。2 分析：　　上网很容易查到这三个字节叫bom头，windows用来标识这是个utf8格式的文件。　　...

如何在Apache中使用PHP处理PHP文件

一、将PHP预处理器作为Apache的模块(插件)Apache软件自身的功能都是基于模块化管理的.将PHP预处理器作为Apache的一个模块即可.在apache/conf/httpd.conf的配置文件中可以看到加载的模块:?加载模块的语法为:LoadModule??模块名称???模块的实现文件Apache加载PHP预处理器的模块名称为:php5_module??PHP预处理器的模块文件在PHP安装目录下:?php5apache2_2.dll即:?注意:?在配置文件中写路径时的要求:1、使用””将路径包括2、使用/,而不...

使用PHP编写发红包程序

使用PHP编写发红包程序http://www.jb51.net/article/69815.htm投稿：hebedich 字体：[增加减小] 类型：转载时间：2015-07-22 微信发红包是最近非常火的一件事情，大家或多或少的都发过或者收到过红包，那么下面来看一个我们在生活中常碰到的一个php实现微信红包的程序算法，希望这个程序对各位做微信开的朋友会带来帮助．使用PHP发红包，当我们输入红包数量和总金额后，PHP会根据这两个值进行随机分配每个金额，保证每个人都能...

使用PHP实现密保卡功能实现代码<打包下载直接运行>【图】

效果图:密保卡入库复制代码代码如下:$this->load->model(‘admin/m_mibao‘); $data = array(); //生成随机横坐标 $rand_str = $this->_rand_str(10); $arr = array(); for($k=0;$k<strlen($rand_str);$k++) { for ($i = 1;$i < 9;$i++) { $rand = $this->_rand_num(3); //赋给所有code的容器 $arr[$rand_str{$k} . $i] = $rand; } } $data[‘code‘] = serialize($arr); //序列化后将信息入库 $data[‘letter‘] = $rand_str; /...

使用php的curl根据关键词爬取百度搜索结果页

我想实现的是每次根据给出的关键词搜索百度结果页其中php抓取代码如下：<?php$url = "http://www.baidu.com/s?wd=生命动力";// 构造包头，模拟浏览器请求$header = array ("Host:www.baidu.com","Content-Type:application/x-www-form-urlencoded",//post请求"Connection: keep-alive",‘Referer:http://www.baidu.com‘,‘User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; BIDUBrowser 2.6)‘...

教你如何使用php session

PHP session用法其实很简单它可以把用户提交的数据以全局变量形式保存在一个session中并且会生成一个唯一的session_id，这样就是为了多了不会产生混乱了，并且session中同一浏览器同一站点只能有一个session_id,下面我们一起来看看关于session使用方法。如何使用session，凡是与session有关的,之前必须调用函数session_start();为session赋值很简单,如:复制代码代码如下:<?phpSession_start();$Name = "这是一个Session例子";Sess...

如何使用PHP获取网络上文件

<?php//设置我们将要使用的文件$srcurl = "http://localhost/index.php";$tempfilename = "tempindex.html";$targetfilename = "index.html";?><HTML><HEAD><TITLE>Generating <?php echo("$targetfilename"); ?></TITLE></HEAD><BODY><P>Generating <?php echo("$targetfilename"); ?>...</P><?php//首先删除上次操作可能遗留下来的临时文件。//这个过程可能会提示错误，所以我们使用@以防止报错。@unl...

使用 PHP cURL 提交 JSON 数据【代码】

http://www.oschina.net/code/snippet_54100_7351http://www.lornajane.net/posts/2011/posting-json-data-with-php-curl$data = array("name" => "Hagrid", "age" => "36"); $data_string = json_encode($data);$ch = curl_init(‘http://api.local/rest/users‘); curl_setopt($ch, CURLOPT_CUSTOMREQUEST, "POST"); curl_setopt($ch, CURLOPT_POSTFIELDS,$data_string); curl_setopt($ch, CURLOPT_RETURNTRANSFER,true); curl_s...

学习使用PHP数组

PHP4.0中共有超过30个新的数组相关函数。其中很多通用函数允许你检查给定数组中是否存在特定对象、对数组元素计数、增加或删除元素，或对元素排序。如果你有很大的一个数组，而所要完成的仅是找出一个存在的给定值，你可以使用in_array()以返回true 或 false。如下代码将输出“Not found in this array”——因为你将在$namesArray中寻找一个并不存在的“Alber ”。<? $namesArray = array("Joe", "Jane", "Bob", "Mary", "Paul",...

使用PHP接受文件并获得其后缀名的方法【代码】

HTML的form表单用html的表单模拟一个文件上传的post请求，代码如下：<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>File Upload</title> </head> <body> <form enctype="multipart/form-data" action="test.php" method="POST"> <input type="hidden" name="MAX_FILE_SIZ...

php3种基本设计模式的组合使用_PHP教程

php 3种基本设计模式的组合使用1.1 工厂模式，工厂方法或者类生成对象，而不是在代码直接newclass Factory{ static function getDatabase(){return new Mysql($host, $user, $pass);}}#使用Factory::getDatabase();1.2 单例模式，使某个类的对象仅运行创建一个 1.有个私有的静态对象变量，专门存放本类的对象 2.有个静态的方法来创建对象 3.有个私有的构造函数，防止外部new对象 4.有个clone方法，防止clone return false参考...

为什么数据分析一般用到java，而不是使用hadoop，flume，hive的api使用php来处理相关业务？

为什么数据分析一般用到java，而不是使用hadoop，flume，hive的api使用php来处理相关业务？回复内容：为什么数据分析一般用到java，而不是使用hadoop，flume，hive的api使用php来处理相关业务？像传统的关系数据库,进行数据分析的时候难道不是直接使用SQL吗? 如果要分析Web服务器日志,用PHP也完全可以呀,file()读入文件,每行就是数组的一个元素,然后通过分割或者正则匹配就能拿到每一列的内容.如果文件很大,可以调用命令split进行切...

首页 / PHP / 使用php搜索非常大的文件以非常有效地提取块

使用php搜索非常大的文件以非常有效地提取块

内容导读

内容图文

内容总结

内容备注

内容手机端

【使用php搜索非常大的文件以非常有效地提取块】教程文章相关的互联网学习教程文章

使用PHP 构建的Web 应用如何避免XSS 攻击

php header的使用，PHP常见header状态总结

如何使用PHP Embed SAPI实现Opcodes查看器【代码】

使用php下载的文件打不开，自己用着没问题，客户用就不行？

如何在Apache中使用PHP处理PHP文件

使用PHP编写发红包程序

使用PHP实现密保卡功能实现代码<打包下载直接运行>【图】

使用php的curl根据关键词爬取百度搜索结果页

教你如何使用php session

如何使用PHP获取网络上文件

使用 PHP cURL 提交 JSON 数据【代码】

学习使用PHP数组

使用PHP接受文件并获得其后缀名的方法【代码】

php3种基本设计模式的组合使用_PHP教程

为什么数据分析一般用到java，而不是使用hadoop，flume，hive的api使用php来处理相关业务？

PHP - 相关标签

提取 - 相关标签

文件 - 相关标签

PHP - 技术教程分类

PHP - 最新教程

PHP - 最热教程