首页 / PHP / PHP中使用file_get_contents抓取网页中文乱码问题解决方法

PHP中使用file_get_contents抓取网页中文乱码问题解决方法

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了PHP中使用file_get_contents抓取网页中文乱码问题解决方法，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1605字，纯文字阅读大概需要3分钟。

内容图文

本文实例讲述了PHP中使用file_get_contents抓取网页中文乱码问题解决方法。分享给大家供大家参考。具体方法如下：

file_get_contents函数本来就是一个非常优秀的php自带本地与远程文件操作函数,它可以让我们不花吹挥之力把远程数据直接下载,但我在使用它读取网页时会碰到有些页面是乱码了,这里就来给各位总结具体的解决办法.

根据网上有朋友介绍说原因可能是服务器开了GZIP压缩,下面是用firebug查看我的网站的头信息,Gzip是开了的,请求头信息原始头信息,代码如下:
代码如下:Accept text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding gzip, deflate
Accept-Language zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3
Connection keep-alive
Cookie __utma=225240837.787252530.1317310581.1335406161.1335411401.1537; __utmz=225240837.1326850415.887.3.utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=%E4%BB%BB%E4%BD%95%E9%A1%B9%E7%9B%AE%E9%83%BD%E4%B8%8D%E4%BC%9A%E9%82%A3%E4%B9%88%E7%AE%80%E5%8D%95%20site%3Awww.nowamagic.net; PHPSESSID=888mj4425p8s0m7s0frre3ovc7; __utmc=225240837; __utmb=225240837.1.10.1335411401
Host www.gxlcms.com
User-Agent Mozilla/5.0 (Windows NT 5.1; rv:12.0) Gecko/20100101 Firefox/12.0
可以从header信息中找到 Content-Encoding 项是 Gzip.

解决办法比较简单,就是用 curl 代替 file_get_contents 去获取,然后在 curl 配置参数中加一条,代码如下:
代码如下:curl_setopt($ch, CURLOPT_ENCODING, "gzip");

今天用 file_get_contents 抓图片的时候,开始没发现这个问题,废了老大劲才找出来.

使用自带的zlib库,如果服务器已经装了zlib库,用下面的代码可以轻易解决乱码问题,代码如下:
代码如下:$data = file_get_contents("compress.zlib://".$url);

希望本文所述对大家的PHP程序设计有所帮助。

内容总结

以上是互联网集市为您收集整理的PHP中使用file_get_contents抓取网页中文乱码问题解决方法全部内容，希望文章能够帮你解决PHP中使用file_get_contents抓取网页中文乱码问题解决方法所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/270264.html

来源：【匿名】

【上一篇】php中get_meta_tags()、CURL与user-agent用法分析【下一篇】PHP 5 数据对象 (PDO) 抽象层与 Oracle

更多 ►

【PHP中使用file_get_contents抓取网页中文乱码问题解决方法】教程文章相关的互联网学习教程文章

form-phppost提交数据$_POST为空file_get_content(php://input)可以获取到这是为什么呢?【图】

php post提交数据 $_POST为空 file_get_content(php://input)可以获取到这是为什么呢?环境是用MAMP安装的form提交的代码如下:doLogin.php的代码如下 include_once '../include.php';$username = $_POST['username']; $password = md5($_POST['password']); $verify = $_POST['verify']; $session_verify = $_SESSION['verify']; var_dump($_POST); var_dump($_SERVER); 用花瓶抓包的结果: 回复内容： php post提交数据 $_POST为空...

使用file_get_content系列函数和使用curl系列函数采集图片的性能对比

由于公司的一个汽车网站的后台的汽车内容都是主要是来自与汽车之家的，编辑的同事们必须天天手动去对着汽车之家来添加汽车，实在是太蛋疼了。于是乎，为了改变这种状况，作为一个开发码农，我的任务就来了。。。那就是准备做一个功能，只要粘贴对应的汽车之家的网址url就能对这些数据进行自动填充到我们后台的表单中，目前基本的填充都实现了，但是还是没有能够把对应的汽车相册采集进来。采集图片的功能我以前也做过，但是汽车之家...

php中curl、fsocket、file_get_content函数比较

最近做一个网页小偷程序的时候才发现file_get_content已经完全不能满足需求了。我觉得，在读取远程内容时，file_get_content除了使用比curl便捷以外，其他都没有curl好抓取远程内容，之前一直都在用file_get_content函数，其实早就知道有curl这么一个好东西的存在，但是看了一眼后感觉使用颇有些复杂，没有file_get_content那么简单，再就是需求也不大，所以没有学习使用curl。 php中curl和file_get_content的一些比较主要区别：...

php中file_get_content模拟post数据

if($_POST['a'] && $_POST['b']) { echo 'post data success!'; exit(); } ?>文件2：indexx.php 主要测试文件。 $url = 'http://www.test.com/index.php'; $data = array( 'a' => '1', 'b' => '2WWW' ); $params = array( 'http' => array( 'method' => 'POST', 'header' => "Content-type:application/x-www-form-urlenco...

php模板标签入门教程[file_get_content]_PHP教程

本文章是利用了php的fso功能读取模板文件，然后根据我处自定义好的标签进行了文件模板替换就OK了。本文章是利用了php的fso功能读取模板文件，然后根据我处自定义好的标签进行了文件模板替换就OK了。function GetContent($type){ if( $type ) { if(file_exists(./mail_room.html) ) { $content = file_get_contents( ./mail_room.html); } else { ShowMsg(file can read fail ); } } else { if( file_exis...

php中curl、fsocket、file_get_content三个函数的使用比较_PHP教程

抓取远程内容，之前一直都在用file_get_content函数，其实早就知道有curl这么一个好东西的存在，但是看了一眼后感觉使用颇有些复杂，没有file_get_content那么简单，再就是需求也不大，所以没有学习使用curl。直到最近，要做一个网页小偷程序的时候才发现file_get_content已经完全不能满足需求了。我觉得，在读取远程内容的时候，file_get_content除了使用比curl便捷以外，其他都没有curl好。 php中curl和file_get_content的一些比...

php中curl和file_get_content的区别_PHP教程

直到最近，要做一个网页小偷程序的时候才发现file_get_content已经完全不能满足需求了。我觉得，在读取远程内容的时候，file_get_content除了使用比curl便捷以外，其他都没有curl好。主要区别：学习才发现，curl支持很多协议，有FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE以及LDAP，也就是说，它能做到很多file_get_content做不到的事情。curl在php可以实现远程获取和采集内容；实现PHP网页版的FTP上传下载；实现模拟登...

使用file_get_content系列函数和使用curl系列函数采集图片的性能对比，curl函数_PHP教程

使用file_get_content系列函数和使用curl系列函数采集图片的性能对比，curl函数　　由于公司的一个汽车网站的后台的汽车内容都是主要是来自与汽车之家的，编辑的同事们必须天天手动去对着汽车之家来添加汽车，实在是太蛋疼了。于是乎，为了改变这种状况，作为一个开发码农，我的任务就来了。。。那就是准备做一个功能，只要粘贴对应的汽车之家的网址url就能对这些数据进行自动填充到我们后台的表单中，目前基本的填充都实现了，但是...

PHP使用file_get_content设置头信息的方法，phpgetfilecontent_PHP教程

PHP使用file_get_content设置头信息的方法，phpgetfilecontent本文实例讲述了PHP使用file_get_content设置头信息的方法。分享给大家供大家参考，具体如下：直接上代码： <?php /** Accept application/json Accept-Encoding gzip, deflate Accept-Language zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3 Connection keep-alive Cookie mzys_is_frist_access=1; mzys_c_uuid=guest_215cbc0979b5bd2; mzys_access20130610=1; mzys_qz_uuid=d...

为什么用curl或file_get_content抓取不到数据。

为什么用curl或file_get_content抓取不到数据。百度经验里，比如http://jingyan.baidu.com/article/00a07f38441c3782d028dc04.html，直接看页面源代码，是有文章数据。但是用curl ，file_get_content.都无法正常获取文章内容。这是为什么？已经伪造了IP，来路等，但还是抓取不到。百度是通过什么防止抓取数据的？以下是代码： function fcontents( $url, $timeout = 5, $referer = "" ){ $ch = curl_init...

将file_get_content()返回的内容在bootStrap的模态框中显示

php 小白，想实现将 file_get_content() 读到的文本内容，显示在 bootstrap 的模态框中，不懂怎么实现。先说下，发帖前已经自己google百度了，没解决。最后聚焦在，如何点击查看这个按钮以后，将这个参数 $p(其中$p = ../web/test.php) 传给 file_get_contment()后，再由 file_get_content() 返回的内容传给模态框里面显示。点击这里的按钮，然后在模态框中查看新人，知道代码有许多不规范，...

php的file_get_content不会销毁读取到内存中的文件内容吗？该如何解决

php的file_get_content不会销毁读取到内存中的文件内容吗？前阵子给自己写的小程序：遍历指定文件夹内的文件，并搜索指定内容PHP code // 这种用法很占用内存，几乎每次都出错 $content = file_get_contents($file);// 成功 $content = ; $fp = fopen($file, r); $content .= fread($fp, 10240); // 即使没有fclose()，在函数内调用仍然会顺利运行完毕我的猜测是file_get_contents()不会在调用结束后销毁读取的文件内容内存。但是...

aspx页面会跳转，PHP怎么file_get_content()进行追踪采集

aspx页面会跳转，PHP如何file_get_content()进行追踪采集？搜索关键字「39000038」， http://www.mouser.cn/Search/Refine.aspx?Keyword=39000038 因为仅有一款，页面会自动跳转到 http://www.mouser.cn/ProductDetail/Molex/39-00-0038/?qs=%2fha2pyFaduicta8SJW6uUsrinUHZLSGN9RfyeL103Gs%3d搜索关键字「3900003」，有多款产品是一个列表 http://www.mouser.cn/Search/Refine.aspx?Keyword=3900003我想知道，它是直接在.net中直接...

为什么用curl或file_get_content抓取不到数据。解决方案

为什么用curl或file_get_content抓取不到数据。本帖最后由 xroha 于 2014-12-15 09:49:56 编辑为什么用curl或file_get_content抓取不到数据。百度经验里，比如http://jingyan.baidu.com/article/00a07f38441c3782d028dc04.html，直接看页面源代码，是有文章数据。但是用curl ，file_get_content.都无法正常获取文章内容。这是为什么？已经伪造了IP，来路等，但还是抓取不到。百度是通过什么防止抓取数据...

如何检测file_get_content错误

请问，如何检测file_get_content错误，判断错误，提示错误。回复内容：请问，如何检测file_get_content错误，判断错误，提示错误。try {file_get_contents('file_path or url'); } catch (Exception $e) {print_r($e); }和 file() 一样，只除了 file_get_contents() 把文件读入一个字符串。将在参数 offset 所指定的位置开始读取长度为 maxlen 的内容。如果失败，file_get_contents() 将返回 FALSE。 if(file_get_contents('./text...

PHP - 技术教程分类

PHP 教程 PHP 简介 PHP 安装 PHP 语法 PHP 变量 PHP echo/print PHP EOF(heredoc) PHP 数据类型 PHP 类型比较 PHP 常量 PHP 字符串 PHP 运算符 PHP If...Else PHP Switch PHP 数组 PHP 数组排序 PHP 超级全局变量 PHP While 循环 PHP For 循环 PHP 函数 PHP 魔术常量 PHP 命名空间 PHP 面向对象 PHP 测验 PHP 表单 PHP 表单验证 PHP 表单 - 必需字段 PHP 完整表单实例 PHP $_GET 变量 PHP $_POST 变量 PHP 多维数组 PHP 日期 PHP 包含 PHP 文件 PHP 文件上传 PHP Cookie PHP Session PHP E-mail PHP Error PHP Exception PHP 过滤器 PHP 7 新特性 PHP MySQL 简介 PHP MySQL 连接 PHP MySQL 创建数据库 PHP MySQL 创建数据表 PHP MySQL 插入数据 PHP MySQL 插入多条数据 PHP MySQL 预处理语句 PHP MySQL 读取数据 PHP MySQL Where PHP MySQL Order By PHP MySQL Update PHP MySQL Delete PHP ODBC AJAX 简介 AJAX PHP AJAX 数据库 AJAX 实时搜索 AJAX 投票 PHP Array PHP Calendar PHP cURL PHP Date PHP Directory PHP Error PHP Filesystem PHP Filter PHP FTP PHP HTTP PHP Mail PHP Math PHP Misc PHP MySQLi PHP PDO PHP String PHP Zip PHP Timezones PHP 图像处理 PHP RESTful PHP PCRE PHP 可用的函数 PHP Composer php 全部

PHP - 最热教程

php如何取出数组的前几个元素 PHP变量什么时候释放 PHP如何实现在数据库随机获取几条记录如何解决php base64解码乱码 php主要用于哪些领域 Laravel 批量插入(insert)数据六款国内优秀免费wordpress主题推荐 React如何从后端获取数据并渲染到前端？纯PHP实现定时器任务（Timer），php实现...php该如何安装pdo_mysql扩展

首页 / PHP / PHP中使用file_get_contents抓取网页中文乱码问题解决方法

PHP中使用file_get_contents抓取网页中文乱码问题解决方法

内容导读

内容图文

内容总结

内容备注

内容手机端

【PHP中使用file_get_contents抓取网页中文乱码问题解决方法】教程文章相关的互联网学习教程文章

form-phppost提交数据$_POST为空file_get_content(php://input)可以获取到这是为什么呢?【图】

使用file_get_content系列函数和使用curl系列函数采集图片的性能对比

php中curl、fsocket、file_get_content函数比较

php中file_get_content模拟post数据

php模板标签入门教程[file_get_content]_PHP教程

php中curl、fsocket、file_get_content三个函数的使用比较_PHP教程

php中curl和file_get_content的区别_PHP教程

使用file_get_content系列函数和使用curl系列函数采集图片的性能对比，curl函数_PHP教程

PHP使用file_get_content设置头信息的方法，phpgetfilecontent_PHP教程

为什么用curl或file_get_content抓取不到数据。

将file_get_content()返回的内容在bootStrap的模态框中显示

php的file_get_content不会销毁读取到内存中的文件内容吗？该如何解决

aspx页面会跳转，PHP怎么file_get_content()进行追踪采集

为什么用curl或file_get_content抓取不到数据。解决方案

如何检测file_get_content错误

PHP - 相关标签

PHP - 技术教程分类

PHP - 最新教程

PHP - 最热教程