首页 / PHP / php页面编码与字符操作

php页面编码与字符操作

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了php页面编码与字符操作，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4630字，纯文字阅读大概需要7分钟。

内容图文

我们可以用header来定义一个php页面为utf编码或GBK编码，也可以在html中用meta标签来指定编码

例如：php页面为utf编码 header("Content-type: text/html; charset=utf-8");

我们通常使用header或meta，下面说一说两者的区别

一、采用meta页面编码

用meta来设置页面编码

                1
                <meta http-equiv="content-type" content="text/html; charset=编码类型">

作用是：声明客户端的浏览器用什么字符集编码显示该页面，起到通知浏览器的作用。只有字符编码与浏览器编码相同时才不会造成错误而产生乱码。

二、采用header()页面编码

用header()来设置页面编码

                1 header("content-type:text/html; charset=编码类型");

header是发送原始 HTTP 标头，作用是把括号里面的信息发到http标头，浏览器会采用header()中设置的编码。

三、AddDefaultCharset方式设置编码

注意：以前版本的Apache配置时修改AddDefaultCharset这个选项，要改为gb2312或者utf-8，否则汉字会变为乱码，但从Apache 2.0.53 开始,取消了AddDefaultCharset，现在的新版本会自适应浏览器的。所以在apache2.4中是找不到AddDefaultCharset的。

文档中：

低版本的Apache的 .conf 文件里，有AddDefaultCharset。可以设置defaultcharset 字符编码（删除前面的#）。设置完成后相当于在每个文件中加上header("content-type:text/html; charset=字符编码")。

但是和header()还是有区别的（优先级不一样）

1：如果页面没有指定编码， Apache配置defaultcharset gbk , 页面文件编码是utf-8。

页面显示是乱码。在页面没有meta指明charset，设置defaultcharset gbk，这个时候服务器的设置生效，编码不一致，造成乱码；

2：如果页面指定编码为utf-8, Apache配置defaultcharset gbk. 页面文件编码是utf-8。

页面显示乱码。设置defaultcharset gbk，会覆盖页面级别（meta）的编码设置；

3：如果页面header申明charset为utf8, Apache配置defaultcharst gbk,页面文件编码是utf8。

页面显示正常。这个说明header优先级要高于服务器和浏览器的设置；

4：如果Apache关闭DefaultCharset 。

页面显示正常。

由此得出结论：

header() >> AddDefaultCharset >> meta

所以添加header()是比较好的方法

四、编码转换函数

1：mb_detect_encoding 检查编码

                    1
                    $string = "赵亚飞";
2$encode = mb_detect_encoding($string, array("ASCII","UTF-8","GB2312","GBK","BIG5"));
3header("content-Type: text/html; charset=".$encode);
4echo$string;

有时会出现检查错误（解决办法）例如：对与GB2312和UTF- 8，或者UTF-8和GBK网上说是由于字符短是，mb_detect_encoding会出现误判。不是bug，写程序时也不应当过于依赖mb_detect_encoding，当字符串较短时，检测结果产生偏差的可能性很大。

$encode = mb_detect_encoding($keytitle, array(‘ASCII‘,‘GB2312′,‘GBK‘,‘UTF-8‘);

三个参数分别是：被检测的输入变量、编码方式的检测顺序(如果为真，后面自动忽略)、strict模式
对编码检测的顺序进行调整，将最大可能性放在前面，这样减少被错误转换的机会。一般要先排gb2312，当有GBK和UTF-8时，需要将常用的排列到前面。

2：mb_convert_encoding 转换编码

函数原型：string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
例如：

                        1 1： 将任意类型（ ‘ASCII,GB2312,GBK,UTF-8‘）字符串$html_str转换成‘UTF-8‘编码
2$html_str = mb_convert_encoding($html_str, ‘UTF-8‘, ‘ASCII,GB2312,GBK,UTF-8‘);
3 2：gbk To utf-8
4  < ?php 
5header("content-Type: text/html; charset=Utf-8"); 
6echo mb_convert_encoding("赵亚飞", "UTF-8", "GBK"); 
7  ?>

注意：使用上面的函数需要安装但是需要先enable mbstring 扩展库。在 php.ini里将; extension=php_mbstring.dll 前面的 ; 去掉

mb_convert_encoding 可以指定多种输入编码，它会根据内容自动识别，；执行效率比iconv差很多

3：iconv 转换编码

iconv函数库能够完成各种字符集间的转换，是php编程中不可缺少的基础函数库。

需要注意一下：

iconv在转换字符有时会出错，（如果将utf-8转换为gb2312时，可能会出现字符串被截断的情况发生。）

解决方法：在需要转成的编码后加 "//IGNORE" 是iconv函数第二个参数后。

如下：

                                                    1
                                                    iconv("UTF-8","GB2312//IGNORE",$data)

ignore意思是忽略转换时的错误，如果没有ignore参数，所有该字符后面的字符串都无法被保存（不往下进行转换）。

iconv不是php的默认函数，也不是默认安装的模块。需要安装才能用的。

这里有一个自动判断编码类型，进行转化的函数：

                             1
                            function check_encod($encod,$string){
 2//判断字符编码 3$encode = mb_detect_encoding($string, array("ASCII","UTF-8","GB2312","GBK","BIG5"));
 4var_dump($encode);
 5if($encode != $encod){
 6$string = iconv($encode, $encod, $string);
 7         }
 8return$string;
 9 }
10$path = "赵亚飞。.jpg";
11$path = check_encod("GB2312",$path);

五：字符串截取

1：mb_substr()

PHP substr()函数可分割文字，但分割的文字如果包括中文字符往往会遇到问题，这时可以用mb_substr()这个函数，用法与substr()相似，只是在mb_substr()最后要加入多一个参数，以设定字符串的编码，需要打开php_mbstring.dll，需要在php.ini中把php_mbstring.dll打开。例如：

                                    1
                                    echo mb_substr(‘赵亚飞赵亚飞er‘,0,9);         //输出：赵亚飞2echo mb_substr(‘赵亚飞赵亚飞er‘,0,9,‘utf-8‘); //输出：赵亚飞赵亚飞er

第一个是以三个字节为一个中文，这就是utf-8编码的特点，下面加上utf-8字符集说明，是以一个字为单位来截取的

2：iconv_substr()

Substr是截取字符的函数，但是很多时候，截取中文却需要额外处理，原因是中文在UTF-8中占用3个字节，在GB2312中占用2个字节，在截取中随时存在截取的字符串长度与组成未知，所以给很多人造成了困扰。PHP5开始，iconv_substr函数出现

                                        1 <?php
2$str=‘赵z亚y飞f/include‘;  
3echosubstr($str,1,5);
4echo "<br>";
5echoiconv_substr($str,1,5,"UTF-8");  
6 ?>

这个是在网页编码为UTF-8的PHP代码中使用的截取编码。如果在UTF-8网页中使用GB2312或者GBK编码来截取，会出错，占用字节不同；反之，在GB2312或GBK网页中，不能使用UTF-8来进行截取。由于iconv_substr是按照字符而非占用字节来计算，所以“a”和“叶”均计算为1位。在GB2312或者GBK中，由于占用字节是一样的，所以可以随意使用GB2312或GBK编码来截取，截取结果是一样的。

3：兼容性良好的截取字符串的函数

                                     1
                                    function msub_str($str, $start=0, $length, $charset="utf-8", $suffix=true){
 2if(function_exists("mb_substr"))
 3return mb_substr($str, $start, $length, $charset);
 4elseif(function_exists(‘iconv_substr‘)) {
 5returniconv_substr($str,$start,$length,$charset);
 6        }
 7$re[‘utf-8‘] = "/[/x01-/x7f]|[/xc2-/xdf][/x80-/xbf]|[/xe0-/xef][/x80-/xbf]{2}|[/xf0-/xff][/x80-/xbf]{3}/";
 8$re[‘gb2312‘] = "/[/x01-/x7f]|[/xb0-/xf7][/xa0-/xfe]/";
 9$re[‘gbk‘] = "/[/x01-/x7f]|[/x81-/xfe][/x40-/xfe]/";
10$re[‘big5‘] = "/[/x01-/x7f]|[/x81-/xfe]([/x40-/x7e]|/xa1-/xfe])/";
11preg_match_all($re[$charset], $str, $match);
12$slice = join("",array_slice($match[0], $start, $length));
13if($suffix) {
14return$slice."…";
15         }
16return$slice;
17  }

原文：http://www.cnblogs.com/zyf-zhaoyafei/p/4541182.html

内容总结

以上是互联网集市为您收集整理的php页面编码与字符操作全部内容，希望文章能够帮你解决php页面编码与字符操作所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1202403.html

来源：【匿名】

【上一篇】PHP之Trait详解【下一篇】PHP 5 数据对象 (PDO) 抽象层与 Oracle

更多 ►

【php页面编码与字符操作】教程文章相关的互联网学习教程文章

php页面编码与字符操作【代码】【图】

我们可以用header来定义一个php页面为utf编码或GBK编码，也可以在html中用meta标签来指定编码例如：php页面为utf编码 header("Content-type: text/html; charset=utf-8");我们通常使用header或meta，下面说一说两者的区别一、采用meta页面编码用meta来设置页面编码1<meta http-equiv="content-type" content="text/html; charset=编码类型"> 作用是：声明客户端的浏览器用什么字符集编码显示该页面，起到通知浏览器的作用。...

简单谈谈php中的unicode和utf8编码【代码】【图】

重新认识unicode和utf8编码直到今天，准确的说是刚才，我才知道UTF-8编码和Unicode编码是不一样的，是有区别的囧他们之间是有一定的联系的，看看他们的区别： UTF-8的长度是不一定的，有可能是1、2、3字节 Unicode长度一定，2个字节（USC-2） UTF-8可以和Unicode互相转换unicode和utf8的关系Unicode(16进制)UTF-8(二进制)0000 - 007F 0xxxxxxx 0080 - 07FF 110xxxxx 10xxxxxx 0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx上面的表格...

十步解决Php Utf-8编码（转贴）

php用UTF-8总结：1、php文件本身必须是UTF-8编码。不像Java会生成class文件，避免这个问题2、php要输出头：header(”Content-Type: text/html; charset=UTF-8″)3、meta标签无所谓，有header所有浏览器就会按header来解析4、所有外围都得用UTF8，包括数据库、*.js、*.css(CSS影响倒不大)5、php本身不是Unicode的，所有substr之类的函数得改成mb_substr（需要装mbstring扩展）；或者用iconv转码（基本上的linux都装了，没装的话down...

PHP base64编码后解码乱码的解决办法

在用PHP做东西的时候发现了一个问题，可以简单的归结为乱码的问题，但是这个问题不是函数本身造成的。来看看罪魁祸首是谁。嫌疑人：base64_encode 和 base64_decode罪行：我写了一个跳转和提示函数，接收提示信息后跳转到指定的页面，但是跳转提示时汉字乱码。跳转模版代码如下：复制代码代码如下: <!DOCTYPE html><html><head><meta charset="utf-8"><meta name="author" content="王健 wj@yurendu.com" /> <title>跳转提示</tit...

php 正确解码javascript中通过escape编码后的字符

这是很久以前收集的一个,不知道谁写的了,但经过测试没有问题~ JavaScript代码复制代码代码如下:function phpUnescape($escstr) { preg_match_all("/%u[0-9A-Za-z]{4}|%.{2}|[0-9a-zA-Z.+-_]+/", $escstr, $matches); $ar = &$matches[0]; $c = ""; foreach($ar as $val) { if (substr($val, 0, 1) != "%") { $c .= $val; } elseif (substr($val, 1, 1) != "u") { $x = hexdec(substr($val, 1, 2)); $c .= chr($x); } else { $val...

JS URL 编码 PHP 解码｛%u5F00%u53D1｝

这次第一次用smarttemplate这个模板，比smarty小巧了很多，但也有些不方便的地方。 smarty可以直接对url进行编码, 比如 但在smarttemplate里面就好像没有，由于链接是由js提交的，而不是表单提交，所以不能自动编码。解决办法：采用js对URL中的汉字进行escape编码。 <a href="" onclick="window.open(‘product_list.php?p_sort=‘+escape(‘PHP开发资源网‘));">这样点击链接后的效时：引用：http://12...

DEDE里有个编码问题，不支持PHP5.4及以上版本！

公司新配置服务器，没有PHP环境，下载了个PHP5.5.25，配置完毕后，从另外一个服务器转移了一个DEDECMS做的网站，安装后，进入后台，恢复数据发现参数设置里的文本框，只要是中文信息，没有显示，或者新添加的中文信息没有显示，查找原因，DEDE中有些字符串在经 htmlspecialchars 函数转义之前正常，而在转义之后却变成了空字符串。PHP 从 5.4.0 版本开始第三个参数字符串编码的默认值改成了 UTF-8，而DEDE代码中的中文编码正好是 G...

通过四种方式让PHP编码变得更轻松

通过四种方式让PHP编码变得更轻松　　尽管已经目前PHP语言已经建立起属于自己的软件文化，但要找到它令人抓狂的弊端也绝对不是难事。我们曾经在之前的文章中列出过该语言最让开发人员难以接受的十二大糟糕特性。　　不过在过去几年当中，PHP已经发生了一系列变动——从语言本身到相关生态系统再到对开发者社区的支持——这些确实值得我们加以关注。尽管已经抛弃了PHP并投身于Python或者Ruby的用户们不太可能在短时间内被吸引回来，...

PHP字符串——编码与转义

因为PHP程序经常与HTML页、Web地址(URL)以及数据库交互，所以PHP提供一些函数来帮助你处理这些类型的数据。HTML、Web页地址和数据库命令都是字符串，但是它们每个都要求不同的字符以不同的方法来转义。例如，在Web地址中一个空格被写成%20，而直接量小于符号(<)在HTML文档中必须写作&lt。PHP有许多内置函数来转换和取得这些编码。HTML：在HTML中特殊的字符以实体(entity)表示，如&和<。这里有两个PHP函数来把字符串中的特殊字符...

PHP 字符串编码的转换【代码】

原文链接:http://mangguo.org/php-string-encoding-convert-and-detect/GBK 和 UTF-8 编码的转换是一个非常恶心的事情，比如像 PHP 中的 json_encode 本身根本不支持 GBK 形式的编码。有两个库函数能够支持编码的转换，通常能够想到的就是 iconv 函数，使用起来也非常爽：iconv(‘GBK‘, ‘UTF-8//IGNORE‘, ‘芒果小站‘); // 将字符串由 GBK 编码转换为 UTF-8 编码但 iconv 只能解决编码预先知道的情况，如果字符串编码未知，则需...

php和js url编码传递转换

encodeURI() 函数可把字符串作为 URI 进行编码，字符将被十六进制的转义序列进行替换。decodeURI() 函数可对 encodeURI() 函数编码过的 URI 进行解码。js的encodeURI()后的字符一般为utf-8编码，如果服务器端编码为不同编码，则需要iconv转换。<?PHP$a = urlencode(iconv("gb2312", "UTF-8", "电影")); //等同于JavaScript encodeURI("电影");echo $a;//得到“%E7%94%B5%E5%BD%B1”;$b = iconv("utf-8","gb2312",urldecode("%E7%94...

PHP中对汉字进行UNICODE编码和解码的功能

<?php //将内容进行UNICODE编码，编码后的内容格式：\u56fe\u7247 （原始：图片） function unicode_encode($name) {$name = iconv(‘UTF-8‘, ‘UCS-2‘, $name);$len = strlen($name);$str = ‘‘;for ($i = 0; $i < $len - 1; $i = $i + 2){$c = $name[$i];$c2 = $name[$i + 1];if (ord($c) > 0){ // 两个字节的文字$str .= ‘\u‘.base_convert(ord($c), 10, 16).base_convert(ord($c2), 10, 16);}else{$str .= $c2;}}retur...

php&获取当前字符串的编码格式【代码】

如果不清楚字符串的编码格式的话，就可以像这样检查：? $out_string = mb_detect_encoding($string, array("ASCII", "UTF-8", "GB2312", "GBK", "BIG5")); echo $out_string;?这样就能知道它是什么编码的了。后续操作还可以为其转码：?if ($out_string == "UTF-8") { $string = iconv("UTF-8", "GBK", $string); }原文：http://blog.51cto.com/laok8/2132904

4项技巧使你不再为PHP中文编码苦恼

PHP程序设计中中文编码问题曾经困扰很多人，导致这个问题的原因其实很简单，每个国家(或区域)都规定了计算机信息交换用的字符编码集，如美国的扩展 ASCII 码，中国的 GB2312-80，日本的 JIS 等。作为该国家/区域内信息处理的基础，字符编码集起着统一编码的重要作用。字符编码集按长度分为 SBCS(单字节字符集)，DBCS(双字节字符集)两大类。早期的软件(尤其是操作系统)，为了解决本地字符信息的计算机处理，出现了各种本地化版本(L1...

PHP中ＧＤ２的运用，注意编码格式的改变，以及head()函数之前不能有任何html元素包括空格！！！【代码】

<?phpheader ( "Content-type: text/html; charset=utf-8" ); //设置文件编码格式header("Content-type: image/jpeg"); //告知浏览器所要输出图像的类型$img = imagecreate(100, 50); //创建画布$bg = imagecolorallocate($img, 255, 255, 255); //定义背景颜色$red = imagecolorallocate($img, 255, 0, 0); //设置字符串颜色$text="I like PHP";iconv("gbk","utf-8", $text);// 将GBK编码格式转换成UTF-8格式imag...

首页 / PHP / php页面编码与字符操作

php页面编码与字符操作

内容导读

内容图文

内容总结

内容备注

内容手机端

【php页面编码与字符操作】教程文章相关的互联网学习教程文章

php页面编码与字符操作【代码】【图】

简单谈谈php中的unicode和utf8编码【代码】【图】

十步解决Php Utf-8编码（转贴）

PHP base64编码后解码乱码的解决办法

php 正确解码javascript中通过escape编码后的字符

JS URL 编码 PHP 解码｛%u5F00%u53D1｝

DEDE里有个编码问题，不支持PHP5.4及以上版本！

通过四种方式让PHP编码变得更轻松

PHP字符串——编码与转义

PHP 字符串编码的转换【代码】

php和js url编码传递转换

PHP中对汉字进行UNICODE编码和解码的功能

php&获取当前字符串的编码格式【代码】

4项技巧使你不再为PHP中文编码苦恼

PHP中ＧＤ２的运用，注意编码格式的改变，以及head()函数之前不能有任何html元素包括空格！！！【代码】

编码 - 相关标签

字符 - 相关标签

PHP - 技术教程分类

PHP - 最新教程

PHP - 最热教程