首页 / PYTHON / python字符集的转换（mysql数据乱码的处理）

python字符集的转换（mysql数据乱码的处理）

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python字符集的转换（mysql数据乱码的处理），小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2954字，纯文字阅读大概需要5分钟。

内容图文

!/usr/bin/env python # _*_ encoding:utf-8 _*_ ‘‘‘ author: tiantiandas ‘‘‘ import sys reload(sys) sys.setdefaultencoding(‘gbk‘) import MySQLdb def Connect_Mysql(sql,host): db_info = {‘host‘: host, ‘user‘: ‘test‘, ‘db‘: ‘TestDB‘, ‘passwd‘: ‘dnstest‘, ‘charset‘:‘gbk‘} #很关键 try: connect = MySQLdb.connect(**db_info) cursor = connect.cursor() cursor.execute(sql) connect.commit() result = cursor.fetchone() return result except Exception as e: print e sys.exit(10) def main(): domain = sys.argv[1] query = ‘select Name,AdminDesc from EmailBox where Domain="{0}"‘.format(domain) try: Name, AdminDesc = Connect_Mysql(sql=query,host="host1") update = "update EmailBox set Name=‘{0}‘,AdminDesc=‘{1} where Domain=‘{2}‘".format(Name,AdminDesc) try: print update Connect_Mysql(sql=update,host=‘host2‘) except Exception as e: print e except Exception as e: print e if __name__ == ‘__main__‘: main()

几个关键点：

sys.setdefaultencoding(‘gbk‘) ：这段代码让从A库拉出的数据，python会将其解码为成gbk。（大概是这个意思）
mysql编码： charset:gbk ：这个调整让写入到库中的数据字符集为gbk

所以如果拉出的数据是为了自己看的时候，就不需要 sys.setdefaultencoding(‘gbk‘)这段代码了。

2.关于编码和解码

chardet模块

chardet是字符编码识别的模块，使用如下：

#!/usr/bin/env python
# _*_ encoding:utf-8 _*_
import chardet
  
a="天天"
print chardet.detect(a)

结果：
{‘confidence‘: 0.75249999999999995, ‘encoding‘: ‘utf-8‘}

如果要对一个大文件进行编码识别，如下的方法，可以提高识别速度：（相比第一种，这种确实会快一些）

import urllib
from chardet.universaldetector import UniversalDetector
usock = urllib.urlopen(‘http://www.baidu.com/‘)
#创建一个检测对象
detector = UniversalDetector()
for line in usock.readlines():
    #分块进行测试，直到达到阈值
    detector.feed(line)
    if detector.done: break
#关闭检测对象
detector.close()
usock.close()
#输出检测结果
print detector.result

运行结果：
{‘confidence‘: 0.99, ‘encoding‘: ‘GB2312‘}

有了chardet模块，就可以识别获取数据的字符集格式，之后就可以将数据转换为想要的字符集格式了。

两个函数：
- decode：可以将数据解码为想要的字符集格式
- encode：可以将数据编码为想要的字符集格式
- python识别的是unicode，所以是用decode现将数据转换为unicode，之后再用encode将数据转换为想要的字符集。
测试代码：

>>> name="天天"
>>> name 
‘\xe5\xa4\xa9\xe5\xa4\xa9‘  #天天 汉字的gbk码

>>> b=name.decode(‘gbk‘)   
>>> b
u‘\u6fb6\u2541\u3049‘

>>> c=b.encode(‘utf8‘)
>>> c
‘\xe6\xbe\xb6\xe2\x95\x81\xe3\x81\x89‘

——————————————————————————

>>> ‘\xcc\xec\xcc\xec‘.decode(‘gbk‘)
u‘\u5929\u5929‘
>>> ‘\xcc\xec\xcc\xec‘.decode(‘gbk‘).encode(‘utf8‘)
‘\xe5\xa4\xa9\xe5\xa4\xa9‘
>>> ‘天天‘
‘\xe5\xa4\xa9\xe5\xa4\xa9‘

python字符集的转换（mysql数据乱码的处理） - 文章图片

python字符集的转换（mysql数据乱码的处理）

标签：乱码问题 passwd 数据转换 try 提高 pen bsp pre admin

本文系统来源：http://www.cnblogs.com/tiantiandas/p/python-charset.html

内容总结

以上是互联网集市为您收集整理的python字符集的转换（mysql数据乱码的处理）全部内容，希望文章能够帮你解决python字符集的转换（mysql数据乱码的处理）所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/473284.html

来源：【匿名】

【上一篇】python操作轻量级数据库【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python字符集的转换（mysql数据乱码的处理）】教程文章相关的互联网学习教程文章

python抓取网页时字符集转换问题处理方案分享

问题提出：有时候我们采集网页，处理完毕后将字符串保存到文件或者写入数据库，这时候需要制定字符串的编码，如果采集网页的编码是gb2312，而我们的数据库是utf-8的，这样不做任何处理直接插入数据库可能会乱码(没测试过，不知道数据库会不会自动转码)，我们需要手动将gb2312转换成utf-8。首先我们知道，python里的字符默认是ascii码，英文当然没问题啦，碰到中文的时候立马给跪。不知道你还记不记得，python里打印中文汉字的时候...

python字符集的转换（mysql数据乱码的处理）【代码】

python mysql设置当前连接默认的字符集

‘utf8‘) #连接时设置 ‘‘‘ set the default character set for the current connection character_set_client character_set_results ‘‘‘ cursor = db.cursor(cursorclass = MySQLdb.cursors.DictCursor) cursor.execute(‘SET NAMES utf8;‘) #使用游标设置最终导致的结果是: current connection character_set_client character_set_results 统统都是utf8 python mysql设置当前连接默认的字符集标签：log dict ra...

Python数据库操作 Mysql数据库表引擎与字符集#学习猿地

# Mysql数据库表引擎与字符集 ![](./imgs/752951346A5F4E7EBDE362FA97107707.png) ### 1.服务器处理客户端请求其实不论客户端进程和服务器进程是采用哪种方式进行通信，最后实现的效果都是：**客户端进程向服务器进程发送一段文本（MySQL语句），服务器进程处理后再向客户端进程发送一段文本（处理结果）。**那服务器进程对客户端进程发送的请求做了什么处理，才能产生最后的处理结果呢？客户端可以向服务器发送增删改查各类请求，...

MySQLSchema设计（五）用Python管理字符集_MySQL

pythonbitsCN.com一提字符集，可能有人会说，不管天崩地裂，全用utf8，整个世界都清净了。但某些字符集是需要更多CPU、消费更多的内存和磁盘空间、甚至影响索引使用，这还不包括令人蛋碎的乱码。可见、我们还是有必要花点时间略懂下MySQL字符集。# 囊括三个层级：DB、Table、Column mysql> create database d charset utf8; Query OK, 1 row affected (0.04 sec) mysql> create table d.t -> (str varchar(10) charset latin1) ->...

python 第12课字符串 Unicode字符集三种创建字符串方式 len()【图】

快速Python正则表达式问题：匹配否定字符集【代码】

我想查找与特定字符序列不匹配的字符串.例如：就像是REGEX = r'[^XY]*'我想寻找的字符串除了X和Y彼此相邻外,还要包含任意数量的字符…上面的REGEX不起作用,因为它分别阻止了X和Y.解决方法:怎么样：if "XY" not in s:print "matched" elseprint "not matched"还是将其包含在更长的正则表达式中？然后,也许您想要一个否定的超前表达：REGEXP="...(?!XY)..."编辑：固定错别字

你如何在Python中解码多个和未知的字符集？【代码】

我做了很多文本解析,但似乎总是遇到解码问题.通常,我只是通过以下方式查找编码：$file -i filename.txt filename.txt: text/x-diff; charset=utf-8然后,通过我的读取行指定它(此处使用io显示). io.open(filename.txt,’r’,encoding =’utf-8′) 但是,每当我遇到新的文件编码时,我得到： UnicodeDecodeError：’utf8’编解码器无法解码位置0中的字节0x0a：截断数据’ 我必须重复手动检测和设置新编码的过程.有没有更好的方法来解析...

Python（二）学习笔记||一、字符集和编码

1. 计算机存的是二进制，我们平时使用的汉字都不是二进制，存在计算机里用的是字符编码。 2. 字符集就是一套文字符号及其编码的描述。字符集有很多种。 3. 概念：A. 位：计算机中的最小单位，二进制中的一位，用0/1表示。（比特）B. 字节：八位组成一个字节。（一个汉字可以是两个或三个字节）C. 字符：我们肉眼可见的文字或符号。（一个汉字是一个字符，一个英文字母是一个字符）D. 字符集：字符的集合。E. 编码：将字符转换成计算...

python数据类型&字符集&字符格式化&循环&input&判断【代码】

# 计算机只认识二进制 # 编译型语言编译成二进制文件。 C C++ C# # 解释型语言运行的时候才编译# python php shell ruby js java # 脚本语言# 这个语言只有单一的功能# shell 只能在linux下运行 # 字符集：# ascii表能识别字符字母 128个不认识汉字等 # gbk收录了所有汉字# Unicode 收录全世界所有文字优化版 utf-8 # 静态语言先定义类型 int string 如java# 动态语言直接使用如python # python3字符集是un...

【Python3爬虫】猫眼电影爬虫（破解字符集反爬）【代码】【图】

一、页面分析首先打开猫眼电影，然后点击一个正在热播的电影（比如：毒液）。打开开发者工具，点击左上角的箭头，然后用鼠标点击网页上的票价，可以看到源码中显示的不是数字，而是某些根本看不懂的字符，这是因为使用了font-face定义字符集，并通过unicode去映射展示，所以我们在网页上看到的是数字，但是在源码中看到的却是别的字符。碰到这些根本看不懂的字符怎么办呢？不慌，右键选择查看网页源代码，然后找到相应的位置（如下...

Python数据库操作 Mysql数据库表引擎与字符集#学习猿地

“无法使用Windows mysql-python初始化字符集utf8mb4”【代码】

我收到一个错误尝试连接到远程mysql数据库Windows 7客户端通过python 2.7 MySQLdb 1.2.5 sqlalchemy 1.0.9.这是最近将服务器的默认字符集更改为utf8mb4的结果.服务器正在运行MySQL 5.5.50. 我这样连接：DB_ENGINE = sqlalchemy.create_engine("mysql+mysqldb://{user}:{pass}@{host}:{port}/{database}?charset=utf8mb4".format(**DB_SETTINGS)) Session = sqlalchemy.orm.sessionmaker(bind=DB_ENGINE)错误是：File "C:\Applicati...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python字符集的转换（mysql数据乱码的处理）

python字符集的转换（mysql数据乱码的处理）

内容导读

内容图文

内容总结

内容备注

内容手机端

【python字符集的转换（mysql数据乱码的处理）】教程文章相关的互联网学习教程文章

python抓取网页时字符集转换问题处理方案分享

python字符集的转换（mysql数据乱码的处理）【代码】

python mysql设置当前连接默认的字符集

Python数据库操作 Mysql数据库表引擎与字符集#学习猿地

MySQLSchema设计（五）用Python管理字符集_MySQL

python 第12课字符串 Unicode字符集三种创建字符串方式 len()【图】

快速Python正则表达式问题：匹配否定字符集【代码】

你如何在Python中解码多个和未知的字符集？【代码】

Python（二）学习笔记||一、字符集和编码

python数据类型&字符集&字符格式化&循环&input&判断【代码】

【Python3爬虫】猫眼电影爬虫（破解字符集反爬）【代码】【图】

Python数据库操作 Mysql数据库表引擎与字符集#学习猿地

“无法使用Windows mysql-python初始化字符集utf8mb4”【代码】

PYTHON - 相关标签

MYSQL - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程