一、源文件开头指定文件编码
# coding=utf-8
二、载入sys
import sys
reload(sys)
sys.setdefaultencoding('utf8')
三、数据库连接时设置编码格式
PooledDB(MySQLdb,
host=config.MYSQL_HOST,
user=config.MYSQL_USER,
passwd=config.MYSQL_PASSWD,
db=config.MYSQL_DB,
port=config.MYSQL_PORT,
charset='utf8')
四、解析数据后写入文件前执行编码
row[4].encode('utf-8')
注意要把单条记录需要编码的中文字段值单独编码,不能把整条记录都编码,否则中文仍为乱码。

本文介绍了在Python中如何正确地设置编码以确保中文字符能够被正确处理。内容包括:源文件编码声明、使用sys模块设置默认编码、数据库连接时指定字符集、以及在处理数据时进行编码转换等关键步骤。
778

被折叠的 条评论
为什么被折叠?



