python 编码相关问题

python 默认编码格式是ASCII 所以一般对中文编码会产生问题,这就需要有一套专门的编码方法来处理!

encode(params)就是处理编码的方法,像汉字这些编码肯定不会被ASCII支持,这就需要在输出python的文件之前把文件内容编码一下,编码成想要的内容然后输出到目的文件,相反,当从目标文件读取数据时候也要相应的根据目标文件的编码内容来解码decode(params),python 会把对应的内容转为python 需要的格式ASCII.

所以在处理python编码问题上就保持 “一进一出原则”(自己突发奇想出来的词汇)   一进的内容根据内容的编码格式转为python 内部格式(就是decode(params)),一出的内容就根据目标需要的编码格式来编码 encode(params)

Params 参数就是编码和解码的具体格式  可以是’utf-8’ ,’gbk’ 等格式

附上一个简单的小列子 可以在  git 上下载运行。

下面是代码例子,不要Control -c + Control +v ,可能运行报错,因为格式对齐肯定有问题,毕竟不是专业的编辑工具,需要自行调整

#! /usr/bin/env python

# -*- coding:UTF-8 -*-

'test Chinese character encoding'

CODEC ='utf-8'

FILE ='unicode.txt'

defwriteToFile(params):

str = params

outPutStr = str.encode(CODEC)

f = open(FILE,'w')

f.write(outPutStr)

f.close()

defreadFromFile():

f = open(FILE,'r')

inOutStr = f.read()

f.close()

str = inOutStr.decode(CODEC)

printstr

if__name__ =='__main__':

writeToFile(u'中华人民共和国')

readFromFile()

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 字符集和编码简介 在编程中常常可以见到各种字符集和编码,包括ASCII,MBCS,Unicode等字符集。确切的说...
    兰山小亭阅读 12,884评论 0 13
  • 可以看我的博客 lmwen.top 或者订阅我的公众号 简介有稍微接触python的人就会知道,python中...
    ayuLiao阅读 8,465评论 1 5
  • 几个基本概念 bit二进制位, 是计算机内部数据储存的最小单位,11010100是一个8位二进制数。一个二进制位只...
    西电大侠阅读 8,934评论 1 8
  • 个人笔记,方便自己查阅使用 Py.LangSpec.Contents Refs Built-in Closure ...
    freenik阅读 67,841评论 0 5
  • http://python.jobbole.com/85231/ 关于专业技能写完项目接着写写一名3年工作经验的J...
    燕京博士阅读 12,233评论 1 118

友情链接更多精彩内容