2020-07-15 字符编码与文件处理

字符编码

什么是字符编码

字符编码就是将人类的字符与计算机二进制数字之间的一一对应关系。

目前有的字符编码表主要有:

ASCII码表:是英文字符数字与计算机二进制之间的对应关系 一个英文字符 占一个字节(bytes)8个bit

Unicode(万国编码):是目前计算机内存的字符编码表,包含了所有国家字符与计算机二进制数字之间的对应关系。一个英文字符占一个字节(1ytes=8bit)一个中文字符占2个字节(2bytes=16bit)

Utf-8:在硬盘中,可以识别所有国家的字符并将其以utf-8的编码格式储存。注意:utf-8也只是一种编码格式,并不能识别其他编码表编码出来的计算机二进制数字。

GBK:用16位二进制数字组成  一个中文字符相当于2个字节。一个英文字符相当于一个字节

shift-jis:

Euc-kr:

为何会出现乱码(保证同存同取)

出现乱码最主要的原因就是存取文件时所用的字符编码表不一致。所以出现乱码主要有以下三种情况:

存乱了:在存文件时将A国的字符用B国的字符编码表进行与计算机二进制之间的转换,B国的编码表不认识A国的字符,找不到与计算机二进制之间的对应关系,只能出现报错或者乱存,一般都会选择乱存,所以当文件出现存乱了的情况时,没有方法补救。

解决方法:只能预防,在存文件时选择Utf-8编码格式进行存取

取乱了:在读取文件时,没有选择文件存时的字符编码格式 读取,读文件的编码格式并不认识文件中的二进制编码,所以会出现乱码。

解决方法:必须知道该文件是以什么编码格式存的,不然无法正常打开文件(同存同取)

在程序运行时也会出现乱码:为保证在程序运行的前2个阶段不乱码,在文件开头加上#coding=‘文件是以什么编码格式存的‘

第三种:现在没怎么理解不会表达

什么是编码与解码?

编码:由字符串转换成内存中的Unicode的过程,或由Unicode转换成其他编码的过程  encode

解码:由Unicode转换成字符串的过程,或由其他编码转换成unico的过程         decode

注意:内存会将unico编码的字符串二进制直接解码成字符串,而其他编码格式的字符串二进制,则不会将其解码成字符串打印出来,除非将其转换成Unicode的字符串二进制,才会将其解码成字符串打印出来,否则打印出来是一堆二进制数字。


                                    文件处理

文件是操作系统给我们的一个虚拟概念

为何要用文件?  存取硬盘必须要用文件存取

当我们打开一个文件,就获得了一个文件对象/文件句柄======》相当于一个遥控器

当我们想对文件进行操作时只要控制文件对象/文件句柄,向操作系统发送命令,操作系统再控制硬盘完成我们想要进行的操作。

目前对文件进行操作的方式主要有   r w   a          

r:读操作

w:写操作

a:追加写操作

打开文件的模式主要有 t   b  ,不能单独使用必须与r  w  a 联合使用。

t 主要是打开文本文件,需要指定文件路径,文件操作方式,文件解码方式 一般为 encoding=’utf-8'  在读取文件时会自动解码成字符串显示出来。

b模式可以操作任意文件类型,也需要指定文件路径,文件操作路径,但是由于只有字符串才有编码表,所以b模式打开的文件不需要指定解码方式,直接将文件内的二进制读取到内存,并且Unicode也无法识别,只能将取出来的二进制数字发送给用户。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,695评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,569评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,130评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,648评论 1 297
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,655评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,268评论 1 309
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,835评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,740评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,286评论 1 318
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,375评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,505评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,185评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,873评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,357评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,466评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,921评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,515评论 2 359