字符编码:
8bit = 8位=8比特
8比特(Bit)= 1字节(Byte)=1B
1字(Word)=2字节(Byte)=16位(Bit)
1KB(千字节)=1024B
1MB(兆字节)=1024KB
1GB(吉字节)=1024MB
1TB(太字节)=1024GB
1字节能表示的最大整数是255
ASCII编码:最早只有127个字母被编码到计算机里,也就是大小写英文字母、数字和一些符号的编码表。
中文编码:GB2312
日文编码:Shift_JIS
韩文编码:Euc-kr
Unicode标准:Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
Unicode弊端:用Unicode编码比ASCII编码需要多一倍的存储空间,在存储和传输上就十分不划算。
UTF-8:“可变长编码”,UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。
对于单个字符的编码,Python提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符:
ord('字符串') >>> 输出整数表示
chr(整数编码) >>> 字符串
写一个python文件的时候,顶部加的两串注释的含义:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;
第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可能会有乱码。
格式化:
格式化字符串的符号:%
在字符串内部,%s表示用字符串替换,%d表示用整数替换,有几个%?占位符,后面就跟几个变量或者值,顺序要对应好。如果只有一个%?,括号可以省略。
语法:'Hi, %s, you have $%d.' % ('Michael', 1000000)
常见占位符:
%和str.fomat()的区别:
用{}代替占位符%
(1)通过位置映射
(2)通过关键字参数
(3)通过对象属性:
(4)通过下标:
(5)格式限定符:语法:{}中带: 如
i、填充与对齐:
^、<、>分别是居中、左对齐、右对齐,后面带宽度
:号后面带填充的字符
ii、精度与类型:
iii、其他类型:主要就是进制了,b、d、o、x分别是二进制、十进制、八进制、十六进制