（自用）Python Log2 数据类型、字符编码、格式化

数据类型

1、整数

十六进制可以使用0x＋数字0-9（字母a-f）。

2、浮点数

一般使用科学计数法，用e代替10，比如1.2e5，为1.2×10^5。

3、字符串

可以使用单引号' '，或者双引号" "，其中的内容为字符串。

若同时包含单引号或者双引号，可以用“\”，进行转义。

\n 表示换行

\t 表示制表符

\\ 表示\，只不过\也使用了转义

※ 还可以使用r‘ ’，来表示引号内的内容不转义

>>> print('\\\t\\')

\ \

>>> print(r'\\\t\\')

\\\t\\

※ 还可以使用“ '''...''' ”，来表示\n的内容，“>>>”会被替换成“...”，即“...”不是编写的内容

>>> print('''line1... line2... line3''')

line1

line2

line3

如果写成程序，存为.py文件，便：

4、布尔值

一个布尔值有True和False两种值，在Python中，可以直接使用两种值来表示布尔值，但是要注意大小写。布尔值还可以用and、or和not。

and运算是与运算；or为或运算；not是非运算，也是单目运算符。布尔值常用在条件判断中，

5、空值（None）

空值是Python中一个特殊的值，用None表示，但是不等于0，因为0是有意义的，None只是一个特殊的空值。

6、变量

这种变量本身类型不固定的语言称之为动态语言，与之对应的是静态语言。静态语言在定义变量时必须指定变量类型，如果赋值的时候类型不匹配，就会报错。与静态语言相比，动态语言更加灵活。

>>>a = 'ABC'

实际上此时Python的解释器做了两件事情，

①在内存中创建了一个‘ABC’的字符串。

②在内存中创建了一个名为a的变量，并把它指向‘ABC’。

也可以把一个变量a赋值给另一个变量b，这个操作实际上是把变量b指向变量a所指向的数据。

7、常量

在Python中，通常用全部大写的变量名表示常量，比如用PI表示π。但事实上PI仍然是一个变量，Python根本就没有任何机制保证PI不会被改变，所以如果非要想改变也可以。

除法：

在Python中，有两种除法，一种为“/”，计算的结果是浮点数，即使恰好整除，结果也是浮点数；另一种为“//”，称为地板除，两个整数的除法仍然是整数，整数的地板除//永远是整数，即使除不尽，要做精确的除法，使用“/”就可以。因为“//”除法只取结果的整数部分，所以Python中还提供一个余数运算，可以得到两个整数相除的余数，为“%”。

※注：

Python中的整数没有大小限制，而某些语言的整数根据其存储长度是有大小限制的，例如Java对32位整数的范围限制在-2147483648-2147483647。而且Python的浮点数也没有大小限制，但是超出一定范围就直接表示为inf（无限大）。

字符编码

由于计算机是美国人发明的，因此，最早只有127个字符被编码到计算机里，也就是大小写英文字母、数字和一些符号，这个编码表被称为ASCII编码，比如大写字母A的编码是65，小写字母z的编码是122。但是由于各个国家的需要，许多国家都编了一套字符编码规则，其中中国制定了GB2312编码。因此，Unicode应运而生。Unicode把所有语言都统一到一套编码里，这样就不会再有乱码问题了。

Unicode标准也在不断发展，但最常用的是用两个字节表示一个字符（如果要用到非常偏僻的字符，就需要4个字节）。现代操作系统和大多数编程语言都直接支持Unicode。

现在ASCII编码和Unicode编码的区别：ASCII编码是1个字节，而Unicode编码通常是2个字节。比如，如果把ASCII编码的A用Unicode编码，只需要在前面补0就可以实现。但是，这样都用英文进行文本，虽然确实是消除了乱码的问题，但是用Unicode编码要比用ASCII编码要多占一倍的存储空间。

又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间。

由表可知，UTF-8编码有一个别的好处，ASCII编码实际上可以被看成是UTF-8编码的一部分，所以大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

在最新的Python 3版本中，字符串是以Unicode编码的，也就是说，Python的字符串支持多语言，比如可以同时用中文和英文。

由于Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes。

Python对bytes类型的数据用带b前缀的单引号或双引号表示：

>>>x = b'ABC'

‘ABC’与b‘ABC’不同，前者是str，后者虽然显示的内容和前者一样。但是每个字符只占用一个字节。

以Unicode表示的str通过encode()方法可以编码为指定的bytes，

相反，可以用decod（）函数，把bytes转换成str。但是如果其中含有无法解码的字节，就会报错。如果其中只有小部分无效的字节，可以通过输入error='ignore'忽略错误的字节。

可以用len（）函数，计算str的字符数，如果是byte，就会计算字节数。

一般来说，一个中文字符占3个字节，一个英文字符占1个。

在操作字符串的时候，经常会遇到str和bytes互换，为了避免乱码，应该使用UTF-8编码进行转换。

由于Python源代码也是一个文本文件，所以当其中包含中文的时候，在保存源代码时，就要保存为UTF-8编码。

当Python解释器读取源代码时，为了让它按UTF-8编码读取，通常在文件开头写上这两行：

#!/usr/bin/env python3

# -*- coding: utf-8 -*-

①第一行是告诉Linux/OS X，这是一个Python可执行程序，Windows会忽略；

②第二行是告诉Python解释器，按照UTF-8编码读取源代码，否则，在源代码中写的中文输出可能会有乱码。

申明了UTF-8编码并不代表.py文件就是UTF-8编码的，还要必须确定文本编辑器正在使用UTF-8 without BOM

使用Notepad++中的设置进行更改，选择UTF-8 without BOM

格式化

Python中格式化方式与C语言一致，用%符。

一般%s万金油，啥时候都可以使用，可以把任何数据类型，转换成字符串

用“%%”来转义%，表示一个%

最后编辑于：2019.11.06 18:52:49

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,277评论 6赞 503
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,689评论 3赞 393
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,624评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,356评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,402评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,292评论 1赞 301
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,135评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,992评论 0赞 275
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,429评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,636评论 3赞 334
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,785评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,492评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,092评论 3赞 328
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,723评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,858评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,891评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,713评论 2赞 354

（自用）Python Log2 数据类型、字符编码、格式化

数据类型

1、整数

十六进制可以使用0x＋数字0-9（字母a-f）。

2、浮点数

一般使用科学计数法，用e代替10，比如1.2e5，为1.2×10^5。

3、字符串

可以使用单引号' '，或者双引号" "，其中的内容为字符串。

若同时包含单引号或者双引号，可以用“\”，进行转义。

\n 表示换行

\t 表示制表符

\\ 表示\，只不过\也使用了转义

※ 还可以使用r‘ ’，来表示引号内的内容不转义

※ 还可以使用“ '''...''' ”，来表示\n的内容，“>>>”会被替换成“...”，即“...”不是编写的内容

如果写成程序，存为.py文件，便：

4、布尔值

一个布尔值有True和False两种值，在Python中，可以直接使用两种值来表示布尔值，但是要注意大小写。布尔值还可以用and、or和not。

and运算是与运算；or为或运算；not是非运算，也是单目运算符。布尔值常用在条件判断中，

5、空值（None）

空值是Python中一个特殊的值，用None表示，但是不等于0，因为0是有意义的，None只是一个特殊的空值。

6、变量

这种变量本身类型不固定的语言称之为动态语言，与之对应的是静态语言。静态语言在定义变量时必须指定变量类型，如果赋值的时候类型不匹配，就会报错。与静态语言相比，动态语言更加灵活。

实际上此时Python的解释器做了两件事情，

①在内存中创建了一个‘ABC’的字符串。

②在内存中创建了一个名为a的变量，并把它指向‘ABC’。

也可以把一个变量a赋值给另一个变量b，这个操作实际上是把变量b指向变量a所指向的数据。

7、常量

在Python中，通常用全部大写的变量名表示常量，比如用PI表示π。但事实上PI仍然是一个变量，Python根本就没有任何机制保证PI不会被改变， 所以如果非要想改变也可以。

除法：

※注：

Python中的整数没有大小限制，而某些语言的整数根据其存储长度是有大小限制的，例如Java对32位整数的范围限制在-2147483648-2147483647。而且Python的浮点数也没有大小限制，但是超出一定范围就直接表示为inf（无限大）。

字符编码

Unicode标准也在不断发展，但最常用的是用两个字节表示一个字符（如果要用到非常偏僻的字符，就需要4个字节）。现代操作系统和大多数编程语言都直接支持Unicode。

由表可知，UTF-8编码有一个别的好处，ASCII编码实际上可以被看成是UTF-8编码的一部分，所以大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

在最新的Python 3版本中，字符串是以Unicode编码的，也就是说，Python的字符串支持多语言，比如可以同时用中文和英文。

由于Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes。

Python对bytes类型的数据用带b前缀的单引号或双引号表示：

‘ABC’与b‘ABC’不同，前者是str，后者虽然显示的内容和前者一样。但是每个字符只占用一个字节。

以Unicode表示的str通过encode()方法可以编码为指定的bytes，

相反，可以用decod（）函数，把bytes转换成str。但是如果其中含有无法解码的字节，就会报错。如果其中只有小部分无效的字节，可以通过输入error='ignore'忽略错误的字节。

可以用len（）函数，计算str的字符数，如果是byte，就会计算字节数。

一般来说，一个中文字符占3个字节，一个英文字符占1个。

在操作字符串的时候，经常会遇到str和bytes互换，为了避免乱码，应该使用UTF-8编码进行转换。

由于Python源代码也是一个文本文件，所以当其中包含中文的时候，在保存源代码时，就要保存为UTF-8编码。

当Python解释器读取源代码时，为了让它按UTF-8编码读取，通常在文件开头写上这两行：

①第一行是告诉Linux/OS X，这是一个Python可执行程序，Windows会忽略；

②第二行是告诉Python解释器，按照UTF-8编码读取源代码，否则，在源代码中写的中文输出可能会有乱码。

申明了UTF-8编码并不代表.py文件就是UTF-8编码的，还要必须确定文本编辑器 正在使用UTF-8 without BOM

格式化

Python中格式化方式与C语言一致，用%符。

用“%%”来转义%，表示一个%

推荐阅读更多精彩内容

在Python中，通常用全部大写的变量名表示常量，比如用PI表示π。但事实上PI仍然是一个变量，Python根本就没有任何机制保证PI不会被改变，所以如果非要想改变也可以。

申明了UTF-8编码并不代表.py文件就是UTF-8编码的，还要必须确定文本编辑器正在使用UTF-8 without BOM