Python字符串

>>> print('包含中文的str')
包含中文的str
>>> ord('A')
65
>>> ord('中')
20013
>>> chr(66)
'B'
>>> chr(25991)
'文'
>>> '\u4e2d\u6587'
'中文' #两种写法完全等价
>>> 'ABC'.encode('ascii') 
b'ABC' 
>>> '中文'.encode('utf-8') 
b'\xe4\xb8\xad\xe6\x96\x87'
>>> b'ABC'.decode('ascii') 
'ABC' 
>>> b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
 '中文' 

>>> len('ABC') 
3 #含多少字符
>>> len(b'ABC') 
3 
>>> len(b'\xe4\xb8\xad\xe6\x96\x87') 
6 
>>> len('中文'.encode('utf-8')) 
6 

由于 Python 源代码也是一个文本文件,所以,当你的源代码中包含中
文的时候,在保存源代码时,就需要务必指定保存为 UTF-8 编码。当
Python 解释器读取源代码时,为了让它按 UTF-8 编码读取,我们通常
在文件开头写上这两行:

!/usr/bin/env python3 # -- coding: utf-8 --

第一行注释是为了告诉 Linux/OS X 系统,这是一个 Python 可执行程序,
Windows 系统会忽略这个注释;
Python3 基础教程【完整版】 http://www.yeayee.com/
50/531
第二行注释是为了告诉 Python 解释器,按照 UTF-8 编码读取源代码,
否则,你在源代码中写的中文输出可能会有乱码。
申明了 UTF-8 编码并不意味着你的.py 文件就是 UTF-8 编码的,必须并
且要确保文本编辑器正在使用 UTF-8 without BOM 编码:

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • find():检测字符串中是否包含字符或子字符串,未查找到子字符串返回-1str.find(str, beg=0,...
    JeremyL阅读 13,174评论 3 1
  • 反斜线“\”符号在Python中有什么特别 在Python中,反斜线“\”符号代表转义符,在实际使用过程中要求\后...
    无聊的IT阅读 6,187评论 4 3
  • 整个大学生涯的落幕,应该算是从毕业答辩讲台上走下来的那一刻开始结束的,十分钟,讲完了整个大学四年的时光,缺不知道,...
    流苏向南阅读 303评论 0 0
  • 系统化学习,知其然,知其所以然 动画在用户界面的不同状态之间提供流畅的视觉转换。 在iOS中,动画广泛用于重新定位...
    好_快阅读 140评论 0 0
  • 徒步走来了 来自草海之夜的 我 光着脚,赤着身子 嘴脸一直在麻木 从湖底到岸边 从家乡到远方 从远方到更远的地方 ...
    肖念峰阅读 430评论 3 9