python编码问题

"信阳"
str --- gbk --- \xe4\xbf\xa1\xe9\x98\xb3
unicode --- unicode --- \u6dc7\uffe0\u69fc
utf-8 --- utf-8 --- \xe6\xb7\x87\xef\xbf\xa0\xe6\xa7\xbc

一般,赋值时默认的是 str类型
第一个print是汉字,另外两个是乱码

print(a)
信阳
print(b)
淇¢槼
print(c)
淇¢槼

UTF-88-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一种前缀码。它可以用來表示Unicode標準中的任何字元

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 几个基本概念 bit二进制位, 是计算机内部数据储存的最小单位,11010100是一个8位二进制数。一个二进制位只...
    西电大侠阅读 3,590评论 1 8
  • 什么是编码 任何一种语言、文字、符号等等,计算都是将其以一种类似字典的形式存起来的,比如最早的计算机系统将英文文字...
    随风化作雨阅读 1,567评论 1 2
  • 继上一篇文章字符集和编码详解总结了常见字符编码后,这篇文章会对python中常见的编码问题进行分析和总结。由于py...
    __七把刀__阅读 2,911评论 0 6
  • 阅读python源代码的时候不难发现许多文件开头都有这样一行内容: 如果想在python中使用中文,这样的一行声明...
    Fengya阅读 781评论 0 50
  • 在把网页源代码爬下来之后,出现了一个问题 源代码中的中文字符全部变成“???”问号(黑人问号脸.jpg) pych...
    陈钟南阅读 183评论 0 0