2024-06-07_python编码、单一字符转换数字、输出所有汉字

1. 单一字符和数字的转换

  • 事实上是单一字符和单一字符对应的编码之间的转换。
  • 如下2个函数接收的是单一字符,即character,如果长度超过1就会报错。
  • python怎么知道单一字符要转换为什么数字呢?这个涉及到编码的概念了。
  • ord()函数、chr()函数没办法指定编码方式,猜测默认是unicode编码
ord()函数:查看单一字符对应的编码(一个数字)
chr()函数:将编码(一个数字)处理成对应的单一字符

2. 中文unicode编码

  • 汉字的unicode范围主要是4E00到9FA5的范围,这一范围包括最常用的20902个普通汉字
  • 除了普通汉字外,还有另外的汉字,如汉语外来词汇、单字拼音、方言词汇、书面语等,这些汉字的unicode范围是从3400到4DB5,一共有7586个汉字。
  • 在中文unicode范围内,还包括数字和标点符号,他们的unicode范围是从0030到0039,从FF10到FF19,从3000到303F,从FE10到FE1F,一共有45个标点符号,其中一些是用于表示注音符,一些是用于表示拼音符,一些是用于表示社会文化文学中的符号,这些标点符号的作用是形成自己的独立的语系。

3.输出全部汉字

for j in range(0x4e00, 0x9fA5 + 1):
    print(chr(j), end='')
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容