前端系统班 - 02. 计算机是如何存储数据的

课程 01:

编程基础:

首先成为程序员,再成为前端开发工程师。而一个程序员需要知道:

  • 硬件与软件:计算机的运行原理;(荐书《编码》)
  • 最大的软件:操作系统;
  • 自己写软件:数据结构和算法;(荐书《数据结构与算法结构》)
  • 多人写软件:软件工程。(荐书《代码大全》)

前端为什么学编程基础?——防止成为井底之蛙

计算机存储汉字的过程:

  1. 内存内部的电容通过充电与否来存储 0 和 1,存储 1 就充电,存储 0 就不充电;而读取时,电量大于 50% 就识别为 1,电量小于 50% 就识别为 0;这样便实现了二进制数的存储。


    RAM 存储 0 和 1 的过程
  2. 通过十进制和二进制之间的转换,计算机便可以只用二进制数 0 和 1 来存储十进制数;为了方便书写,一般会将二进制数写为十六进制数,因为单个十六进制数正好可以存 4 位二进制数。(扩展:负数使用补码形式存储,小数使用浮点数形式存储。
  3. 用数字可以为字符编号,于是出现了字符集,例如 ASCII(美国信息交换标准代码);按照这个标准,如果要存储字母 a,那么就存储十进制数 97 对应的二进制数 0110 0001(十六进制数为 61)。
  4. 既然可以存储字符,那么汉字也不是问题,扩充字符集就可以了,将每个汉字对应不同的编号。例如最早的汉字字符集 GB2312 (中国国家标准简体中文字符集),和一度被广泛使用的微软推出的 GBK 字符集。
  5. 为了统一存储世界上所有的字符,Unicode 联盟推出了 Unicode 字符集 。
  6. 解决了所有字符的存储方法,但还缺乏一种高性价比的存储方式,于是出现了字符编码。如果使用 Unicode 字符集最初的低效方式,存储字母 a 和汉字“你”的方式如下:
    a => 00000000 00000000 00000000 01100001 = 0061
    你 => 00000000 00000000 01001111 01100000 = 4F60
    这样的方式浪费了存储资源,从而出现了比较节省存储资源的方式——字符编码:
    a => 01100001
    你 => 11100100 10111101 10100000
    当存储的是单个字母的时候,使用 1 个字节(Byte)来存储,而存储汉字或其他字符,则用两个或以上的字节来存储;第一个字节带有识别后续字节的编码,后续字节的前两位用来作为让第一个字节识别的标识,这就是 UTF-8 编码:
    1字节 0xxxxxxx
    2字节 110xxxxx 10xxxxxx
    3字节 1110xxxx 10xxxxxx 10xxxxxx
    4字节 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
    5字节 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
    6字节 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

现实问题:

由于历史原因,早期的软件和网站是在 GBK 字符集的年代诞生的,而没有赶上 Unicode 字符集和 UTF-8 编码,所以还是有大量应用 GBK 字符集的软件和网站。

也是由于时间原因,JavaScript 使用了 Unicode 字符集,却没有使用 UTF-8 编码,所以 ES5 及之前的标准无法表示 \uFFFF 之后的字符,某些情况下会出 bug。例如 JavaScript 会将一个超出范围的单个字符的长度识别为 2:

var str1 = '\u1D306';
alert(str1); //ᴰ6,一个字符和数字字符6;
var str2 = '𝌆';
alert(str2.length); //明明是一个字符,却显示长度为2;

所以,现在在各种编程当中,一定都要用 UTF-8 编码!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,590评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,808评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,151评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,779评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,773评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,656评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,022评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,678评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,038评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,756评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,411评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,005评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,973评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,053评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,495评论 2 343

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 171,442评论 25 707
  • 本文首发于 GitChat,现免费放出~感谢大家的支持。 我们都知道,大学几乎是没有 Web 前端课的。以我所在的...
    hylerrix阅读 4,852评论 8 60
  • 有好几次忘记了 在我身旁一同睡醒的一行诗歌 我以为不再有了 直到路过一首诗里的温暖和眼泪 有好几次忘记了 用来喂养...
    屋顶有故事的猫阅读 216评论 2 6
  • 选择一个人的狂欢,还是一群人的寂寞!
    写程式的猫阅读 97评论 0 2
  • 人总是很奇怪,他们和我说,要知道知足,但是为什么,有时候我总觉得心里空空的,我也不知道自己不满意什么,有一个貌似表...
    麻花头阅读 204评论 0 0