我是如何低效的看TiKV代码的(序)

为什么要看TiKV

空间和时间-----鱼和熊掌

我们一致在为空间和时间的平衡而在做妥协。在时间昂贵的场景,就使用空间来换时间,在空间昂贵的时候,就用时间来换空间。
当我们开始分布式、大数据、高并发的场景时候,数据量大到一定的程度,时间开始变的昂贵。而追溯所有的问题根源,似乎都是IO的问题。
在一个业务刚刚起步的时候,一个简单的数据库加一个Web应用似乎就可以解决问题。但是当用户开始增多,数据量变大的时候,
似乎所有人都在考虑使用分库分表的策略。

当然,这里我还是保持一点点的怀疑态度,为什么要分库分表?单机性能到底受限于什么,这个我还是没有弄明白。
无论是说数据表大的话,索引表会很大,会占用很多内存,同时索引在缺页的情况下频繁的做LRU页替换,性能有很大的损失;
还是数据库的单表过大会引起单点问题。。。
理性的分析一下,数据库的索引应该不会占用太多的内存导致内存一直在切换、同时现在的数据库都在使用SSD,寻道等问题已经消失;
还有人说MySQL在百万级别的数量的时候性能还行,千万的时候性能衰减严重,但立刻有人说现在跑这大几千万的单表应用也没有关系。。
诸多理由似乎都没有解释清楚为什么在现在一定要使用分库分表策略来拆解大应用。

我能想到的是在偏离线的数据分析场景下,对group by, order, count 以及一些子查询有更多的需求,在这种场景下,
IO的问题就被凸显出来了。IO的极限很容易理解。

拿空间换取点时间!!

这种情况下朴素的想法也是做归并嘛,拆解问题嘛,当然就是数据备份好几份,每个上面处理一个子任务,然后在合并起来呗。
这里优化的空间可就大了(水深),当然可以不备份多份数据,而是根据一定的规则将数据分散的保存在不同的机器上。
子任务处理完成之后合并结果。

复杂度守恒定律

复杂度不会减少,只会转移。

在我们面对有大量的数据需要做处理的时候,基本是两个套路:

  1. 分库分表,数据在什么地方业务自己来做处理
  2. 全部采用分布式的方案来解决。比如Google的全家桶, BigTable、Spanner、F1

SQL的查询语言在设计初衷其实是为了屏蔽数据存储信息,用户只管去仓库中找数据就可以了。当我们开始注意如何建立索引,如何优化SQL
的时候,这个事情本身就跟初衷背道而驰。现在还需要关心分库分表,手动的写两阶段事务,心智负担的确非常重。

那么分布式的数据库,特别是一个全特性支持SQL的分布式数据库是一个什么样子呢,引起了我的好奇心。
TiDB/TiKV 恰好是一个工业级别的开源产品,Talk is cheap , show me the code.

在分布式数据库中一个Insert 语句会怎么执行呢?

带着这个问题,我们来一起看看TiDB是如何做到

准备工作

Windows 用户要不就用个虚拟机?(微笑)

TiDB 依赖的几个工程

https://github.com/pingcap/tidb
https://github.com/pingcap/tikv
https://github.com/pingcap/pd
https://github.com/pingcap/kvproto
https://github.com/pingcap/raft-rs
https://github.com/pingcap/rust-rocksdb

安装golang && rust

  1. 可以使用Linux 的包管理工具下载,或者去官网下载相应的发行包
  2. 使用make编译tikv
  3. 推荐使用emacs(spacemacs) + playground插件,在遇到语言层不理解的地方,用playground写一点小程序,看看结果

PS: 当然也可以使用IntelliJ全家桶,已经发布了golang, rust的版本,或者使用VS code.

公欲善其事必先利其器。准备好趁手的工具,就开始看代码啦~~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343

推荐阅读更多精彩内容