数据存储的发展历程

记录一次学习总结——数据存储的发展历程

文件存储

早期一般都是文件存储,存在磁盘上,磁盘的读写是线性的、速度在毫秒级别,所以随着数据量的增大,会越来越慢,它的瓶颈在于磁盘。文件存储分为顺序读写与随机读写

  • 顺序读写:属于线性O(n),它的速度随着数据量的增大,会越来越慢
  • 随机读写:它的速度相当慢,可能也就在kb级别

数据库

介于文件存储的问题,引入了数据库,数据库同样是存储在磁盘上,瓶颈当然也还是磁盘IO。
数据库怎么解决这个问题的呢?
分治,把一个大的文件存储拆分为一个个dataPage页(mysql默认的16KB),文件拆分小了,但是要是没有可以跨页查找的指针,同样是O(n)。索引由此产生,虽然索引也需要占据磁盘空间,但是索引的占据的磁盘的空间时很小的,叶数据存储的是整列的数据,而索引只需要一列,最多再存一个指向下一个的指针。
小结一下:数据库是采用 分页+索引 来解决这个问题

这里会有一个面试问题:假设一张表有几千万的数据,那么读写速度如何呢?
写的速度是一定会慢,读呢,如果是索引命中,查询量比较少,那么速度还行。但是这里会有一个问题是,如果在高并发的情况下,而且大家查的数据都是不同的,那么这个时候吞吐量肯定会低,前面数据可能1s返回了,后续的时候至少1s以上了。

基于内存的关系型数据库-<k,v>

redis

前两者的瓶颈都在于磁盘,那么有人就说了,可以基于内存去做呀,内存的读写速度是在纳秒级别(秒->毫秒->微妙->纳秒),内存当然非常快,相当于磁盘的100万倍,但是你以为公司都富到这程度了,内存多贵啊!

当当当当~ redis应运而生
redis key-value形式相当于hashMap,noSQL,单线程,基于内存(一秒的读写速度在100万次),淘汰策略,但是redis禁止使用集合操作,需要一个集合把两个操作进行交并差积。

redis6.x以后推出IO thread,一个线程先把IO数据从内核拷贝到用户空间,work线程还是单线程处理

所以使用redis+mysql能解决一般公司的绝大多数问题,冷热数据分别存于数据库和redis中,redis一般是用于缓存

memcache

同样是<k,v>形式,但是无类型,都是string。所以读取数据只能是全量读到后,再进行解析,势必会有服务端到客户端数据的全量移动,并且客户端要自己计算。

分布式数据库-hbase,HDFS

HDFS

分布式需要角色,而角色中必须有协调者与工作者,那么就会有主从(干的活不一样),主备(主挂了,备机器上)
什么是分布式的,就是存在不同的机器中。如果未来想找这个数据在哪?那么就需要映射mapper,这里叫元数据(namenode),从机器(datanode)来真正存数据
角色之间需要通讯:namenode通知来存数据,datanode实际存数据,存储完成后需要告诉namenode,我存在哪了
流水线变种的并行:把一个大的包切为一个个小数据包,达到并行目的
如果一台服务器是datanode,第一副本存本地,没走网卡,第二个通过网卡keepline存备份

hbase

介于big table -> 慢,推出hbase
表如果变大会变慢,那么进行垂直和水平拆分
分表痛点在于关联查询

天生分布式,以列族为单位,形成一个文件,相当于一个垂直切分的范式
水平有一个region对应rowkey(比如1-25行),还有一个时间戳的概率

regionServer 将不同的数据放在不同区中,它借用了redis的特征,热数据放于缓存中
如果内存存满了,存于磁盘,借用HDFS,主从加数据备份

选型

做一个文件系统,提供一个根据各个应用创建的对应分发 /E/ES(检索),/H/hbase(分布式 big table),/M/memcache(无类型),/H/HDFS(主从,数据备份),客户端根据约定的格式进行解析

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,658评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,482评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,213评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,395评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,487评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,523评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,525评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,300评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,753评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,048评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,223评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,905评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,541评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,168评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,417评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,094评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,088评论 2 352