分布式存储

认识分布式存储

分布式存储系统,是通过网络将数据分散存储在多台独立的设备上。

分布式存储系统的特性

可扩展
分布式存储系统可以扩展到甚至几千台的集群规模,而且随着集群规模的增长,系统整体性能表现为线性增长。分布式存储的水平扩展有以下几个特性:
  
   1)节点扩展后,旧数据会自动迁移到新节点,实现负载均衡,避免单点过热的情况出现;
  
   2)水平扩展只需要将新节点和原有集群连接到同一网络,整个过程不会对业务造成影响;
  
   3)当节点被添加到集群,集群系统的整体容量和性能也随之线性扩展,伺候新节点的资源就会被管理平台接管,被用于分配或者回收
  
低成本
分布式存储系统的自动容错、自动负载均衡机制使其可以构建在普通的PC机之上。另外,线性扩展能力也使得增加、减少机器非常方便,可以实现自动运维。
  
  
高性能
无论是针对整个集群还是单台服务器,都要求分布式存储系统具备高性能。
  
  
易用
分布式存储系统需要能够提供易用的对外接口,另外,也要求具备完善的监控、运维工具,并能够与其他系统集成。
  
易管理
可通过一个简单的WEB界面就可以对整个系统进行配置管理,运维简便,极低的管理成本。
  
  
分布式存储系统的挑战主要在于数据、状态信息的持久化,要求在自动迁移、自动容错、并发读写的过程中保证数据的一致性,分布式存储涉及的技术主要来自两个领域,分布式系统以及数据库。

存储分类
  
本地存储本地的文件系统,不能放在网络上用.
  ext3  ext4  xfs  ntfs
  
网络存储---网络文件系统、共享的都是文件系统
    nfs      网络文件系统
    hdfs      分布式网络文件系统
    glusterfs    分布式网络文件系统
  
共享的是裸设备
  块存储 cinder   ceph(块存储  对象存储  网络文件系统-分布式)
  SAN(存储区域网)
  
分布式
  集群
  


分布式存储分类介绍

Hadoop HDFS(大数据分布式文件系统)

HDFS(Hadoop Distributed File System)是一个分布式文件系统,是hadoop生态系统的一个重要组成部分,是hadoop中的存储组件、HDFS是一个高度容错性的系统、HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。
  
  
HDFS的优点:
  1.高容错性
      数据自动保存多个副本
      副本丢失后,自动恢复
  2.良好的数据访问机制
      一次写入,多次读取,保证数据一致性
  3.适合大数据文件的存储
      TB甚至PB级数据
      扩展能力很强

HDFS的缺点:
  1.低延迟数据访问
      难以应付毫秒级以下的应用
  2.海量小文件存取
      占用NameNode大量内存
  3.一个文件只能有一个写入者
      仅支持append(追加)

OpenStack的对象存储Swift

OpenStack object Storage(swift)是openStack开源云计算项目的子项目之一。Swift的目的是使用普通硬件来构建冗余的、可扩展的分布式对象存储集群,存储容量可达PB级。Swift的是用Python开发
  
其主要特点为:
1、各个存储的节点完全对等,是对称的系统架构。
2、开发者通过一个RESTful HTTP API与对象存储系统相互作用。
3、无单点故障:Swift的元数据存储是完全均匀随机分布的,并且与对象文件存储一样,元数据也会存储多份。整个Swift集群中,也没有一个角色是单点的。
4、在不影响性能的情况下,集群通过增加外部节点进行扩展。
5、无限的可扩展性:这里的扩展性分两方便,一是数据存储容量无线可扩展;二是Swift性能(如QPS、吞吐量等)可线性提升,扩容只需要简单地新增机制,系统会自动完成数据迁移等工作,使各存储节点重新达到平衡状态。
6、极高的数据持久性
  
  
  
Swift可以用一下用途;
图片、文档存储
长期保存的日志文件
存储媒体库(照片、音乐、视频等)
视频监控文件的存档
总结:Swift适合用来存储大量的、长期的、需要备份的对象。

公有云对象存储

公有云大都只有对象存储。例如,谷歌云存储是一个极速,具有可扩展性和高可用性的对象存储。

Amazon类似产品就是S3; http://aws.amazon.com/s3;
  
微软类似产品Azure Bolb: http://azure.microsoft.com/en-us/documentation/articles/storage-dotnet-how-to-use-blobs/;
  
阿里类似的oss: https://ww.aliyun.com/product/oss/;
  
阿里云对象存储oss
阿里云对象存储服务(object Storage Service,简称OSS),是阿里云提供的海量、安全、低成本、高可靠的云存储服务


存储类型(storage class)
OSS提供标准、低频访问、归档三种存储类型,其中标准存储类型提供高可靠、高可用、高性能的对象存储服务,能够支持频繁的数据访问;低频访问存储类型适合长期保存不经常访问的数据(平均每月访问频率1到2次),存储单价低于标准类型;归档存储类型适合需要长期保存(建议半年以上)的归档数据,在三种存储类型中单价最低。
  
  
应用场景
1、图片和音视频等应用的海量存储
  OSS可用于图片、音视频、日志等海量文件的存储
2、云端数据处理
  上传到OSS后,可以配合媒体处理服务和图片处理服务进行云端的数据处理。
3、网页或者移动应用的静态和动态资源分离
  利用海量互联网带宽,OSS可以实现海量数据的互联网并发下载。

GlusterFS分布式文件系统

GlusterFS (GNU ClusterFile System)是一种全对称的开源分布式文件系统,所谓全对称是指GlusterFS采用弹性哈希算法,没有中心节点,所谓节点全部平等。GlusterFS配置方便,稳定性好,可轻松达到PB级容量,数千个节点,2011年被红帽收购。
  
PB级容量   高可用性  基于文件系统级别共享  分布式  去中心化
  
GlusterFS存储卷的类型
  
基本类型:条带,复制,哈希
复合卷
复合卷就是分布式复制,分布式条带,分布式条带复制卷,像分布式复制,分布式条带这两个是比较常用的,像分布式条带复制三种揉一块儿的比较少。
  
各种卷的整理
分布卷:存储数据时,将文件随机存储到各个GlusterFS机器上
    优点:存储数据时,读取速度快
    缺点:一个birck坏掉,文件就会丢失
复制卷:存储数据时,所有文件分别存储到每台glusterfs机器上
    优点:对文件进行的多次备份,一个brick坏掉,文件不会丢失,其他机器上的brick上面有备份
    缺点:占用资源
条带卷:存数据时,一个文件分开存到每台glusterfs机器上
    优点:对大文件,读写速度快
    缺点:一个birck坏掉,文件就会坏掉

最常见的GPFS和HDFS有什么区别?

GPFS和Hadoop的HDFS系统对比,它涉及用于在商用硬件上存储类似或更大的数据
   &emsp
HDFS还将文件分割成块,并将它们存储在不同的文件系统节点内。
   &emsp
HDFS对磁盘可靠性依赖并不高,它可以在不通的节点内存储块的副本。保存单一副本块的一个节点出现故障可以再复制该组其他的有效块内的副本。相较而言,虽然GPFS支持故障节点恢复,但它是一个更严重的时间,它可能包括数据(暂时性)丢失的高风险
   &emsp
GPFS支持完整的Posix文件系统语义。HDFS和GFS(谷歌文件系统)并不支持完整的Posix语义。
   &emsp
GPFS跨文件系统分布它的目录索引和其他元数据。相反,Hadoop将它们保留在主要和次要Namenode中,大型服务器必须在RAM内存储所有的索引信息。
   &emsp
GPFS将文件分割成小块,Hadoop HDFS喜欢64MB甚至更多的块,因为这降低了Namenode的储存需求。小块或很多小的文件会快速填充文件系统的索引,因此限制了文件系统的大小。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,875评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,569评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,475评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,459评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,537评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,563评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,580评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,326评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,773评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,086评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,252评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,921评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,566评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,190评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,435评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,129评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,125评论 2 352

推荐阅读更多精彩内容