RAID(Redundant Arrays of Independent Disks)独立冗余磁盘阵列,简称磁盘阵列
RAID就是在IP架构下大容量存储所用到的技术
RAID采用的是1、分条带、并行的进行数据存储
2、数据安全保护功能:校验、镜像
RAID实现方式:硬件RAID、软件RAID
硬件RAID需要安装RAID卡去实现
软件RAID完全依赖于主机的CPU 主机的运算资源
条带:在同一个磁道上选择一个扇区或者是多块扇区组成的区域。它是组成分条的元素,是切分条带深度的单元
分条:有N多块硬盘选择相同的位置(这个相同位置指的是同一个磁道的同一个扇区所组成的位置)组成的区域
同一磁盘阵列中的多个磁盘驱动器上的相同“位置”(或者说相同编号)的条带
而RAID就是将多块硬盘按照一定要求切分成小单元,然后按照每块单元分别来存储数据。
分条带有一个最根本的要求:
磁盘的容量、转速、传输速率保持相同
传统的RAID对数据的保护都是镜像和校验的方式
校验:
XOR校验(异或校验):相同为假,相异为真
优势就是:可以允许一块磁盘出故障
镜像技术:把数据同时存取两份或多份,磁盘利用率低
创建RAID组的状态:
把多块相同的硬盘组成RAID,这个过程是RAID组的创建过程
RAID组创建完成后需要映射给主机或者服务器去使用,这个环节是RAID组正常工作的状态,这时就可以完成数据的读和存的要求
某一个硬盘或数据出故障,这个过程是RAID组降级的过程
那么我们就需要对RAID组进行恢复,比如更换磁盘,这个过程叫RAID组的重建过程。
如果在校验数据丢失的情况下又丢了一个盘,这个时候就会导致RAID组失效,这个是RAID组失效状态。
这个时候RAID组就失效了,不能工作了。需要重新从头开始。
常见RAID级别
RAID 0
数据条带化,无校验,它代表了所有RAID级别中最高的存储性能,RAID 0至少使用两个磁盘驱动器
它在进行写入的时候,是多块盘同时操作,读写性能是最高的,传输速率也是最高的,因为它没有校验,没有镜像。
缺点就是 它没有任何校验 镜像,那就意味着RAID 0的盘任何一个盘出问题就会导致整个RAID 0组所有数据都不可用,需要对整个RAID 0进行格式化,进行重组,重新映射
RAID 1
在RAID 0的基础上,依然采用条带化存储,但是采用的是镜像的方式对数据进行保护,
可以允许有一块盘的数据丢失
性能的话不如RAID 0,写是同时重复的写入两块盘中,读是跟RAID0一样,多块硬盘也可以一起读。
优点:可以允许有一块盘的数据丢失,有一个镜像保护
RAID 3
依然采用的是条带化存储,它的校验信息单独存在一个硬盘上,因为所有盘都用那一个校验盘,所以它会压力过大,很容易导致校验盘失效
它的写入相对来说是最慢的,因为它是通过单独的校验盘来算数据,那么这块盘就成了整个RAID 3的瓶颈
读的话也是比较快的,因为它也可以是多块磁盘同时读取,它可以允许一块盘出故障
RAID 5
也是条带化,是把检验信息散发到所有的磁盘上,也就意味着所有的磁盘都可以来做校验,那么就把RAID 3的单块校验盘的瓶颈分散到了所有盘上,那么RAID 5出故障的概率就相对较小,跟RAID 3来说,写是比较快的,读也是较快,因为它也是条带化存储,它也可以允许一块盘出故障,可以通过剩余的盘+校验盘的数据算出丢失的那份数据。
RAID 6
带有两种校验的独立磁盘结构,采用两种奇偶校验方法,需要至少N+2(N>2)个磁盘构成阵列。一般用在数据可靠性、可用性要求较高的应用场合。
采用两次校验来完成数据校验的过程。把两次校验分散在不同的盘上或独立的两块盘上。
RAID 6有两种技术实现方式
RAID 6 P+Q就是把两次校验分散在不同的磁盘上,就是完成两次RAID 5的过程,先完成P的校验过程,然后分散到所有的磁盘上,再去算出DP的数据,也分散到所有的磁盘上,所以RAID 6的写能力相对一般,读取比较快。可以允许两块盘同时出故障。
RAID 6 DP技术通过两个单独的专有盘去存放校验数据,一个专有盘先完成P的校验,同时通过斜向数据完成DP的校验放到单独的存储盘上。相对来说出故障的概率比较大。写入过程慢(经过两次校验),读取比较块,允许有两块盘出故障。
RAID 10
首先完成RAID 1的过程,然后再去完成RAID 0,至少需要四块硬盘
RAID 50
主要应用在一些高性能的RAID场景
先是RAID 5 然后RAID 0,至少需要6块硬盘
总结: