最近在参与公司的岗前培训,学习了一些跟存储数据相关的理论知识,现对学习内容进行一个简单的总结,以求更好的内化。总结内容主要内容有:为什么需要存储数据保护?存储数据的保护技术。
一、为什么需要存储数据保护
存储数据可能会因为误删除,电脑电源出故障、电脑被砸碎甚至是因为战争而丢失,那么当存储的数据非常重要时,对丢失的数据进行找回就显得很重要了,这也就是为什么需要存储数据保护。以上提到导致数据丢失的现象其实可分别归结为逻辑故障、部件故障、整机故障、环境灾难四类。具体如下:
二、存储数据保护技术及介绍
针对存储数据面临的问题,提出了以下4个技术,分别是快照、克隆、复制和双活。下面进行介绍:
快照:数据在某个时间点的状态拷贝,可以快速生成并用于数据恢复;比如word会每20分钟自动保存一下文本,这就是快照技术,还有我们平常在电脑上使用的Control+Z这个撤销功能其背后的技术也是快照技术。特点:但该技术只记录变化的数据,如图2,我们想要将05改成08,先将原卷的05移除至快照空间,然后编写新的08以后再将08移至原卷,所以快照对变化数据进行处理、因此空间占有小,使用与恢复简单。存在问题:当原卷发生物理损坏带来非变化部分数据丢失,无法恢复;且快照部分只保存改变部分的原数据,无法满足所有数据对生产性能测试需求。解决问题:逻辑故障
克隆:基于快照存在的问题,对基于快照时间点的虚拟卷进行完整复制,也就是对某个时间点变化和非变化的数据都进行复制;特点:所以所需存储空间要比快照大。
快照和克隆都是在一块存储内进行存储数据保护技术,当发生整机故障或环境故障时无法对数据进行保护,比如说即使快照将数据存储在了电脑硬盘里,但当电脑被砸坏,数据就无法恢复了,于是就有了复制和双活技术的诞生。
复制:基于两个或者多个存储器的数据保护技术,将一个存储内的数据通过链路传输的方式复制到另外的存储上,当一台存储损坏时,另一台存储上可以将数据恢复。按传输距离可分为本地复制(广州天河区和越秀区)和远程复制(北京和广州);特点:多个存储、链路要求较高、成本较高。解决问题:部件故障、整机故障和环境故障;存在问题:由于链路传输需要时间,所以复制的数据会出现延迟,存在不一致性(比如说图3中左侧P存储8:00将数据通过链路传到S存储,传输过程需要2分钟,此时P存储正在不断更新数据,当8:02分时P存储坏了,此时在这2分钟内更新的数据还未传输至S存储,所以从S存储内恢复的数据只是8:00的,存在数据不一致),无法满足一些客户对业务连续性要求高的需求。所以有了双活技术的出现。
双活:在复制的技术上增加了链路(如图3中右图所示),数据可同时从两个P存储中读取和写入,以保证在任何一个P存储坏了系统都能运行且数据不丢失。特点:链路要求高、成本高,可保证业务连续性和数据一致性。解决问题:部件故障、整机故障和环境故障。