磁盘阵列(RAID)是什么,和普通、企业级硬盘区别

 行业百科     |      2020-03-27 15:31

磁盘阵列硬盘是由很多价格较便宜的磁盘,配合数据分散排列的设计,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任一颗硬盘故障时,仍可读出数据,在数据重构时,将数据经计算后重新置入新硬盘中。

阵列上用的硬盘和普通硬盘没有区别,只是一般用到阵列数据有可能都比较大、要么数据很重要,根据硬盘自己分,有企业级,监控专用,台式机硬盘。企业级的质量会好一些,所以为了自己数据的安全考虑还是用企业级的多一些。

什么是磁盘阵列

独立硬盘冗余阵列(RAID, Redundant Array of Independent Disks),旧称廉价磁盘冗余阵列(RAID, Redundant Array of Inexpensive Disks),简称硬盘阵列。由伯克利大学一位教授提出,其基本思想就是把多个相对便宜的硬盘组合起来,成为一个硬盘阵列组,使性能达到甚至超过一个价格昂贵、容量巨大的硬盘。根据选择的版本不同,RAID比单颗硬盘有以下一个或多个方面的好处:增强数据集成度,增强容错功能,增加处理量或容量。另外,磁盘阵列对于电脑来说,看起来就像一个单独的硬盘或逻辑存储单元。最常用的四种RAID为 RAID 0、RAID 1、RAID 5、RAID 10。

磁盘阵列的原理

简而言之,RAID就是针对硬盘提供一种虚拟化方案,将多个物理硬盘组合成一个逻辑硬盘,操作系统只会把这个逻辑硬盘当作“一个硬盘”。RAID常被用在服务器计算机上,并且使用完全相同的硬盘作为组合。由于硬盘价格的不断下降(机械硬盘,基于TLC和QLC的固态硬盘)并且RAID功能更多的集成到主板上,因而电脑组装爱好者也热衷于给自己的数据存储模块加入RAID技术。

加入RAID技术主要是为了增加以下一项或多项功能:

1.增加数据可靠性

2.增加存储器读写性能

3.增加容量
 

磁盘阵列(RAID)的分类

RAID 中主要有三个关键概念和技术:镜像( Mirroring )、数据条带( Data Stripping )和数据校验( Data parity ),最初的RAID分成不同的等级,每种等级都有其理论上的优缺点,不同的等级在两个目标间取得平衡,分别是增加数据可靠性以及增加存储器(群)读写性能。这些年来,出现对于RAID观念不同的应用。

一、RAID0 又称Strip,条带化模式

RAID 0 即Data Stripping(数据分条技术)。整个逻辑盘的数据是被分条(stripped)分布在多个物理磁盘上,可以并行读/写,提供最快的速度,但没有冗余能力。要求至少两个磁盘。我们通过RAID 0可以获得更大的单个逻辑盘的容量,且通过对多个磁盘的同时读取获得更高的存取速度。RAID 0首先考虑的是磁盘的速度和容量,忽略了安全,只要其中一个磁盘出了问题,那么整个阵列的数据都会不保了。

磁盘阵列RAID 0模式

原理:数据交付给RAID控制单元,切割成若干条带,并行写入阵列

优缺点:理论上最高可提升读写速度为原来N倍,存储容量扩充为单块硬盘N倍,N为阵列内硬盘个数,数据安全性降低为原来的1/N,任何一块硬盘发生故障,整个RAID上的数据将不可恢复!而且从实际情况来看,由于本身切割数据也需要耗费计算资源,所以实际读写提升将略小于理论值,并且会随着硬盘个数增加而提升越来越少。

应用情况:适用于对读写要求高,成本控制严格,安全性要求不高的场合,单独RAID0笔者本人原来组准系统的时候用过,主要是为了提升跑分好看。一般都是采用其他组合的方案。存储高清电影比较适合。

二、RAID 1 又称Mirror,镜像模式

两组以上的N个磁盘相互作镜像,在一些多线程操作系统中能有很好的读取速度,理论上读取速度等于硬盘数量的倍数,另外写入速度有微小的降低。只要一个磁盘正常即可维持运作,可靠性最高。其原理为在主硬盘上存放数据的同时也在镜像硬盘上写一样的数据。当主硬盘(物理)损坏时,镜像硬盘则代替主硬盘的工作。因为有镜像硬盘做数据备份,任何一块硬盘出现故障是,所存储的数据都不会丢失,所以RAID 1的数据安全性在所有的RAID级别上来说是最好的。但无论用多少磁盘做RAID 1,仅算一个磁盘的容量,是所有RAID中磁盘利用率最低的一个级别。

磁盘阵列RAID 1模式
 

磁盘利用率为50%。也就是说,如果我们有两个磁盘每个500GB,总共是1TB,但在镜像中它只会显示500GB。在镜像如果一个磁盘发生故障不会有数据丢失,因为两个磁盘中的内容相同。读取性能会比写入性能更好。创建 RAID 1 至少要有两个磁盘,你也可以添加更多的磁盘,磁盘数需为2,4,6,8等偶数。要添加更多的磁盘,你的系统必须有 RAID 物理适配器(硬件卡)。

原理:数据交付给RAID控制单元,对阵列内所有磁盘写入相同数据。读取时,与RAID0相仿,可以同时从阵列中所有可用硬盘内读取所需数据。

优缺点:理论上数据安全性提升N倍,写能力不受影响,读取数据能力提升为原来N倍(性能基准与单块硬盘比较,N为硬盘个数)。实际情况中,数据安全性提升比率更大(要镜像阵列中所有盘坏才会定义为崩溃,所以崩溃几率是相乘,会成倍减小),读取数据能力提升不足N倍(受控制器影响,和控制策略算法影响),写能力微弱下降(控制单元损耗)该模式可使用的硬盘实际容量比较小,仅仅为两颗硬盘中最小硬盘的容量。

应用情况:适用于对数据安全性要求高,读多写极少的情况,故也不适合单独拿来大规模应用。可存储非常重要的资料,如数据库,个人资料,是万无一失的存储方案。

三、RAID3 带专用校验盘的数据条带

RAID3 带专用校验盘的数据条带

原理:

RAID3是把数据分成多个“块”,按照一定的容错算法,存放在N+1个硬盘上,实际数据占用的有效空间为N个硬盘的空间总和,而第N+1个硬盘存储的数据是校验容错信息,当这N+1个硬盘中的其中一个硬盘出现故障时,从其它N个硬盘中的数据也可以恢复原始数据。

数据交付给RAID控制单元,控制单元将向阵列中一块固定的磁盘写入校验信息,同时将数据信息写入其余磁盘。校验信息为异或值(Xor),如果任意一块硬盘发生错误,那么都可以通过其余磁盘信息异或后重建。

优缺点:当整个阵列健康时,能够提供接近RAID0的性能(倍数要排除掉校验盘),同时提供一定的容灾能力(允许一块硬盘故障)。但一旦出现坏盘进入降级模式,每一次读写坏区块的信息都要通过计算其余盘的内容,性能会大大下降

应用情况:由于RAID5能够更好的代替RAID3,所以基本上RAID3应用不多。

四、RAID 5 RAID5 分散校验盘的数据条带

RAID Level 5是一种储存性能、数据安全和存储成本兼顾的存储解决方案。它使用的是Disk Striping(硬盘分区)技术。RAID 5至少需要三块硬盘,RAID 5不是对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID5的一个磁盘数据发生损坏后,可以利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。RAID 5可以理解为是RAID 0和RAID 1的折衷方案。RAID 5可以为系统提供数据安全保障,但保障程度要比镜像低而磁盘空间利用率要比镜像高。RAID 5具有和RAID 0相近似的数据读取速度,只是因为多了一个奇偶校验信息,写入数据的速度相对单独写入一块硬盘的速度略慢,若使用“回写缓存”可以让性能改善不少。同时由于多个数据对应一个奇偶校验信息,RAID 5的磁盘空间利用率要比RAID 1高,存储成本相对较便宜。

RAID 5
 

原理:校验数据分布在阵列中的所有磁盘上,而没有采用专门的校验磁盘。对于数据和校验数据,它们的写操作可以同时发生在完全不同的磁盘上。RAID5不对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID5的一个磁盘数据发生损坏后,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。

优缺点:读取速度接近RAID0(倍数要排除掉校验盘),同时提供一定的容灾能力(允许一块硬盘故障)。但RAID5还提供良好的扩展性,磁盘数量增加,能提供更高的容量和更快的速度。当然,对替换盘重建数据时,性能依然会受到较大影响。RAID5 兼顾存储性能、数据安全和存储成本等各方面因素,它可以理解为 RAID0 和 RAID1 的折中方案,是目前综合性能最佳的数据保护解决方案。 

应用情况:RAID5 基本上可以满足大部分的存储应用需求,数据中心大多采用它作为应用数据的保护方案。但实际的应用中,也通常不单使用RAID5,而是有其他多种的组合方案。

五、RAID 6

与RAID 5相比,RAID 6增加第二个独立的奇偶校验信息块。两个独立的奇偶系统使用不同的算法,数据的可靠性非常高,任意两块磁盘同时失效时不会影响数据完整性。RAID 6需要分配给奇偶校验信息更大的磁盘空间和额外的校验计算,相对于RAID 5有更大的IO操作量和计算量,其“写性能”强烈取决于具体的实现方案,因此RAID6通常不会通过软件方式来实现,而更可能通过硬件/固件方式实现。

同一数组中最多容许两个磁盘损坏。更换新磁盘后,数据将会重新算出并写入新的磁盘中。依照设计理论,RAID 6必须具备四个以上的磁盘才能生效。

六、RAID 10

RAID 10是先镜射再分区数据,再将所有硬盘分为两组,视为是RAID 0的最低组合,然后将这两组各自视为RAID 1运作。

RAID 10(又叫RAID 1+0)特点:

RAID10最少需要4块硬盘才能完成。把2块硬盘组成一个RAID1,然后两组RAID1组成一个RAID0。虽然RAID10方案造成了50%的磁盘浪费,但是它提供了200%的速度和单磁盘损坏的数据安全性。

常见的RAID组合

raid10和raid01

raid10和raid01组合原理
raid10和raid01组合原理

原理:RAID10又称RAID1+0,是先将买来的硬盘分成两组,做镜像,再对每组硬盘做条带化。而RAID01则恰恰相反,是先将买来的硬盘分成两组,做条带化,再对每组硬盘做镜像。

得失:在对每个子组保持基本RAID等级的特性下,RAID10比RAID01有更好的容错能力,能够允许多个子RAID1都有坏盘,只要不是一个RAID1组中硬盘全部坏掉就OK。然而RAID01只能允许在其中一个RAID0组中有坏盘。成组至少四块硬盘,由于都有RAID1,所以磁盘利用率50%

应用情况:鉴于RAID10和01都至少四块硬盘,并且磁盘利用率在完全健康下都一致,基于RAID10数据更强的容灾能力,因而主流的磁盘阵列产品都只支持RAID10。

标签: