磁盘阵列(RAID)是什么，和普通、企业级硬盘区别

行业百科 | 2020-03-27 15:31

磁盘阵列硬盘是由很多价格较便宜的磁盘，配合数据分散排列的设计，组合成一个容量巨大的磁盘组，利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术，将数据切割成许多区段，分别存放在各个硬盘上。磁盘阵列还能利用同位检查（Parity Check）的观念，在数组中任一颗硬盘故障时，仍可读出数据，在数据重构时，将数据经计算后重新置入新硬盘中。

阵列上用的硬盘和普通硬盘没有区别，只是一般用到阵列数据有可能都比较大、要么数据很重要，根据硬盘自己分，有企业级，监控专用，台式机硬盘。企业级的质量会好一些，所以为了自己数据的安全考虑还是用企业级的多一些。

什么是磁盘阵列

独立硬盘冗余阵列（RAID, Redundant Array of Independent Disks），旧称廉价磁盘冗余阵列（RAID, Redundant Array of Inexpensive Disks），简称硬盘阵列。由伯克利大学一位教授提出，其基本思想就是把多个相对便宜的硬盘组合起来，成为一个硬盘阵列组，使性能达到甚至超过一个价格昂贵、容量巨大的硬盘。根据选择的版本不同，RAID比单颗硬盘有以下一个或多个方面的好处：增强数据集成度，增强容错功能，增加处理量或容量。另外，磁盘阵列对于电脑来说，看起来就像一个单独的硬盘或逻辑存储单元。最常用的四种RAID为 RAID 0、RAID 1、RAID 5、RAID 10。

磁盘阵列的原理

简而言之，RAID就是针对硬盘提供一种虚拟化方案，将多个物理硬盘组合成一个逻辑硬盘，操作系统只会把这个逻辑硬盘当作“一个硬盘”。RAID常被用在服务器计算机上，并且使用完全相同的硬盘作为组合。由于硬盘价格的不断下降（机械硬盘，基于TLC和QLC的固态硬盘）并且RAID功能更多的集成到主板上，因而电脑组装爱好者也热衷于给自己的数据存储模块加入RAID技术。

加入RAID技术主要是为了增加以下一项或多项功能：

1.增加数据可靠性

2.增加存储器读写性能

3.增加容量

磁盘阵列(RAID)的分类

RAID 中主要有三个关键概念和技术：镜像（ Mirroring ）、数据条带（ Data Stripping ）和数据校验（ Data parity ），最初的RAID分成不同的等级，每种等级都有其理论上的优缺点，不同的等级在两个目标间取得平衡，分别是增加数据可靠性以及增加存储器（群）读写性能。这些年来，出现对于RAID观念不同的应用。

一、RAID0 又称Strip，条带化模式

RAID 0 即Data Stripping（数据分条技术）。整个逻辑盘的数据是被分条（stripped）分布在多个物理磁盘上，可以并行读/写，提供最快的速度，但没有冗余能力。要求至少两个磁盘。我们通过RAID 0可以获得更大的单个逻辑盘的容量，且通过对多个磁盘的同时读取获得更高的存取速度。RAID 0首先考虑的是磁盘的速度和容量，忽略了安全，只要其中一个磁盘出了问题，那么整个阵列的数据都会不保了。

磁盘阵列RAID 0模式

原理：数据交付给RAID控制单元，切割成若干条带，并行写入阵列

优缺点：理论上最高可提升读写速度为原来N倍，存储容量扩充为单块硬盘N倍，N为阵列内硬盘个数，数据安全性降低为原来的1/N，任何一块硬盘发生故障，整个RAID上的数据将不可恢复！而且从实际情况来看，由于本身切割数据也需要耗费计算资源，所以实际读写提升将略小于理论值，并且会随着硬盘个数增加而提升越来越少。

应用情况：适用于对读写要求高，成本控制严格，安全性要求不高的场合，单独RAID0笔者本人原来组准系统的时候用过，主要是为了提升跑分好看。一般都是采用其他组合的方案。存储高清电影比较适合。

二、RAID 1 又称Mirror，镜像模式

两组以上的N个磁盘相互作镜像，在一些多线程操作系统中能有很好的读取速度，理论上读取速度等于硬盘数量的倍数，另外写入速度有微小的降低。只要一个磁盘正常即可维持运作，可靠性最高。其原理为在主硬盘上存放数据的同时也在镜像硬盘上写一样的数据。当主硬盘（物理）损坏时，镜像硬盘则代替主硬盘的工作。因为有镜像硬盘做数据备份，任何一块硬盘出现故障是，所存储的数据都不会丢失，所以RAID 1的数据安全性在所有的RAID级别上来说是最好的。但无论用多少磁盘做RAID 1，仅算一个磁盘的容量，是所有RAID中磁盘利用率最低的一个级别。

磁盘阵列RAID 1模式

磁盘利用率为50％。也就是说，如果我们有两个磁盘每个500GB，总共是1TB，但在镜像中它只会显示500GB。在镜像如果一个磁盘发生故障不会有数据丢失，因为两个磁盘中的内容相同。读取性能会比写入性能更好。创建 RAID 1 至少要有两个磁盘，你也可以添加更多的磁盘，磁盘数需为2，4，6，8等偶数。要添加更多的磁盘，你的系统必须有 RAID 物理适配器（硬件卡）。

原理：数据交付给RAID控制单元，对阵列内所有磁盘写入相同数据。读取时，与RAID0相仿，可以同时从阵列中所有可用硬盘内读取所需数据。

优缺点：理论上数据安全性提升N倍，写能力不受影响，读取数据能力提升为原来N倍（性能基准与单块硬盘比较，N为硬盘个数）。实际情况中，数据安全性提升比率更大（要镜像阵列中所有盘坏才会定义为崩溃，所以崩溃几率是相乘，会成倍减小），读取数据能力提升不足N倍（受控制器影响，和控制策略算法影响），写能力微弱下降（控制单元损耗）该模式可使用的硬盘实际容量比较小，仅仅为两颗硬盘中最小硬盘的容量。

应用情况：适用于对数据安全性要求高，读多写极少的情况，故也不适合单独拿来大规模应用。可存储非常重要的资料，如数据库，个人资料，是万无一失的存储方案。

三、RAID3 带专用校验盘的数据条带

RAID3 带专用校验盘的数据条带

原理：

RAID3是把数据分成多个“块”，按照一定的容错算法，存放在N+1个硬盘上，实际数据占用的有效空间为N个硬盘的空间总和，而第N+1个硬盘存储的数据是校验容错信息，当这N+1个硬盘中的其中一个硬盘出现故障时，从其它N个硬盘中的数据也可以恢复原始数据。

数据交付给RAID控制单元，控制单元将向阵列中一块固定的磁盘写入校验信息，同时将数据信息写入其余磁盘。校验信息为异或值（Xor），如果任意一块硬盘发生错误，那么都可以通过其余磁盘信息异或后重建。

优缺点：当整个阵列健康时，能够提供接近RAID0的性能（倍数要排除掉校验盘），同时提供一定的容灾能力（允许一块硬盘故障）。但一旦出现坏盘进入降级模式，每一次读写坏区块的信息都要通过计算其余盘的内容，性能会大大下降

应用情况：由于RAID5能够更好的代替RAID3，所以基本上RAID3应用不多。

四、RAID 5 RAID5 分散校验盘的数据条带

RAID Level 5是一种储存性能、数据安全和存储成本兼顾的存储解决方案。它使用的是Disk Striping（硬盘分区）技术。RAID 5至少需要三块硬盘，RAID 5不是对存储的数据进行备份，而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上，并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID5的一个磁盘数据发生损坏后，可以利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。RAID 5可以理解为是RAID 0和RAID 1的折衷方案。RAID 5可以为系统提供数据安全保障，但保障程度要比镜像低而磁盘空间利用率要比镜像高。RAID 5具有和RAID 0相近似的数据读取速度，只是因为多了一个奇偶校验信息，写入数据的速度相对单独写入一块硬盘的速度略慢，若使用“回写缓存”可以让性能改善不少。同时由于多个数据对应一个奇偶校验信息，RAID 5的磁盘空间利用率要比RAID 1高，存储成本相对较便宜。

RAID 5

原理：校验数据分布在阵列中的所有磁盘上，而没有采用专门的校验磁盘。对于数据和校验数据，它们的写操作可以同时发生在完全不同的磁盘上。RAID5不对存储的数据进行备份，而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上，并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID5的一个磁盘数据发生损坏后，利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。

优缺点：读取速度接近RAID0（倍数要排除掉校验盘），同时提供一定的容灾能力（允许一块硬盘故障）。但RAID5还提供良好的扩展性，磁盘数量增加，能提供更高的容量和更快的速度。当然，对替换盘重建数据时，性能依然会受到较大影响。RAID5 兼顾存储性能、数据安全和存储成本等各方面因素，它可以理解为 RAID0 和 RAID1 的折中方案，是目前综合性能最佳的数据保护解决方案。

应用情况：RAID5 基本上可以满足大部分的存储应用需求，数据中心大多采用它作为应用数据的保护方案。但实际的应用中，也通常不单使用RAID5，而是有其他多种的组合方案。

五、RAID 6

与RAID 5相比，RAID 6增加第二个独立的奇偶校验信息块。两个独立的奇偶系统使用不同的算法，数据的可靠性非常高，任意两块磁盘同时失效时不会影响数据完整性。RAID 6需要分配给奇偶校验信息更大的磁盘空间和额外的校验计算，相对于RAID 5有更大的IO操作量和计算量，其“写性能”强烈取决于具体的实现方案，因此RAID6通常不会通过软件方式来实现，而更可能通过硬件/固件方式实现。

同一数组中最多容许两个磁盘损坏。更换新磁盘后，数据将会重新算出并写入新的磁盘中。依照设计理论，RAID 6必须具备四个以上的磁盘才能生效。