全面了解RAID

飞速资源网| http://www.ff70.com |硬盘维修|人气:536次| 06-10

全面了解RAID

全面了解RAID 　

RAID的种类

RAID的英文全称为Redundant Array of Inexpensive（或Independent） Disks，而不是某些词典中所说的“ Redundant Access Independent Disks”。中文名称是廉价（独立）磁盘冗余阵列。

RAID的初衷主要是为了大型服务器提供高端的存储功能和冗余的数据安全。在系统中，RAID被看作是一个逻辑分区，但是它是由多个硬盘组成的（最少两块）。它通过在多个硬盘上同时存储和读取数据来大幅提高存储系统的数据吞吐量（Throughput），而且在很多RAID模式中都有较为完备的相互校验/恢复的措施，甚至是直接相互的镜像备份，从而大大提高了RAID系统的容错度，提高了系统的稳定冗余性，这也是Redundant一词的由来。

RAID以前一直是SCSI领域的独有产品，因为它当时的技术与成本也限制了其在低端市场的发展。今天，随着RAID技术的日益成熟与厂商的不断努力，我们已经能够享受到相对成本低廉得多的IDE-RAID系统，虽然稳定与可靠性还不可能与SCSI-RAID相比，但它相对于单个硬盘的性能优势对广大玩家是一个不小的诱惑。事实上，对于日常的低强度操作，IDE-RAID已足能胜任了。

与Modem一样，RAID也有全软、半软半硬与全硬之分，全软RAID就是指RAID的所有功能都是操作系统（OS）与CPU来完成，没有第三方的控制/处理（业界称其为RAID协处理器——RAID Co-Processor）与I/O芯片。这样，有关RAID的所有任务的处理都由CPU来完成，可想而知这是效率最低的一种RAID。半软半硬RAID则主要缺乏自己的I/O处理芯片，所以这方面的工作仍要由CPU与驱动程序来完成。而且，半软半硬RAID所采用的RAID控制/处理芯片的能力一般都比较弱，不能支持高的RAID等级。全硬的RAID则全面具备了自己的RAID控制/处理与I/O处理芯片，甚至还有阵列缓冲（Array Buffer），对CPU的占用率以及整体性能是这三种类型中最优势的，但设备成本也是三种类型中最高的。早期市场上所出现的使用HighPoint HPT 368、370以及PROMISE芯片的IDE RAID卡与集成它们的主板都是半软半硬的RAID，并不是真正的硬RAID，因为它们没有自己专用的I/O处理器。而且，这两个公司的RAID控制/处理芯片的能力较弱，不能完成复杂的处理任务，因此还不支持RAID 5等级。著名的Adpatec公司所出品的AAA-UDMA RAID卡则是全硬RAID的代表之作，其上有专用的高级RAID Co-Processor和Intel 960专用I/O处理器，完全支持RAID 5等级，是目前最高级的IDE-RAID产品。表1 就是典型的软件RAID与硬RAID在行业应用中的比较。

RAID发展至今共有10个主要的等级，下面我们就将依次介绍

RAID-0等级

Striped Disk Array without Fault Tolerance(没有容错设计的条带磁盘阵列）

图中一个圆柱就是一块磁盘（以下均是），它们并联在一起。从图中可以看出，RAID 0在存储数据时由RAID控制器（硬件或软件）分割成大小相同的数据条，同时写入阵列中的磁盘。如果发挥一下想象力，你会觉得数据象一条带子横跨过所有的阵列磁盘，每个磁盘上的条带深度则是一样的。至于每个条带的深度则要看所采用的RAID类型，在NT系统的软RAID 0等级中，每个条带深度只有64KB一种选项，而在硬RAID 0等级，可以提供8、16、32、64以及128KB等多种深度参数。Striped是RAID的一种典型方式，在很多RAID术语解释中，都把Striped指向RAID 0。在读取时，也是顺序从阵列磁盘中读取后再由RAID控制器进行组合再传送给系统，这也是RAID的一个最重要的特点。

RAID-0结构图解

这样，数据就等于并行的写入和读取，从而非常有助于提高存储系统的性能。对于两个硬盘的RAID 0系统，提高一倍的读写性能可能有些夸张，毕竟要考虑到也同时缯加的数据分割与组合等与RAID相关的操作处理时间，但比单个硬盘提高50%的性能是完全可以的。

不过，RAID 0还不能算是真正的RAID，因为它没有数据冗余能力。由于没有备份或校验恢复设计，在RAID 0阵列中任何一个硬盘损坏就可导致整个阵列数据的损坏，因为数据都是分布存储的。下面总结一下RAID 0的特点：

RAID-1等级

Mirroring and Duplexing（相互镜像）

对比RAID 0等级，我们能发现硬盘的内容是两两相同的。这就是镜像——两个硬盘的内容完全一样，这等于内容彼此备份。比如阵列中有两个硬盘，在写入时，RAID控制器并不是将数据分成条带而是将数据同时写入两个硬盘。这样，其中任何一个硬盘的数据出现问题，可以马上从另一个硬盘中进行恢复。注意，这两个硬盘并不是主从关系，也就是说是相互镜像/恢复的。

RAID-1结构图解

RAID 1已经可以算是一种真正的RAID系统，它提供了强有力的数据容错能力，但这是由一个硬盘的代价所带来的效果，而这个硬盘并不能增加整个阵列的有效容量。下面总结一下RAID 1的特点：

RAID-2等级

Hamming Code ECC（汉明码错误检测与修正）

现在我们要接触到RAID系统中最为复杂的等级之一。RAID 2之所以复杂就是因为它采用了早期的错误检测与修正技术——汉明码（Hamming Code）校验技术。因此在介绍RAID 2之前有必要讲讲汉明码的原理。

汉明码的原理：

针对4位数据的汉明码编码示意图汉明码是一个在原有数据中插入若干校验码来进行错误检查和纠正的编码技术。以典型的4位数据编码为例，汉明码将加入3个校验码，从而使实际传输的数据位达到7个（位），它们的位置如果把上图中的位置横过来就是：

注：Dx中的x是2的整数幂（下面的幂都是指整数幂）结果，多少幂取决于码位，D1是0次幂，D8是3次幂，想想二进制编码就知道了

现以数据码1101为例讲讲汉明码的编码原理，此时D8=1、D4=1、D2=0、D1=1，在P1编码时，先将D8、D4、D1的二进制码相加，结果为奇数3，汉明码对奇数结果编码为1，偶数结果为0，因此P1值为1，D8+D2+D1=2，为偶数，那么P2值为0，D4+D2+D1=2，为偶数，P3值为0。这样，参照上文的位置表，汉明码处理的结果就是1010101。在这个4位数据码的例子中，我们可以发现每个汉明码都是以三个数据码为基准进行编码的。下面就是它们的对应表：

从编码形式上，我们可以发现汉明码是一个校验很严谨的编码方式。在这个例子中，通过对4个数据位的3个位的3次组合检测来达到具体码位的校验与修正目的（不过只允许一个位出错，两个出错就无法检查出来了，这从下面的纠错例子中就能体现出来）。在校验时则把每个汉明码与各自对应的数据位值相加，如果结果为偶数（纠错代码为0）就是正确，如果为奇数（纠错代码为1）则说明当前汉明码所对应的三个数据位中有错误，此时再通过其他两个汉明码各自的运算来确定具体是哪个位出了问题。

还是刚才的1101的例子，正确的编码应该是1010101，如果第三个数据位在传输途中因干扰而变成了1，就成了1010111。检测时，P1+D8+D4+D1的结果是偶数4，第一位纠错代码为0，正确。P1+D8+D2+D1的结果是奇数3，第二位纠错代码为1，有错误。P3+D4+D2+D1的结果是奇数3，第三但纠错代码代码为1，有错误。那么具体是哪个位有错误呢？三个纠错代码从高到低排列为二进制编码110，换算成十进制就是6，也就是说第6位数据错了，而数据第三位在汉明码编码后的位置正好是第6位。

那么汉明码的数量与数据位的数量之间有何比例呢？上面的例子中数据位是4位，加上3位汉明码是7位，而2的3次幂是8。这其中就存在一个规律，即2P≥P+D+1，其中P代表汉明码的个数，D代表数据位的个数，比如4位数据，加上1就是5，而能大于5的2的幂数就是3（23=8，22=4）。这样，我们就能算出任何数据位时所需要的汉明码位数：7位数据时需要4位汉明码（24＞4+7+1），64位数据时就需要7位汉明码（27＞64+7+1），大家可以依此推算。此时，它们的编码规也与4位时不一样了。

另外，汉明码加插的位置也是有规律的。以四位数据为例，第一个是汉明码是第一位，第二个是第二位，第三个是第四位，1、2、4都是2的整数幂结果，而这个幂次数是从0开始的整数。这样我们可以推断出来，汉明码的插入位置为1（20）、2（21）、4（22）、8（23）、16（24）、32（25）……

说完汉明码，下面就开始介绍RAID 2等级。

RAID 2等级介绍：

由于汉明码是位为基础进行校验的，那么在RAID2中，一个硬盘在一个时间只存取一位的信息。没错，就是这么恐怖。如图中所示，左边的为数据阵列，阵列中的每个硬盘一次只存储一个位的数据。同理，右边的阵列（我们称之为校验阵列）则是存储相应的汉明码，也是一位一个硬盘。所以RAID 2中的硬盘数量取决于所设定的数据存储宽度。如果是4位的数据宽度（这由用户决定），那么就需要4个数据硬盘和3个汉明码校验硬盘，如果是64位的位宽呢？从上文介绍的计算方法中，就可以算出来，数据阵列需要64块硬盘，校验阵列需要7块硬盘。

在写入时，RAID 2在写入数据位同时还要计算出它们的汉明码并写入校验阵列，读取时也要对数据即时地进行校验，最后再发向系统。通过上文的介绍，我们知道汉明码只能纠正一个位的错误，所以RAID 2也只能允许一个硬盘出问题，如果两个或以上的硬盘出问题，RAID 2的数据就将受到破坏。但由于数据是以位为单位并行传输，所以传输率也相当快。

RAID 2是早期为了能进行即时的数据校验而研制的一种技术（这在当时的RAID 0、1等级中是无法做到的），从它的设计上看也是主要为了即时校验以保证数据安全，针对了当时对数据即时安全性非常敏感的领域，如服务器、金融服务等。但由于花费太大（其实，从上面的分析中可以看出如果数据位宽越大，用于校验阵列的相对投资就会越小，就如上面的4:3与64:7），成本昂贵，目前已基本不再使用，转而以更高级的即时检验RAID所代替，如RAID 3、5等。

现在让我们总结一下RAID 2的特点:

RAID-3等级

Parallel transfer with parity（并行传输及校验）

RAID 2等级的缺点相信大家已经很明白了，虽然能进行即时的ECC，但成本极为昂贵。为此，一种更为先进的即时ECC的RAID等级诞生，这就是RAID 3。

RAID 3是在RAID 2基础上发展而来的，主要的变化是用相对简单的异或逻辑运算（XOR，eXclusive OR）校验代替了相对复杂的汉明码校验，从而也大幅降低了成本。XOR的校验原理如下表：

这里的A与B值就代表了两个位，从中可以发现，A与B一样时，XOR结果为0，A与B不一样时，XOR结果就是1，而且知道XOR结果和A与B中的任何一个数值，就可以反推出另一个数值。比如A为1，XOR结果为1，那么B肯定为0，如果XOR结果为0，那么B肯定为1。这就是XOR编码与校验的基本原理。

RAID 3的结构图如下：

RAID-3结构图解

从图中可以发现，校验盘只有一个，而数据与RAID 0一样是分成条带（Stripe）存入数据阵列中，这个条带的深度的单位为字节而不再是bit了。在数据存入时，数据阵列中处于同一等级的条带的XOR校验编码被即时写在校验盘相应的位置，所以彼此不会干扰混乱。读取时，则在调出条带的同时检查校验盘中相应的XOR编码，进行即时的ECC。由于在读写时与RAID 0很相似，所以RAID 3具有很高的数据传输效率。

RAID 3在RAID 2基础上成功地进行结构与运算的简化，曾受到广泛的欢迎，并大量应用。直到更为先进高效的RAID 5出现后，RAID 3才开始慢慢退出市场。下面让我们总结一下RAID 3的特点：

RAID-4等级

Independent Data disks with shared Parity disk（独立的数据硬盘与共享的校验硬盘）

RAID 3 英文定义是Parallel transfer with parity，即并行传输及校验。与之相比，RAID 4则是一种相对独立的形式，这也是它与RAID 3的最大不同。

RAID-4结构图解

与RAID 3相比，我们发现关键之处是把条带改成了“块”。即RAID 4是按数据块为单位存储的，那么数据块应该怎么理解呢？简单的话，一个数据块是一个完整的数据集合，比如一个文件就是一个典型的数据块。RAID 4这样按块存储可以保证块的完整，不受因分条带存储在其他硬盘上而可能产生的不利影响（比如当其他多个硬盘损坏时，数据就完了）。

不过，在不同硬盘上的同级数据块也都通过XOR进行校验，结果保存在单独的校验盘。所谓同级的概念就是指在每个硬盘中同一柱面同一扇区位置的数据算是同级。在写入时，RAID就是按这个方法把各硬盘上同级数据的校验统一写入校验盘，等读取时再即时进行校验。因此即使是当前硬盘上的数据块损坏，也可以通过XOR校验值和其他硬盘上的同级数据进行恢复。由于RAID 4在写入时要等一个硬盘写完后才能写一下个，并且还要写入校验数据所以写入效率比较差，读取时也是一个硬盘一个硬盘的读，但校验迅速，所以相对速度更快。总之，RAID 4并不为速度而设计。下面我们总结一下RAID 4的特点：

注：主轴同步是指阵列中所有硬盘的主轴马达同步RAID-2结构图解
如果觉得《全面了解RAID》硬盘维修,硬盘故障,硬盘维修教程不错，可以推荐给好友哦。

本文Tags： 电脑维修 - 电脑硬件 - 硬盘维修,硬盘故障,硬盘维修教程,