Skip navigation

Преимущества и недостатъци на RAID 6

Networkworld България - брой 5, 2007 г. / Мнение
За системния администратор
2607 прочитания, 0

Да се избегнат загубите от достъпа до данните при отказ на някой от компонентите помагат различни инструменти и технологии. Много от тях обаче предлагат неголяма производителност, а струват скъпо, затова е добре да разберем техните преимущества и недостатъци.
Резервираният масив от независими дискове (Redundant Array of Independent Disks, RAID) предвижда съхранение на идентични данни на различни места в няколко твърди диска. Най-простият модел е редуване, или RAID 0, който не предлага никакво дублиране. Този модел има голяма производителност, но не и отказоустойчивост. При излизане от строя, макар и на един диск от групата, се губят всички данни.
RAID 5, обратно, предлага комбинация от редуване и контрол на четността (контролната сума). Информацията за данните и контролната сума се разпределят в твърдите дискове по такъв начин, че при отказ на единия диск, намиращите се в него данни с помощта на математическата операция “изключване или” могат да бъдат възстановени на базата на допълнителни сведения за четността, съхраняващи се в останалите дискове. Затова RAID 5 осъществява непрекъсваемо резервиране на всички данни.

Масив RAID 6
RAID 6 представлява разширение на RAID 5. При използване на тази технология даже едновременен отказ на два твърди диска в една група не води до загуба на данни. При RAID 6 за възстановяване на информацията трябва да бъдат проведени две математически операции. Първата е същата като при технологията RAID 5 (“изключващо или” - XOR), а втората изисква наличие на допълнителен твърд диск Q, затова и самата технология се нарича проверка за четността P+Q. Някои производители твърдят, че с въвеждане на технологията RAID 6 — особено при използване на техните собствени реализации на RAID 6 — се отстраняват всички проблеми, свързани с готовността. Действително RAID 6 предлага високо ниво на защита при отказ на два твърди диска, но при много от възможните сценарии на употреба, например в случай на потребителски грешки — тази технология не е оптималното решение за обезпечаване на максимална готовност на данните.
В среди, където се иска осигуряване на висока степен на готовност на данните, RAID 6 може да се разглежда — без да се вземат предвид разходите и влиянието върху производителността — като допълнителна възможност за решаване на отказоустойчивото съхранение. Все пак трябва да се отчитат и недостатъците на RAID 6:

    Преди всичко RAID 6 се разглежда като средство за защита от “отказ на два диска”. Предлагайки максимално ниво на защита при повреда на твърдите дискове (от всички варианти на RAID), тази технология не може да получи широко разпространение, поне засега. Днес малко предприятия са готови да направят допълнителни инвестиции или да се примирят с понижаване на производителността, за да се защитят от сравнително рядката ситуация, когато отказът засегне едновременно два диска;
    Заради ръста в капацитета на твърдите дискове и свързаното с това увеличаване на времето за възстановяване на данни на резервния диск възникват опасения, че при процеса на продължителното възстановяване на първия диск може да откаже и вторият. Тези страхове се засилиха след появата на твърдите дискове SATA (Serial ATA) с голям капацитет. Заради сравнително ниската производителност и голямата вместимост те се нуждаят от по-продължително време за възстановяване от дисковете с интерфейс Fibre Channel. Освен това твърдите дискове SATA се смятат за по-малко надеждни и вероятността за отказ при тях е по-голяма. На практика обаче едновременното спиране на два твърди диска все още е достатъчно рядко събитие. Затова предприятията трябва да помислят дали са готови да направят свързаните с RAID 6 разходи, за да се защитят от малко вероятен сценарий;
    Потенциалното преимущество на RAID 6 се крие в защитата от непоправима грешка при процеса на възстановяване на данни. Най-добрият пример за събития от такъв вид е невъзстановима грешка при четене, която обаче може да бъде открита и поправена преди отказа на твърдия диск, което намалява вероятността от подобен инцидент;
    За разлика от RAID 10 и RAID 5, които се реализират по един и същи начин, независимо от производителя, и вече са се доказали в практиката, за реализация на RAID 6 в системата за съхранение на данни има голям брой възможности и не всички съвпадат. Методите RAID 6 се различават значително при различните производители, точно както производителността и степента на полезност.

Брой поддържани дискове
Реализацията с двойна стойност на четността при RAID 6 понякога ограничава броя на дисковете в системата RAID до просто число. RAID 5 например се поддържа в разпространените на пазара продукти от три до 30 диска в една система и не предявява “претенции” за броя на твърдите дискове в съответствие с предполагаемата област на приложение. Такава възможност устройствата RAID 6 все още не могат да предложат.

RAID 6 в сравнение с другите нива на RAID
В сравнение с RAID 10 и RAID 5 технологията RAID 6 представлява ниво на RAID с най-малка производителност. Макар че при нормални условия скоростта на четене за всички тези нива е горе-долу еднаква, продължителността на записа силно се различава. А при възстановяване, когато системата никога не работи на пълна мощност, разликите стават още по-забележими:
    факултативният процес на запис — както реализацията P+Q, така и DP RAID 6 са с 50% по-бавни от RAID 5 заради допълнителните изчисления и записа на дублираните данни;
    последователните процеси на достъпа — реализацията DP RAID 6 работи по-бавно от RAID 5, а разликата е до 40%. В същото време P+Q RAID 6 е по-бавно от RAID 5 с 10%;
    възстановяването на отделните твърди дискове — технологията P+Q RAID 6 е приблизително толкова бърза, колкото и RAID 5, а DP RAID 6 е най-бавната;
    в случай на приложения, за които голяма роля играе производителността и поддържането є на определено равнище, трябва да знаем какво влияние на този показател ще окаже RAID 6. Заради втория параметър контролна сума конфигурацията RAID 6 провежда повече входно-изходни операции при запис и възстановяване, затова производителността на RAID 6 в такива ситуации се понижава значително в сравнение с RAID 5 и RAID 10;
    потребителите на RAID 5 вече свикнаха с това, че могат да създават системи RAID с всякакви размери. Някои охотно използват конфигурация 4+1 (четири твърди диска с данни на всеки твърд диск по четност), а други предпочитат системи 12+1. Повечето системи поддържат масиви RAID от неголеми (2+1) до крупни (15+1) конфигурации, макар че в редица системи се предлага конфигурация 29+1. RAID 6 с двойна четност често не е в състояние да осигури такова ниво на гъвкавост. Много реализации с двойна четност изискват броят на твърдите дискове в една система RAID да е равен на просто число или — в отделни случаи — просто число минус единица. По този начин размерът на системите RAID се ограничава до пет (три твърди диска с данни и два диска за контрол на четността), седем (5+2), единадесет (9+2), тринадесет (11+2) и т.н.

В случая на RAID 6 с двоен контрол на четността това не е задължително изискване, но когато броят на твърдите дискове в системата RAID не е просто число, е необходимо да се измени методът на изчисляване на четността за вертикалната лента, така че да се поддържа всички възможни размери на групата. Това води до допълнително усложнение на алгоритмите и още по-негативно влияние върху производителността. Реализацията P+Q RAID 6 не налага никакви ограничения по отношение размера на групите и подобно на технологията RAID 5 поддържа добавяне на отделни дискове (n+2).

Как RAID 6 влияе на капацитета?
RAID 6 предлага повече полезен обем от RAID 1, където половината съществуващи ресурси се задействат за осигуряване на контролната сума, но все пак полезният капацитет на RAID 6 е по-малък отколкото при RAID 5. Конфигурация, в която за данните се отделят пет твърди диска, в случай на RAID 5 (5+1) за съхранение на данните за четността се използва 16% от цялото дисково пространство, а при RAID 6 този параметър достига 29%. Освен това добавянето само на един допълнителен диск в системата RAID в конфигурация RAID 6 води до увеличаване на вероятността от отказ на диска със 17%, което води до често провеждане на възстановяването, а и потребителят трябва да се примири още с по-продължителен процес и понижаване на производителността. Доставчиците на решения RAID 6 твърдят, че създаването на големи системи RAID позволява да се съкрати протоколната поддръжка за контрол на четността. Този подход има и подводни камъни, тъй като големите системи RAID са по-уязвими към отказ на дисковете, а тяхното възстановяване отнема много време, което означава продължителна работа с ниска производителност.

Фигура 1
Реализация на RAID 6
И така, как да се реализира RAID 6? Тази технология представлява система с две независими линейни уравнения. По принцип има две възможности за изграждане на RAID 6:
1. Изключително математически подход, при който в две избрани независими системи коефициентите се умножават с данните;
    данните трябва да се избират от различни набори, което във всеки момент по пътя на итерацията на системата може да бъде сведено до едно, макар и сложно уравнение с една променлива.

В повечето класически реализации P+Q се използва първият метод (поле на Галуа) (вж. Фигура 1). Проблем става „простият и бърз“ избор на подходящ множител (полином). Първият полином е много прост: 0x1. По този начин първото уравнение изглежда така, както и при RAID 5:
    данните за четността се съхраняват на твърдия диск Р. Всички съществуващи хардуерни ускорители за RAID 5 ще работят и в този случай. Вторият полином обаче е по-сложен и изисква значителни изчислителни процедури. В всеки случай става дума за операция „изключващо или“ (XOR) с множител, който в RAID 5 не се прилага, но може да бъде получен чрез незначителна модификация на хардуера за функцията XOR.

2. Вторият метод е двоен контрол на четността (Dual Parity, Double Parity) (вж. Фигура 2), когато обикновените „хоризонтални“ полета се комбинират с „вертикални“ редове. Всяка вертикална лента използва не повече от една хоризонтална област от всеки твърд диск. Благодарение на двата различни набора от данни за четността системата RAID може да бъде възстановена при отказ на един или два твърди диска. Данните за четността за хоризонталните и вертикални полета се обработват така, както и в съвременните системи RAID 5 (с помощта на операцията XOR). Но сложните алгоритми за изчисляване на вертикалната четност, както и „нетривиалните“ механизми за обработка на грешките и изключенията водят до това, че такива реализации на RAID 6 работят забележимо по-бавно, отколкото P+Q RAID 6.
Фигура 2
В зависимост от това къде се съхраняват данните, за тяхното възстановяване може да са наложат няколко итерации, минимум три, но често техният брой е равен на квадрата на броя на твърдите дискове. По принцип в система RAID 6 с двоен контрол на четността винаги се предлага удовлетворяващо ниво на производителност, но възстановяването на данните при отказ на два твърди диска води до неприемливо намаляване на производителността. В качеството на страничен допълнителен ефект е възможно дори претоварване на оперативната памет заради адаптера, което още повече понижава производителността. Макар че точно с такива подходи отделните производители се различават, реализацията P+Q се счита за индустриален стандарт, тъй като във всички условия гарантира целостността на данните и висока производителност (вж. Фигура 3). LSI и Intel съвместно са работили над стандартизацията на полинома MDS за спецификация на формата на диска за данни (Disk Data Format, DDF), с който се занимава Индустриалната асоциация на мрежовите системи за съхранение на данни (Storage Networking Industry Association, SNIA). Тази спецификация вече е регистрирана в Международния комитет по стандартите на информационните технологии (International Committee for Information Technology Standards, INCITS). Стандартите за реализация на DP не съществуват, затова системите на различните производители се отличават доста една от друга.

Фигура 3
Как се използва RAID днес?
RAID 1 и RAID 5 са проверени технологии и всички производители ги реализират по един и същи начин. Те се използват в производствени системи за съхранение на данни повече от 15 г. Специалистите знаят как се реализират тези равнища на RAID и по какъв начин в такива конфигурации и решения се постига оптимална производителност, капацитет и отказоустойчивост. Що се отнася до RAID 6, то това е сравнително „млада“ технология и подходите за нейната употреба са доста различни.
Постоянната готовност на данните има решаващо значение за успешната работа на предприятията. Затова системите за съхранение на данни трябва да притежават голям брой функции, за да предлагат висока степен на отказоустойчивост. С помощта само на един инструмент няма да постигнете тази цел. Изграждането на система за съхранение на данните с висока отказоустойчивост е възможно само при наличие на стратегическа комбинация от редица инструменти, функции и възможности на конфигурацията.
(01.11.2007)

КОМЕНТАРИ

Трябва да сте регистриран потребител, за да коментирате статията
"Преимущества и недостатъци на RAID 6"



    

© Ай Си Ти Медиа ЕООД 1997 - 2012 съгласно общи условия за ползване