Виды и процесс создания RAID массивов

Пришла пора разобраться в современных технологиях хранения данных. Повестка дня: RAID массивы и уровни их организации. Правда ли, что RAID 50 лучше RAID 10, а JBOD – это вообще не RAID? Сегодня мы ищем ответы на эти вопросы.

RAID-контроллеры: аппаратные и не очень 

По исполнению контроллеры делятся на программные и аппаратные. Программные реализуются непосредственно средствами операционной системы или на уровне материнской платы. Последние также известны как интегрированные, а также Fake-RAID. Они работают быстрее чисто софтверных решений за счет специального чипа для управления массивом.  Недавно публиковался текст о развертывании таких технологий. Дополнительной железки при этом никакой нет и в любом случае будут использоваться ресурсы вычислительной машины.

Аппаратные RAID-контроллеры выполняются в форм-факторе платы PCIe либо  в составе внешнего автономного устройства — дискового массива.

Они имеют на борту собственные процессор, память, BIOS и специальный интерфейс для конфигурации. Платы PCIe также комплектуются дополнительными модулями, сохраняющими данные, если произойдет сбой в электропитании: BBU с Li-Ion аккумулятором и ZMCP на базе суперконденсатора.

Оба модуля позволяют сделать сэйв содержимого кэша. После восстановления работы эти данные будут немедленно записаны на диск. Дисковый массив, будучи автономным, располагает собственными блоком питания и системой охлаждения.

Накопители подключаются к плате либо кабелями напрямую, либо через платы расширения. Автономные дисковые массивы содержат все накопители внутри себя, а наружу смотрит все тот же интерфейс PCIe (есть и другие варианты, например, USB 3.2 и Thunderbolt 3). Кстати, известный вид дисковых массивов — сетевое хранилище данных (NAS).

Что такое RAID-массив?

Что такое RAID массив, и почему он вам нужен

RAID (англ. Redundant Array of Independent Disks — избыточный массив независимых дисков) — технология виртуализации данных, которая объединяет несколько дисков в логический элемент для повышения производительности. Соответственно, минимальное количество требуемых дисков — 2, но может потребоваться и больше. Всё зависит от того, какой именно массив вам нужен и для чего.

Как работает RAID массив

Принцип работы RAID состоит в том, что технология позволяет размещать данные, например, одного приложения сразу на нескольких дисках. А операции ввода и вывода обрабатываются общими усилиями так, что повышается суммарная производительность.

Дополнительный бонус технологии — повышенная отказоустойчивость, вызванная более высоким объемом памяти. Таким образом, шанс потерять личные файлы стремительно падает.

RAID массив отображается в интерфейсе компьютера как один логический диск. Тем не менее принцип его работы может быть разным: зеркальным и чередующим. Зеркальный метод подразумевает копирование идентичных данных на несколько дисков, а чередующий позволяет равномерно распределять информацию по ним. Зеркалирование и чередование дисков могут быть объединены в одном массиве.

Любая технология имеет свои сильные и слабые стороны. Давайте рассмотрим возможности и недостатки RAID подробнее.

RAID 0

Что такое RAID массив, и почему он вам нужен

Принцип работы — striping (чередование). Массив при котором информация разбивается на одинаковые по длине блоки, а затем записывается поочерёдно на каждый диск в структуре. Основное предназначение такой системы — фактическое увеличение производительности в 2 раза, при этом вам будет доступен полный объем всех дисков.

Можно использовать неограниченное количество дисков. В случае если диски обладают разными показателями скорости, то конечный результат будет высчитываться по самому медленному HDD. Позволяет объединять диски любого объема. Например, 320 Гбайт + 1 Тбайт + 3 Тбайт — будут функционировать должным образом.

  • Как разделить жесткий диск и создать несколько разделов: пошаговая инструкция

Приведем несколько примеров, чтобы нагляднее объяснить эти принципы.

Предположим у вас есть два диска со скоростью записи в 200 Мбайт/c и объемом 1000 Гбайт. Создав RAID 0, вы получите скорость записи 400 Мбайт/c и 2000 Гбайт свободного места. То есть вы как бы увеличиваете производительность за счет распределения задач между всеми участниками системы.

Если же один из дисков при этом будет 500 Гбайт, а другой 1000 Гбайт, то под ваши нужды останется всё те же 1500 Гбайт.

Самый рациональный вариант применения данной технологии — это если вы имеете жесткие диски, одинаковые по техническим характеристикам. Имеет значение интерфейс подключения. Скажем, два диска, подключенные к SATA 1 и SATA 3 будут оба работать на скорости самого медленного канала.

Однако, такая схема не лишена и минусов. Помимо сложностей с техническими характеристиками, вы можете с легкостью потерять все свои данные, если хотя бы один винчестер выйдет из строя. Из-за того, что информация разбивается и записывается параллельно на два диска, один файл может лежать одновременно на двух или более носителях. Если же такая система построена из 4 «винтов», то поломка даже одного — это неизбежный крах всей хранящейся информации. Поэтому не забывайте о бэкапах, если пользуетесь RAID 0.

Преимущества

Высокая производительность

Недостатки

Низкая надежность
Сложность подбора дисков с одинаковыми характеристиками

Почему так сложилось в общем и целом

Ну судите сами, — процессоры обзаводятся ядрами, частотами, кэшем и архитектурой; видеокарты, — числом пиксельных конвейеров, количеством и разрядностью памяти, шейдерными блоками, частотами видеопроцессоров и кое-где даже количеством этих процессоров; оперативная память, — частотами и таймингами.

Жесткие диски же растут разве что в объеме ибо скорость оборота головки оных (за исключением редких моделей типа Raptor‘ов) замерла уже довольно давно на отметке в 7200, кэш тоже не то чтобы растет, архитектура остается почти прежней.

В общем в плане производительности диски стоят на месте (ситуацию могут спасти разве что развивающиеся SSD), а ведь они играют весомую роль в работе системы и, местами, полновесных приложений.

В случае же построения единичного (в смысле за номером 1) рейда Вы чуток потеряете в производительности, но зато получите некую ощутимую гарантию безопасности Ваших данных, ибо оные будут полностью дублироваться и, собственно, даже в случае выхода из строя одного диска, — всё целиком и полностью будет находится на втором без всяких потерь.

В общем, повторюсь, рейды будут полезны всем и каждому. Я бы даже сказал, что обязательны

:)

к содержанию ↑

RAID 1E

Похожий на RAID10 вариант распределения данных по дискам, допускающий использование нечётного числа дисков (минимальное количество — 3)

Негативные стороны применения RAID массивов

Высокая стоимость.
Помимо обычных RAID массивов существуют и гибридные, “Nested” массивы. Они могут содержать, например RAID 1+0, 0+3 и другие комбинации. Стоимость таких устройств ощутимо выше и может ударить по карману.

Риск цепного самоуничтожения.
Несмотря на то, что RAID массивы надежны и шанс повреждения дисков довольно низок, всегда есть вероятность старта цепной реакции “смерти”. Например, если один из дисков вышел из строя, вполне вероятно, что и другие тоже скоро постигнут его участь. Обратите внимание, что такие риски существуют только при полном отказе. Пара битых секторов должны вас насторожить, но не должны вгонять в панику.

https://www.starusrecovery.ru/downloads#partitionhttps://www.starusrecovery.ru/downloads#partition

https://www.starusrecovery.ru/downloads#partition

Особенности производства.
Некоторые уровни RAID, например RAID 1 и 5, могут выдержать отказ только одного диска. И все остальные устройства в массиве находятся в серьезной опасности до тех пор, пока поврежденный диск не будет заменен новым.

RAID 1

Принцип работы — mirroring («зеркалирование»). Самая простая система RAID-массивов из всех возможных. Представляет собой параллельную запись информации с основного диска на другие — дублирующие. Производительность при этом никак не изменяется. Имеет широкое применение в серверном обслуживании, потому что в случае выхода из строя одного из накопителей, все продублированные данные остаются на других носителях. При этом вам будет доступен объем лишь одного винчестера.

Предположим у вас есть 3 диска по 500 Гбайт каждый. Из 1500 Гбайт вам останется лишь 500 Гбайт. В общем, предназначение таких систем — резервация и клонирование информации. Есть смысл использовать диски с высокой скоростью (7200 об/мин) — например, такой:.

RAID 1 часто используют в корпоративной сфере, где потеря информации может обернуться серьезными убытками. 

Преимущества

Высокая надежность

RAID 1, что это такое?

RAID_1Массив RAID 1, его еще называют Mirroring – зеркало. Если говорить о недостатке, то в RAID 1 объем одного из жестких дисков вам как-бы «недоступен», потому что, он используется для дублирования первого диска. В RAID 0 это место доступно.

Из преимуществ, как вы, наверное, уже догадались, следует, что массив предоставляет высокую надежность данных, то есть, если выйдет из строя один диск, все данные останутся на втором. Выход из строя сразу двух дисков маловероятен. Такой массив часто используется на серверах, но это не мешает использовать его и на обычных компьютерах.

Если вы выбрали RAID 1, то знайте, что производительность упадет, но если данные вам важны, то используйте данных подход.

RAID 5

Представляет собой дальнейшие развитие идеи, заложенной в типе 3. Разница заключается в том, что хранение контрольных сумм происходит на тех же дисках где и данные. Таким образом все накопители в массиве имеют одинаковую нагрузку и появляется возможность выполнения параллельных операций, что обеспечивает более высокую скорость работы. К недостаткам можно отнести более медленную работу в режиме записи в произвольном порядке по сравнению с RAID 0 (RAID 10).

Схема raid 5

Уровни RAID массивов

Устройства RAID бывают нескольких типов, но все они классифицируются как “уровни”. Ранее список таких уровней находился в диапазоне от 0 до 5. Такая пронумерованная система позволяла IT-специалистам различать типы массивов, с которыми они имеют дело. С тех пор количество уровней было расширено и разбито на категории: стандартные, вложенные и нестандартные.

Уровни RAID

Разобравшись с основными конструктивными особенностями RAID-контроллеров, перейдем к главной характеристике — поддержке уровней RAID. В подавляющим большинстве контроллеры работают с уровнями 0, 1, 1E, 10, 5, 5EE, 50, 6, 60. Другие занесены в красную книгу и на практике встречаются редко. Простейшие программные контроллеры позволяют создать RAID 0 и 1. Более продвинутые добавляют RAID 10 и 5. В аппаратных, как правило, такой перечень  минимален, и многие платы поддерживают весь спектр уровней. Рассмотрим подробнее каждый из них.

Несколько важных нюансов для понимания эффективных объема и быстродействия, получаемых в результате объединения в массив:

  • при использовании накопителей разного объема контроллер «обрезает» объем каждого из них до наименьшего из используемых. Если у вас есть много дисков 4 ТБ и один 2 ТБ, то в массиве все диски будут восприниматься как 2 ТБ;
  • при использовании накопителей с разными скоростями ввода/вывода и задержками, то операции доступа будут осуществляться с наихудшими из всех параметров. Другими словами, самым быстрым дискам придется ждать, пока отработает самый медленный.

RAID 0

Единственный массив, который не совсем оправдывает название, поскольку не обладает избыточностью. При этом скорость и эффективный объем максимальны. Данные разбиваются на одинаковые блоки, равномерно записываемые на все диски по очереди. Эти блоки называются страйпами, отсюда и сам RAID 0 часто именуют страйпом. Считывание данных также происходит параллельно. Здесь конечно же есть свое но.

Дело в том, что прирост производительности не прямо пропорционален количеству дисков (как хотелось бы). В силу специфики накопителей, особенно механических, выигрыш в конфигурации RAID 0 хорошо заметен только на операциях последовательного чтения. Другими словами, при работе с большими файлами. Типичная область применения — игры, видеомонтаж и рендеринг. При условии, что регулярно производится резервирование на сторонние накопители. Наряду с этим при случайном доступе к файлам разница с отдельно взятым диском уже не так ощутима. Более позитивная картина наблюдается в случае твердотельных накопителей, но они и так удовлетворяют большинству запросов по быстродействию.

В общем, в современных реалиях RAID 0 далеко не всегда оправдает свое применение, а основная задача RAID-массива все же в повышении надежности хранения данных.

Обратная сторона медали за скорость как раз в отсутствии избыточности, что означает нулевую отказоустойчивость. В случае сбоя хотя бы одного из элементов массива, восстановление всего содержимого практически невозможно.

RAID 1

RAID 1, известный как «зеркало», представляет собой другую крайность. Он максимально избыточен — в нем производится 100 % дублирование данных. Этот процесс «съедает» ровно половину объема массива. Число дисков в нем, соответственно, четное. Позволяет увеличить скорость чтения, но синхронная скорость записи в некоторых случаях падает. При отказе одного из дисков работа автоматически продолжается с дублером. Если доступна функция горячей замены дисков, то восстановление штатного режима происходит без остановки. RAID 1 идеален для чувствительных данных.

RAID 5

Состоит минимум из трех накопителей, при этом доступный объем уменьшается на один. Данные записываются в страйпы на все диски кроме одного, на котором размещается контрольная сумма этой части данных. Запись этого блока также чередуется между всеми накопителями, распределяя равномерную нагрузку. Если их больше четырех, то скорость чтения будет выше чем в RAID 1, но запись будет осуществляться медленнее. Контрольные суммы позволяют достать информацию в случае выхода из строя одного из элементов. Сама операция восстановления вызывает повышенную нагрузку на оставшиеся диски. Значительно падает производительность и риск утери всех данных в случае отказа еще одного диска. Желательно иметь опцию горячей замены для оперативного возвращения в нормальный режим работы.

Со всеми плюсами и минусами эти три уровня наиболее распространены и просты в развертывании.

RAID 6

Развитие RAID 5 по части надежности, позволяющее пережить потерю двух дисков. В данной конфигурации в каждом проходе пишется две независимые контрольные суммы на два накопителя. Требуется минимум четыре диска, из которых два уйдет на описанный алгоритм повышения отказоустойчивости. При этом скорость записи будет еще ниже, чем у RAID 5.

Следующие уровни — производные и комбинации перечисленных.

RAID 10

Неплохо было бы объединить достоинства RAID 0 (производительность) и RAID 1 (отказоустойчивость)? Встречайте RAID 10: страйп и зеркало, два в одном. Но и недостатки не забудьте — по-прежнему половина объема уходит на резерв. А что делать, за надежность приходится платить. В этом плане менее экономичен, чем RAID 5 И RAID 6, но более прост в восстановлении после сбоя.

RAID 50

По похожей схеме получаем RAID 50. Здесь уже страйпы не зеркалируются, а распределяются по двум и более массивам RAID 5. Требуется от шести дисков, скорость чтения значительно увеличивается. Кроме того, нивелируется и слабое место RAID 5 и RAID 6 — низкая скорость записи. Отрицательная сторона опять лежит в плоскости экономики. Из эффективного объема выпадают два диска, как и RAID 6, при этом массив выдержит потерю только одного.

RAID 60

Данный гибрид RAID 0 и RAID 6 призван решить проблему производительности последнего. Отказоустойчивость остается на том же уровне, как и часть объема накопителей, отводимая на реализацию алгоритмов контроля целостности данных. Дисков для такого удовольствия понадобится как минимум восемь.

RAID 1E

Еще одна вариация совмещения алгоритмов зеркалирования и чередования данных. Записанные на одной итерации страйпы повторно записываются на следующей, но в обратном порядке. Таким образом в RAID 1E можно использовать три диска. Массив останется тем же зеркалом с эффективным объемом, равным половине от исходного.

RAID 5EE

Один из вариантов использования RAID 5 с резервным диском. Отличается тем, что этот диск не простаивает до выхода из строя одного из элементов массива, а используется наряду с другими. На каждой итерации помимо страйпов данными и контрольной суммой записывается резервный блок. Сделано это для ускорения процесса сборки массива в случае нештатной ситуации. Платой за такую опцию становится второй диск, исключаемый из эффективного объема RAID 5EE.

В таблице ниже приведены сравнительные характеристики рассмотренных уровней RAID.

Не забудем и про массив с незатейливым названием JBOD (дословно переводится как «просто связка дисков»). Строго говоря, он не является RAID-массивом. Это объединенные в один несколько дисков без дополнительной функциональности. Позволяет развернуть логический диск с объемом, который недоступен в рамках одного накопителя. Такой диск полезен для перемещения файлов больших размеров в несколько терабайт.

Вместо заключения напомним самое главное правило для всех, кто хранит данные в RAID-массиве: RAID-массив ≠ бэкап! Регулярно делайте резервные копии данных на независимые носители и да пребудет с вами сила.

RAID 0 — что это и с чем его едят?

И так.. RAID 0 (он же, страйп («Striping»)) — используется от двух до четырех (больше, — реже) жестких дисков, которые совместно обрабатывают информацию, что повышает производительность. Чтобы было понятно, — таскать мешки одному человеку дольше и сложнее чем вчетвером (хотя мешки остаются все теми же по своим физ свойствам, меняются лишь мощности с ними взаимодействующие). Программно же, информация на рейде такого типа, разбивается на блоки данных и записывается на оба/несколько дисков поочередно.

Один блок данных на один диск, другой блок данных на другой и тд. Таким образом существенно повышается производительность (от количества дисков зависит кратность увеличения производительности, т.е 4-ые диска будут бегать шустрее чем два), но страдает безопасность данных на всём массиве. При выходе из строя любого из входящих в такой RAID винчестеров (т.е. жестких дисков) практически полностью и безвозвратно пропадает вся информация.

RAID

Почему? Дело в том, что каждый файл состоит из некоторого количества байт.. каждый из которых несет в себе информацию. Но в RAID 0 массиве байты одного файла могут быть расположены на нескольких дисках. Соответственно при «смерти» одного из дисков потеряется произвольное количество байтов файла и восстановить его будет просто невозможно. Но файл то не один.

В общем при использовании такого рейд-массива настоятельно рекомендуется делать постоянные бэкапы ценной информации на внешний носитель. Рейд действительно обеспечивает ощутимую скорость — это я Вам говорю на собственном опыте, т.к у меня дома уже годами установлено такое счастье.

к содержанию ↑

RAID 1 — что такое и с чем его едят?

Что же до RAID 1 (Mirroring — «зеркало»).. Собственно, начну с недостатка. В отличии от RAID 0 получается, что Вы как бы «теряете» объем второго жесткого диска (он используется для записи на него полной (байт в байт) копии первого жесткого диска в то время как RAID 0 это место полностью доступно).

Преимущество же, как Вы уже поняли, в том, что он имеет высокую надежность, т.е все работает (и все данные существуют в природе, а не исчезают с выходом из строя одного из устройств) до тех пор пока функционирует хотя бы один диск, т.е. если даже грубо вывести из строя один диск — Вы не потеряете ни байта информации, т.к. второй является чистой копией первого и заменяет его при выходе из строя. Такой рейд частенько используется в серверах в силу безумнейшей жизнеспособности данных, что важно.

При подобном подходе в жертву приносится производительность и, по личным ощущениям, оная даже меньше чем при использовании одного диска без всяких там рейдов. Впрочем, для некоторых надежность куда важнее производительности.

к содержанию ↑

Будущее RAID массивов

RAID по прежнему находит себе применение, даже не смотря на то, что аналитики утверждают о несовременности данной технологии. Существуют альтернативы, которые предлагают большую защиту данных и были разработаны специально для устранения слабых мест RAID.

Более того, рост числа твердотельных накопителей (SSD) так же работает не в пользу RAID массивов. Суть в том, что они не содержат движущихся частей и практически не подвержены разного рода повреждениям. Тем не менее, ситуация приятно меняется, если жесткие диски массива взять и заменить на SSD. В таком случае вы сможете добиться выравнивания износа и все диски проживут приблизительно один срок.

Существует огромное количество носителей для хранения информации, но еще не было ни одного устройства, способного обойти по объемам RAID массивы. Эти гиганты и по сей день могут сослужить отличным хранилищем личной информации.

Источник: www.starusrecovery.ru

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: