Расчет надежности одного диска



_________________________

МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ

(НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ)

 

 

“ УПРАВЛЕНИЕ ДАННЫМИ И оБЛАЧНЫЕ ТЕХНОЛОГИИ ”

ЛАБОРАТОРНЫЕ РАБОТЫ

Алещенко А.С.

 

 

Москва

2017


Лабораторная работа №1

Выбор  уровня RAID

Массивы RAID (Redundant Array of Independent Disks) были разработаны в целях повышения надежности хранения данных, увеличения скорости работы с дисками и для обеспечения возможности объединения нескольких дисков в один большой диск. Разные типы RAID решают разные задачи, здесь мы рассмотрим несколько наиболее распространенных конфигураций RAID массивов из одинаковых по размеру дисков.

Возможна реализация RAID программным или аппаратным обеспечением. Аппаратная реализация RAID представлена специальными аппаратными контроллерами для хоста или массива. RAID-контроллер выполняет следующие основные функции:

- управление группами дисков и их контроль,

- перевод запросов на ввод/вывод между логическими и физическими дисками,

- восстановление данных при сбоях дисков.

 

Целью данной работы является показать реальные результаты работы RAID контроллеров в зависимости от уровня RAID и количества дисков.

Теория

Уровни Raid

RAID-уровни формируются на базе технологий распределения, зеркалирования и контроля четности. Выбор уровня RAID определяется требованиями к производительности приложения и доступности данных.

Распределение – это технология, повышающая быстродействие RAID-массива.

Зеркалирование – это технология, основанная на создании двух копий данных на двух разных дисках, что позволяет быстро восстанавливать данные после поломки диска.

Контроль четности – это метод защиты распределенных данных от выхода из строя дисков, позволяющий избежать дорогостоящего зеркалирования. Контроль четности уменьшает  объем дополнительного места на диске, но снижает быстродействие RAID-контроллера, т.к. контрольные суммы вычисляются при каждом изменении данных.

Рассмотрим основные уровни RAID и их особенности:

Уровень RAID Описание Плюсы Минусы
RAID0 он же Stripe При отказе одного диска из 2х теряются все данные. Быстрый Нет резервирования
RAID1 он же Mirror При отказе одного диска массив работает, на втором – копия Быстрое восстановление Низкая производительность, Полезная емкость=50% от общей
RAID1E При отказе одного диска массив работает исправно. Высокая производительность Полезная емкость=50% от общей
RAID5 При отказе одного диска массив работает с сильно пониженной производительностью Экономичность (полезная емкость на один диск меньше общей), приемлемая производительность Долгий процесс восстановления данных
RAID5EE При сбое физического диска в составе массива данные сбойного диска реконструируются. Относительно быстрое восстановление данных. Полезная емкость на два диска меньше общей. Требует специального контроллера
RAID10 При отказе одного диска массив работает исправно. Высокая производительность, низкое время восстановления данных Полезная емкость=50% от общей
RAID50 При отказе одного диска массив работает исправно. Довольно высокая производительность высокая стоимость и сложность организации, долгий процесс восстановления данных
RAID60 Отазоустойчивость – 2 диска очень высокая надёжность высокая стоимость и сложность организации

 

Рассмотрим организацию RAID различных уровней подробнее

RAID 0

  • RAID 0 (Stripe). Режим, при использовании которого достигается максимальная производительность. Данные равномерно распределяются по дискам массива, диски объединяются в один, который может быть размечен на несколько. Распределенные операции чтения и записи позволяют значительно увеличить скорость работы, поскольку несколько дисков одновременно читают/записывают свою порцию данных. Пользователю доступен весь объем дисков, но это снижает надежность хранения данных, поскольку при отказе одного из дисков массив обычно разрушается и восстановить данные практически невозможно. Область применения - приложения, требующие высоких скоростей обмена с диском, например видеозахват, видеомонтаж. Рекомендуется использовать с высоконадежными дисками.

RAID 1

  • RAID 1 (Mirror). Несколько дисков (обычно 2), работающие синхронно на запись, то есть полностью дублирующие друг друга. Повышение производительности происходит только при чтении. Самый надежный способ защитить информацию от сбоя одного из дисков. Из-за высокой стоимости обычно используется при хранении очень важных данных. Высокая стоимость обусловлена тем, что лишь половина от общей емкости дисков доступна для пользователя.

RAID 10

  • RAID 10, также иногда называется RAID 1+0 - комбинация двух первых вариантов. (Массив RAID0 из массивов RAID1). Имеет все скоростные преимущества RAID0 и преимущество надежности RAID1, сохраняя недостаток - высокую стоимость дискового массива, так как эффективная ёмкость массива равна половине ёмкости использованных в нём дисков. Для создания такого массива требуется минимум 4 диска. (При этом их число должно быть чётным).
  • RAID 0+1 - Массив RAID1 из массивов RAID0. Фактически не применяется из-за отсутствия преимуществ по сравнению с RAID10 и меньшей отказоустойчивости.

RAID 1E

  • RAID 1E - Похожий на RAID10 вариант распределения данных по дискам, допускающий использование нечётного числа дисков (минимальное количество - 3)
  • RAID 2, 3, 4 - различные варианты распределенного хранения данных с дисками, выделенными под коды четности и различными размерами блока. В настоящее время практически не используются из-за невысокой производительности и необходимости выделять много дисковой емкости под хранение кодов ЕСС и/или четности.

RAID 5

  • RAID 5 - массив, также использующий распределенное хранение данных аналогично RAID 0 (и объединение в один большой логический диск) + распределенное хранение кодов четности для восстановления данных при сбоях. Относительно предыдущих конфигураций размер Stripe-блока еще больше увеличен. Возможно как одновременное чтение, так и запись. Плюсом этого варианта является то, что доступная для пользователя емкость массива уменьшается на емкость лишь одного диска, хотя надежность хранения данных ниже, чем у RAID 1. По сути, является компромиссом между RAID0 и RAID1, обеспечивая достаточно высокую скорость работы при неплохой надежности хранения данных. При отказе одного диска из массива данные могут быть восстановлены без потерь в автоматическом режиме. Минимальное количество дисков для такого массива - 3.
    "Программные" реализации RAID5, встроенные в южные мосты материнских плат, не отличаются высокой скоростью записи, поэтому годятся далеко не для всех применений.

RAID 5EE

  • RAID 5EE - массив, аналогичный RAID5, однако кроме распределенного хранения кодов четности используется распределение резервных областей - фактически задействуется жесткий диск, который можно добавить в массив RAID5 в качестве запасного (такие массивы называют 5+ или 5+spare). В RAID 5 массиве резервный диск простаивает до тех пор, пока не выйдет из строя один из основных жестких дисков, в то время как в RAID 5EE массиве этот диск используется совместно с остальными HDD все время, что положительно сказывается на производительность массива. К примеру, массив RAID5EE из 5 HDD сможет выполнить на 25% больше операций ввода/вывода за секунду, чем RAID5 массив из 4 основных и одного резервного HDD. Минимальное количество дисков для такого массива - 4.

RAID 6

  • RAID 6 - аналог RAID5 c большим уровнем избыточности - информация не теряется при отказе двух любых дисков, соответственно, общая ёмкость массива уменьшается на ёмкость двух дисков. Минимальное количество дисков, необходимое для создания массива такого уровня - 4. Скорость работы в общем случае примерно аналогична RAID5. Рекомендуется для применений, где важна максимально высокая надёжность.

RAID 50

  • RAID 50 - объединение двух(или более, но это крайне редко применяется) массивов RAID5 в страйп, т.е. комбинация RAID5 и RAID0, частично исправляющая главный недостаток RAID5 - низкую скорость записи данных за счёт параллельного использования нескольких таких массивов. Общая ёмкость массива уменьшается на ёмкость двух дисков, но, в отличие от RAID6, без потери данных такой массив переносит отказ лишь одного диска, а минимально необходимое число дисков для создания массива RAID50 равно 6. Наряду с RAID10, это наиболее рекомендуемый уровень RAID для использования в приложениях, где требуется высокая производительность в сочетании с приемлемой надёжностью.

RAID 60

  • RAID 60 - объединение двух массивов RAID6 в страйп. Скорость записи повышается примерно в два раза, относительно скорости записи в RAID6. Минимальное количество дисков для создания такого массива - 8. Информация не теряется при отказе двух дисков из каждого RAID 6 массива.
  • Matrix RAID — технология, реализованная фирмой Intel в своих южных мостах, начиная с ICH6R, позволяющая организовать всего на двух дисках несколько массивов RAID0 и RAID1, одновременно создавая разделы как с повышенной скоростью работы, так и с повышенной надёжностью хранения данных.
  • JBOD (От английского "Just a Bunch Of Disks")- последовательное объединение нескольких физических дисков в один логический, не влияющее на производительность (надёжность при этом падает аналогично RAID0), при этом диски могут иметь разные размеры. В настоящее время практически не применяется.

Расчет надежности одного диска

Традиционно производители указывают параметр MTBF – среднее время между отказами.

Например, для диска WD Caviar Blue указан параметр MTBF=650 000 часов. Довольно большой срок, но это не значит, что среднее время работы диска составит 74 года. Это статистический параметр и в практических целях проще использовать вероятность отказа, которая связана с MTBF.

Годовая вероятность отказа AFR – вероятность, с которой диск выйдет из строя в течение года.

Вычисление AFR из MTBF – производится по формуле:

где OT – время работы диска в течении года. В этой работе предполагаем, что массив работает круглосуточно, то есть OT=24*365=8760 (число часов в году).

Типичные MTBF для жестких дисков в сотни раз больше, чем 8760. Поэтому формулу для вычисления AFR можно упростить, пользуясь разложением степенной функции в ряд Тейлора.

AFR=8760/MTBF – этой формулой мы и будем пользоваться для вычислений.

Возвращаясь к примеру с диском WD Caviar Blue, AFR для него равна 1,3%. Это можно трактовать так: если в организации 100 дисков, то раз в год один придется менять.

Надежность RAID

Пользуясь теорией вероятности, вычислим AFR(RAID) – годовую вероятность отказа для RAID массивов исходя из AFR одного диска, которую и обозначим как AFR:

  1. AFR0 = AFR (RAID0) = 2*(1-AFR)*AFR+AFR2 = 2*AFR-AFR2
  2. AFR1 =AFR (RAID1) = AFR2
  3. AFR (RAID10) = AFR0(AFR1) = 2*AFR2 – AFR4 =~ 2*AFR2
  4. AFR5 = AFR (RAID5) = 1 — (N*AFR*(1-AFR)(N-1) + (1-AFR)N) =~=~ 1/2*N*(N-1)*AFR2 — 1/3*N*(N-1)*(N-2)*AFR3 ,

где N – число дисков в массиве (от 3 до 16)

  1. AFR (RAID50) = 2*AFR5 – AFR52 =~ N*(N-1)*AFR2

Для примера с WD Caviar Blue вычислим вероятность того, что массив выйдет из строя и все данные будут утеряны:

  • AFR(RAID0) = 2.7%
  • AFR(RAID1) = 0.02%
  • AFR(RAID10) = 0.04%
  • AFR(RAID5 из 3х дисков) = 0.05%
  • AFR(RAID5 из 5и дисков) = 0.18%
  • AFR(RAID5 из 8и дисков) = 0.48%

Заметим, что AFR(RAID5 из 16и дисков) = 1.9% —выше, чем у исходного диска.


Дата добавления: 2018-04-15; просмотров: 1415; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!