126

Дисковые пространства: обработка чрезвычайных ситуаций

Так случается, что во время работы информационной системы, происходит сбой. Дисковый массив не исключение. В зависимости от выбранных дисков, их износа, степени нагрузки, везения и хуй его знает чего приходит он:

Фото не с просторов. Произошло у меня вчера на компьютере, где жена сидит. Пока писал пост про отказоустойчивое хранилище, навернулся диск. Благодаря отказоустойчивости у меня есть время рвать на попе волоса и срочно искать диск на замены. В противном случае, было-бы поздно что-то делать.


Предыдущие статьи по теме:

Дисковые пространства Windows 10 1803

Дисковые пространства: начало работы


Давайте рассмотрим несколько аварийных ситуаций и посмотрим на поведение Storage Spaces в разных сценариях.


Отключение одного диска.


Мы имеем дисковый пул и на нем размещено все четыре вида тома: простой, двухстороннее зеркало, трехстороннее зеркало и четность.

Один диск из пяти выше отключен.

Тома четность, двухстороннее и трехсторонние зеркала перешли в состояние "предупреждение". Зеркальные тома продолжают нормально функционировать, четность работает очень медленно даже на чтение.

Обратите внимание на простой том. Система разрешает просмотреть файлы на нем. Сейчас произошел случай уникальный в том плане, что данные простого тома не находились на вышедшем из строя диске.

Отключение двух дисков из пяти. Хотели жести? Держите. Из пяти дисков осталось три. Мы видим, что система разрешает просмотр файлов на томах. Повторюсь, это происходит из-за малого заполнения томов. Данные всё ещё доступны. Трехстороннее зеркало доступно на запись.

Выход из строя трех дисков


Давайте больше жести! Третий диск отключен. Тома перешли в состояние ошибки, данные недоступны для чтения.

Восстановление целостности. Давайте рассмотрим варианты выхода из сложившихся ситуаций:

- Если мы отключили диски намеренно или случайно, вернем их системе.

- Если диск вышел из строя, добавляем новый. Затем удаляем старый.

- А теперь самое интересное: если для виртуальных томов есть запас по количеству дисков, можно перестроить массив, не добавляя новых дисков и исключив сбойный.


Для этого количество дисков должно быть следующее:

- Двухстороннее зеркало > 2 дисков

- Трехстороннее > 5 дисков

- Четность > 3 Дисков.


Давайте вернем в систему - начнется синхронизация, данные стали доступны.

Относительно замены диска на исправный. Процедура скучная и описана в предыдущей заметке. Сначала диск добавляем, потом удаляем старый. При удалении диска выдает ошибку, но диск удаляет.

Сначала добавляем новый диск.

Выбираем диск для добавления.

После окончания оптимизации (но можно в данном случае и без неё) подготавливаем диск к удалению.

Систему выдает ошибку, но мы продолжаем.

Окончательно удаляем диск.

А теперь моё любимое. Представьте себе ситуацию: вышел из строя диск. Виртуальные тома в состоянии "предупреждение". Данные в опасности, но запасного диска нет.

Важный момент. Если дисков на один больше, чем требует избыточность и свободного пространства пула достаточно, будет активна команда "удалить" напротив сбойного диска.

Помните первую статью? Суммарный объем томов может быть больше объема пула. При нехватке места можно будет добавить диски. Но это будет потом, а делать надо уже сейчас.

Следите за рукой.

Диск вышел из строя

Начинаем удаление сбойного диска.

Начинается перестройка пула.

Удаляем диск.

Вжух! Готово!

Баянометр клинит.

Лига Сисадминов

2.4K поста18.9K подписчиков

Правила сообщества

Мы здесь рады любым постам связанным с рабочими буднями специалистов нашей сферы деятельности.

0
DELETED
Автор поста оценил этот комментарий
Ну... Статья скорее для Хабра...
раскрыть ветку (1)
3
Автор поста оценил этот комментарий

Тут тоже умных людей полно.

6
Автор поста оценил этот комментарий

У меня одна знакомая "разобрала" raid-0 и установила на один из дисков Винду. На рейде были проекты 3d и видеомонтажа.

Она попросила меня починить. Первое что я узнал в сети, что ноль в названии raid-0 - это то количество данных, которое удастся восстановить, если что-то сломается.

Я ей сказал, что всё, хана, но если хочешь, могу попробовать. Она набожная и молилась, чтобы получилось. И, сука, получилось:)

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

На RAID 0 хранить данные? На любителя конечно...

показать ответы
0
Автор поста оценил этот комментарий

ТС, Вы вот нас сейчас про рейд рассказали? В 2018 году?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Да. А что?

Технология Storage Spaces новая, не все про неё знают.

0
DELETED
Автор поста оценил этот комментарий

Ну когда нужен обьем+скорость, норм.
Монтирую видео raid0 с бекапом на raid0 с перебекапом на диск в сети. Всё ок.

Раньше был рейд 10 (фейк), он напряг тем, что прекратил работу когда вылетел один raid0 (оглавление посыпалось), то есть фалы не были доступны на 2м raid0, я конечно восстановил, но осадочек остался. А еще раньше была отдельная машина на фейк raid5+1резерв, работал по SMB, но наслушался про пятый, решил отказаться пока не поздно. Честно говоря, лучше тупой "копировалки" каждый день не вижу вариантов.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Резервное копирование это важно!

RAID позволяет продолжать работу не прерываясь, что немаловажно иногда.

1
Автор поста оценил этот комментарий

Люди делятся на два типа. На тех кто не делает бэкапы, и тех кто уже делает.(с)

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

RAID не отменяет резервное копирование. Резервное копирование не есть архивация.

показать ответы
1
Автор поста оценил этот комментарий

А-а-а-а, тоже везение.

У меня были развалы 5ки, когда отказ шёл по 2м дискам, и с помощью некой матери и hex редактора собирали это Г воедино :)

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Помню, как Adaptec сбой прошивки словил при ребилде пятого.

С тех пор для меня пятый рейд только дома и для фильмов и дистрибов.

Автор поста оценил этот комментарий

А месье знает толк в извращениях: дроч с набортовым рейдом и 4я 500-ками - что может быть веселее?!

Мой выбор: QNAP TAS-268, 2х6Тб, зеркальный рейд.

И забыл про гемор с данными!

Плюсом: ведроид на борту и возможность юзать как ммедиа проигрыватель.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Вот и какое извращение?

На компе стоит SSD, на RAID лежит часть данных, фильмы, мои виртуалки.

Не использовал на нем Storage Spaces, потому что на компе стоит Windows XP для  старых игр. Мне игры на NASe хранить?

RAID использую потому что для неприемлемо что-либо потерять.

Автор поста оценил этот комментарий

На самом деле виндовая зеркалка решает, варианты с пулами интересная, но бесполезная (по крайней мере в варианте 10ки я не нашёл ей применения)


Посмотрите на аналогичный функционал у 2012 и старше, там двухуровневый tier можно собирать, вот это уже вещЬ :)

При этом 10ка им умеет пользоваться.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Знаю, использую на работе. Но и пулы на десятке юзаю уже года четыре. Потому и решил поделиться знаниями.

0
Автор поста оценил этот комментарий

Вопрос, я правильно понял, поверх аппаратного рейда (про правило для продуктива "НИКОГДА НЕ ИСПОЛЬЗУЙТЕ 5 рейд" я промолчу) вы собираете програмные реализации, и что-то тестируете?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Аппаратного рейда нет.

Про пятый знаю. Использую для дисков с дистрибутивами, музыкой и фильмами

показать ответы
0
Автор поста оценил этот комментарий

И что я там должен увидеть? Отказ RAID контроллера? Размазывание ошибок по всем дискам? А что делать с SSD?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

тут не используется Raid контроллер. С SSD технология совместима.

Автор поста оценил этот комментарий

Так RAID не про отказоустойчивость , а про высокую доступность.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Как это не про отказоустойчивость? Смотрите скрины.

показать ответы
1
Автор поста оценил этот комментарий

Тогда не хватает выводов.

Что надо тогда использовать в качестве надежного хранилища данных.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Тут сложно вывод сделать. Каждый сам решает. Кому-то NAS, кто ZFS, кто Динамическими дисками доволен... кому-то насрать.

показать ответы
1
Автор поста оценил этот комментарий

Я может что-то не понимаю. Но собственно что Вы хотели донести описывая типовую поломку 10-го RAID массива. Да ещё на софтовом IMS.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Донести хотел циклом заметок о Storage Spaces.

А поломку 10 массива приплел как показатель того, что пушной зверек рядом бегает.

И прибежал на другой комп, пока Я писал заметку.

показать ответы