Помощь в настройке СХД на пару с Blade-сервером

Доброго дня!


Товарищи, нужна Ваша помощь в настройке серверного оборудования, а именно подключение системы хранения данных к Blade-серверу. Сразу скажу - за последний месяц прочитано уже бесчисленное множество различных ресурсов, поэтому прошу помощи в "реальном времени".


К сожалению, ранее с подобным я не сталкивался, а задача ввода оборудования в работу поставлена. И возникает ку-у-уча вопросов.


Вводные данные:


На работе приобрели новую железку - систему хранения данных Fujitsu DX100 S4. Включает в себя 2 набора дисков - SSD и SAS, быстрый массив и медленный массив, соответственно. СХД имеет 8 Fiber Channel портов - по 4 на каждом из двух контроллеров (далее CM#X), разделенные на 2 группы (далее CA#X) по 2 порта (далее Port#X).

Приобреталось все это взамен неисправной СХД, которая давным давно выведена из работы по причине умерших дисков.
Работать новая СХД должна была в паре с Blade-сервером HP C3000, с тремя лезвиями на борту. На каждое установлен ESXI и на всем этом поднят кластер VMWare.

В данный сервер установлен SAN-свитч Brocade 8/12c, с четырьмя лицензированными портами Fiber Channel.


Что имеем:


1. SAN-свитч: Подключен двумя FC портами к двум контроллерам СХД (CM#0 и CM#1).


Зонирование выполнено следующим образом:

Первому HBA первого лезвия задан в соответствие первый порт СХД.

Первому HBA первого лезвия задан в соответствие второй порт СХД.

Второму HBA первого лезвия задан в соответствие первый порт СХД.

...

Второму HBA третьего лезвия задан в соответствие второй порт СХД.


Итого 12 зон. Соответствие задано по WWN. Всё собрано в единый конфиг на SAN-свитче.

Помощь в настройке СХД на пару с Blade-сервером Без рейтинга, Системное администрирование, Схд, Ремонт компьютеров, Сервер, Vmware, Fujitsu, Длиннопост

Здесь возникает первый (1) вопрос - действительно ли стоит делать зонирование по WWN или нужно делать жестко по портам?


2. СХД:


а.) Имеет 2 раздела (SSD-volume и SAS-volume):

SSD собраны в RAID5, имеют размер 6.10 Тб.

SAS собраны в RAID10, имеют размер 8.00 Тб.

Помощь в настройке СХД на пару с Blade-сервером Без рейтинга, Системное администрирование, Схд, Ремонт компьютеров, Сервер, Vmware, Fujitsu, Длиннопост

б.) Разделы собраны в группу из двух LUN и презентованы серверу следующим образом:

Помощь в настройке СХД на пару с Blade-сервером Без рейтинга, Системное администрирование, Схд, Ремонт компьютеров, Сервер, Vmware, Fujitsu, Длиннопост

Пояснения по столбцам:

1. Host Group - названия групп портов HBA из столбца Host, соответствующих каждому из лезвий.

2. Host - HBA адаптеры каждого из лезвий.

3. CA Port Group - названия групп портов контроллеров СХД из вкладки CA Port.

4. CA Port - порты СХД, которые подключены к серверу, где CM#X - контроллер, CA#X - группа портов на контроллере, Port#X - порт каждой из групп. 
5. LUN Group - группа из LUN, которые необходимо презентовать Blade-серверу.

6. Host Response - режим работы хоста, работающий в режиме Active/Active (настройка проведена руками).


Здесь возникает второй (2) вопрос - корректно ли выполнять презентацию по отдельным лезвиям? Или можно было собрать всё в одну кучу?

3. VMware.

VMWare видит оба LUN.

Выглядит это следующим образом:

Помощь в настройке СХД на пару с Blade-сервером Без рейтинга, Системное администрирование, Схд, Ремонт компьютеров, Сервер, Vmware, Fujitsu, Длиннопост

Каждый vmhba видит оба LUN в двойном количестве (...3e:20 и ...3e:30 - WWN адреса портов СХД). Установлен режим путей Round-Robin для каждого из LUN.


Возникает третий (3) вопрос - а правильно ли выполнена настройка VMWare?


И вот здесь мы приходим к следующему.

Проблема:


Ранее, в VMWare был выбран режим "Fixed". Какие пути были выбраны - данная информация, к сожалению, не сохранилась. Все работало корректно пару дней с парой легких виртуальных машин на борту (1 - Ubuntu, 2 - Windows 7). Вечером третьего дня запустил на СХД миграцию ВМ с Windows Server 2008 R2. Более никаких изменений в конфигурацию не вносилось.

На следующий день посыпались жалобы на то, что всё работающее на СХД тормозит.

При использовании утилиты esxtop с параметром 'd' (подключаясь по SSH на одно из лезвий), появлялись огромные значения DAVG, KAVG, GAVG и QAVG:

Помощь в настройке СХД на пару с Blade-сервером Без рейтинга, Системное администрирование, Схд, Ремонт компьютеров, Сервер, Vmware, Fujitsu, Длиннопост

Режим был изменен на Round-Robin. Часть путей была отключена. Худо-бедно и спешке виртуальные машины были размигрированы с СХД.


В данный момент СХД как-то работает, но как - непонятно.

После уже месячных попыток настройки и чтения мануалов уже нет точного представления как всё это должно работать. 

Хотелось бы получить советы, каким образом нужно подойти к организации системы хранения данных вместе с Blade-сервером имея только один SAN-свитч.

Признателен любой помощи в выборе правильно подхода! Спасибо!