Контроллер, электричество и другие неприятности

Не так давно пришлось попыхтеть с восстановлением данных. В один прекрасный день, сервер «упал». После перезагрузки в логах было много ошибок записи NTFS системы. Вынув сбойный диск и заменив его на другой система через минут 20 снова рухнула. После различных экспериментов, стало ясно — контроллер жестких дисков не работает с диском, который подключен к 3-му каналу.
Небольшое отступление, система была спроектирована в «бюджетном» варианте. 4 диска, два зеркала, одно под систему и логи, второе зеркало под базы данных. В том бюджете — это было самое оптимальное решение.
После замены контроллера LSI MegaRAID SAS MR9240-4i, аккуратного запуска системы с дисками, работа системы была восстановлена. Дальше началось «лечение» баз данных. В результате — одна база из трех имела потерянные данные и восстановлению не подлежала. Она была восстановлена из архива и были потеряны данные только за двое суток. Понятно, что данный инцидент не очень приятен, но на тот момент лучшего варианта не было.
Но на этом история не закончилась. Через 5 дней в серверной комнате выключают электричество. Авария на подстанции мосэнерго. ИБП протянул минут 10 и сервера в стойке сказали «прости — прощай».
После включения электричества начали заводить сервера. Сервер контроллер домена — пережил падение на удивление легко. При восстановлении своей базы все отработало на автомате и АД поднялась без проблем. Далее начал запускать почтовый сервер. А это как раз тот сервер на котором меняли контроллер жестких дисков. Все три базы находились в состоянии Dirty Shutdown. Собственно не страшно, с точки зрения данных, но по времени восстановление баз в рабочее состояние заняло около 9 часов.

Немного команд, так сказать на будущее:
eseutil /MH BASE00.edb — смотрим в каком состоянии почтовая база
eseutil /ML E00.log — смотрим уелы логи или нет. Чаще всего они целы, что не может не радовать

eseutil /P BASE00.edb — Repairs a corrupted or damaged database. Хоть разработчики и рекомендуют, строго рекомендуют восстановить базу с последнего момента чистого отключения базы, но если время после последнего архива прошло достаточно много или еще какие причины? Поэтому деваться некуда — смело запускаем и ждем завершения процесса. Процесс может затянуться, все зависит от размеров Вашей почтовой базы.
После того как база примет состояние «Чистого отключения», то не торопитесь монтировать базу. Для завершения процедуры выполним команду:
eseutil /R E00.log

Все! Монтируйте базы, но не думайте, что все будет идеально. Скорее всего ошибки с некоторыми почтовыми ящиками будут. Увеличивайте уровень журналирования и смотрите логи на сервере.

В заключении небольшие советы:
— выбивайте бюджет на сервер, который будет иметь «защиту» от выхода из строя управляющих модулей
— регулярные бэкапы — спасут Вас от потери всех данных

Реклама

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s