Случай нулевой. Год так 2004й.
Помирает диск в пятом рейде в сервере ibm. Мой начальник не сделал хотспейр ради места. Сервак отключает кеши, данные лепит через контрольные суммы. Пихаем вместо сломанного диска другой. Не фиксится. После долго разберательства, звоним в ибм, в Москву. Это ближний сапорт. Там ответ, что вам надо диск из той самой серии и той же прошивкой. Прошить не сможете. Покупайте диск. Ничего сделать нельзя. Лайфхаков нет. Диск купили к среде. Выжили.
Случай первый.
Сервак с большой базой на всю Украину., вылетает диск, ответственный за базу кричит - я сам, вы мне сломаете. Идёт вытаскивает диск (запасной у него есть) все тухнет. Внезапно. Сервер больше не загружается. Оказалось, что ему пришло письмо, что диск 4 в сервере умер. Он пошел, отсчитал пальцем диск, и вытащил. Как то он забыл, что считать с нуля надо. Данные кстати спасали через полную копию дисков, и клеили на коленке неделю. Потому что рейд не дурак, востанаавление не даёт сделать.
Случай два.
Из-за дедупликации никто не понимал, что значит в вцентре значение 273% диска используется. И сколько из этого свободно. Мерять размер физический с дисков на полках как то ума не хватило. Внезапно приочередном разворачивании пары сотен виртуалок, все затормозило и упало. Ходили на полки искали орфантов и убивали их. Потом почистили. Я кстати с тех пор сторонних зомбифайлов на дисках.