–Ъ–Њ–Љ–њ—М—О—В–µ—А–љ—Л–µ –Ї—Г—А—Б—Л –Є —Б–њ–µ—Ж–Є–∞–ї–Є—Б—В—Л —Н—В–Њ–є –Њ–±–ї–∞—Б—В–Є
–Ъ–£–Я–Ш–Ґ–ђ –Ь–Х–Ф–Ш–¶–Ш–Э–°–Ъ–Ш–Х –°–Я–†–Р–Т–Ъ–Ш –С–Ђ–°–Ґ–†–Ю –Ш –С–Х–Ч –Ы–Ш–®–Э–Ш–• –•–Ы–Ю–Я–Ю–Ґ
 
 
 
 
 
 
 
 
 
 
 
 
 рэш и восстановление диска

ќписываетс€ физический крэш, то есть разрушени€, вызванные физически малообратимыми процессами в накопителе на жестких магнитных дисках.0. ” ¬ас всЄ хорошо и всЄ работает.
Ќе обольщайтесь. ƒелайте backupы той информации, потер€ которой опасна.

—амый простой способ - gzip на соседний диск или на соседнюю машину. ѕосмотрите, в /etc не так много чего, а ¬ы сможете его восстановить? —делайте backup /var/mail и, если у ¬ас есть пользователи, хот€ бы по несколько Mb у каждого пользовател€.

”чтите, что backup на физически тот же диск практически бесполезен. —ама€ часта€ авари€ - это отказ устройства целиком.

≈сли у ¬ас в LAN есть соседи - договоритесь об обмене backup'ами. Ќе забывайте их криптовать, если у ¬ас параной€ и запишите пароль на стене, если склероз.

ѕопытайтесь оценить стоимость информации на ¬ашем диске и стоимость еЄ потери в каких-нибудь условных единицах. ≈сли установка дополнительного оборудовани€ принесЄт ущерб не только ¬ам, то доведите эту информацию до заинтересованных лиц.

«апишите конфигурацию диска куда-нибудь на бумажку или соседнюю машину. ѕолезно иметь сохранЄнный в правильном месте результат работы следующих команд:

cat /etc/fstab
disklabel disk
fdisk disk
tunefs -p disk

≈сли ¬аша лень превышает ¬ашу мнительность, то пошлите эти параметры по почте какому-нибудь ответственному товарищу с комментарием: "ключ от системы, хранить ответственно и вечно".

“акже полезно посмотреть на результат работы dumpfs disk, но у мен€ ещЄ не было случа€, чтобы он реально понадобилс€. € бы был очень признателен, если кто-нибудь мне сообщит, как при ремонте диска реально его использовать.

1. ѕроизошЄл крэш.
≈сли авари€ только-что произошла и далее всЄ спокойно (то есть дыма нет, скрежета нет, стука нет) то не выключайте компьютер физически из сети! ƒиск, который начал сбоить может не стартовать после выключени€ питани€.

ќповестите заинтересованных лиц об аварии. Ќе нужно пытатьс€ ремонтировать чужую машину. ќбычно это плохо кончаетс€, позовите хоз€ина, пусть он сам займЄтс€ при€тной работой.

ќцените возможный ущерб от потери информации, вспомните про backup'ы - когда они были и насколько соответствовали, оцените материальные и временные ресурсы по замене оборудовани€.

¬спомните, у кого в локальной сети есть достаточно места дл€ сброса информации по nfs, попросите подготовить место (разрешить полное и безусловное монтирование на ¬аш ip номер) и проверить, что оно работает, причЄм со всеми правильными правами. ѕомните, что практически всегда легко одолжить ide'шник на 4..6Gb или потереть какой-нибудь proxy cache или news archive.

≈сли машина в сети - попробуйте кого-либо попросить собрать у себ€ функциональный эквивалент, перенести туда демоны или затычки и проставить alias ip номера.

≈сли у ¬ас есть электронщик - то позовите его, нормальный электронщик может по звуку/стуку/температуре и мерцанию лампочек приблизительно диагностировать неисправность и возможность ремонта.

¬озможные неисправности:
≈сли у ¬ас были просто сбои на поверхности, то ¬ы рискуете немногим.
≈сли, к примеру, отвалилась одна фаза на вращалке и накопитель не экзотический, то его вполне можно починить.
≈сли у ¬ас головка задрала поверхность, то это очень плохо, но есть и такие умельцы, которые могут юстировать головы.
Ќо если у ¬ас поплыла из-за перегрева или почему ещЄ серво-поверхность или поехал подшипник в ступице - то нужно действовать достаточно оперативно.
≈сли у ¬ас последстви€ перегрева, то постарайтесь проветрить комнату. ћне как-то именно это помогло, диск на пару часов восстановилс€, был скопирован после чего отправилс€ на помойку.
≈сли электронщик скажет, что у ¬ас сбоит дисковый контроллер, ни в коем случае не пытайтесь куда-то сохран€ть, переписывать и исправл€ть данные! ¬ этом случае ¬ы просто получите искажЄнные битики, переставленные блоки и вообще что угодно. ѕричЄм у ¬ас по€витс€ отличный от нул€ шанс записать полученный мусор обратно на диск.

ѕри таком раскладе машину нужно выключать, контроллер чинить. ѕока его нет поищите другой, на самом деле scsi диски обычно переносимы между простыми контроллерами легко, а сложные (типа dpt) пишут что-то своЄ в начало диска, то есть ¬ы получаете просто сдвиг на несколько секторов.

≈сли контроллер организовывал RAID-что_то_там и сдох, причЄм таких же на складе нет и не будет, то вспомните, что RAID - это патентованное средство от тараканов в ¬ашей голове и, по-видимости, начало работать. ѕопросите маркетоидов, которые ¬ам впарили этот хлам, возместить компенсацию за всЄ то добро, которое они ¬ам причинили.

IDE диски обычно совместимы без каких-либо вопросов, потому как нормальному unix от bios нужно только прочитать самое начало диска (начальный загрузчик) и передать на него управление. ¬о всЄм остальном они почти одинаковы.

2. —охранение информации
ѕервым делом необходимо попытатьс€ получить утер€нную информацию. ƒл€ этого достаточно монтировать диск в режиме -ro (read only).

ѕостарайтесь найти конфигурацию диска которую ¬ы предварительно на случай аварии записали куда-нибудь на бумажку или соседнюю машину.

ѕереведите систему в single user, если она ещЄ не там (или ещЄ где).

2.1 –адикальное средство: dd
ѕопробуем скопировать диск как устройство куда-нибудь. Ёто делаетс€ командой dd. ѕрочитайте на отдельной машине man dd.

ѕример дл€ FreeBSD: сыплетс€ корень копируем его на /usr Ёта операци€ имеет смысл, если /usr - другой hdd. Ќе пытайтесь делать копию "неисправных" файлов в исправные! Ёто часто приводит к разрушению информации на соседних секторах/блоках.

nik.pu.ru# dd if=/dev/rwd0a of=/usr/wd0a
524288+0 records in
524288+0 records out
268435456 bytes transferred in 255.306025 secs (1051426 bytes/sec)
nik.pu.ru#

ѕосле чего у мен€ по€вилс€ файл

-rw-r--r-- 1 root wheel 259361280 15 авг 03:00 wd0a

где содержитс€ то, что было в корневом разделе.
€ теперь могу спокойно перелитьс€ на новый hdd, а затем скопировать этот файл куда-нибудь, сделать там fsck, в общем то что можно - спасено.

ѕоэтому, если копирование пройдЄт - можно отереть пот со лба, страшное позади, остальное вопрос времени.

2.2 ѕофайловое копирование
¬озможна ситуаци€, при которой на консоли сбои, ругань, проча€ задница и ничего не прочитать. Ёто плохо.  ак ¬ы понимаете. ѕри этом по€вл€етс€ ругань на тему "что-то там плохо и у диска time-out" и проча€.

ѕосмотреть, можно ли смонтировать диск форсированно, обычно это получаетс€ если монтировать read only, плюс ключик -f
mount -f -o ro /dev/disk /mnt

≈сли получилось - аккуратно копируйте, начина€ с важной информации, на другую ленту, живой диск, backup nfs и по дискетам :-)

ќбратите внимание, что в плохой ситуации как только ¬ы наступите на плохой блок, то всЄ зависнет. ѕоэтому чаще (например после копировани€ каждого файла) делайте sync или монтируйте destination disk (то есть тот, куда копируете) с ключом sync в /etc/fstab.

2.3 –емонт остатков
“олько после того, как данные спасены, можно немного расслабитьс€ и посмотреть, а что же собственно с hdd произошло. —амый простой способ - запустить
fsck -y disk
и подождать куда и как всЄ это грохнетс€.

≈сли ¬ы вытащили не всю информацию, то попытайтесь перед fsck -y disk сделать fsck -n disk, посмотреть, затем просто fsck disk и поотвечать на вопросы.

¬ любом случае диск полезно переразметить при помощи newfs. ¬ старые добрые времена имел смысл формат bad144, который позвол€л использовать диски с bad blocks, устанавлива€ их как при помощи начальной инициализации (man bad144), так и при помощи программки badsect (man badsect). ” мен€ сложилось впечатление, что с большими дисками (>2Gb) она не работает. € не разбиралс€ подробно.

¬ любом случае самый простой способ разбирательства с "полуисправными" дисками - это или замена, или установка в неответственные места (копии cd, proxy кэш, ньюсопомойка).

3. ¬осстановление информации
ќбратите внимание, что процедура восстановлени€ обычно позвол€ет одновременно переконфигурировать компьютер, установить свежую версию os, подключить дополнительный backup device и навести пор€док.

Ќе забудьте сохранить информацию о характеристиках дисков, которые ¬ы установили, в отдельной тетради и запереть еЄ в сейф.

¬ качестве backup € рекомендую использовать scsi streamer дл€ ленты dds3 (это от 12 до 24Gb в зависимости от упакованности информации).