Димитрий

Димитрий
Рейтинг
137
Регистрация
20.01.2007
Интересы
психология

было конечно не совсем так, что оба диска надо менять было не припомню, тем более мне давали гарантию что данные все в сохранности и бэкап прошел хорошо.

при этом во время бэкапа сервера была допущена очень грубая ошибка, уже это то можно признать.

а так конечно, молодцы, терпеливы..

в итоге все хорошо что хорошо кончается.. бэкапы на другом сервере поднимаем своими силами, и уже почти всё поднято:)

крайне неторопливая тех.поддержка инженерная в самом ДЦ, у меня случилась жесткая проблема, винт посыпался..

мало того, что сам фаствпс накосячил, неверно сделал бэкап и в итоге сервер не запускается, так еще и нет у них никакой возможности как-то нормально по старому винчестеру уточнить информацию..послали мол запрос инженеру в дц и ждем..ждем час..ждем два.. офигеть- и это хостинг!!

да и ночью тоже было такое, что не проконтролировали процесс пока над душой не встанешь- ничего не делается(

а почему? да просто debian в начале подумывал, но спросил там же в техподдержку насчет переноса сайтов, говорят если переносить через бэкап isp manager с centos на debian, то никакой гарантии что будет корректно перенесено и будет работать- нет.

тем более у них же написано что проблемы с zend optimizer и php 5.3, который по умолчанию ставится на данный debian, в общем лишние заморочки какие-то..

да просто нужна уверенность ещё, что все кто делает- сделает действительно всё нормально, не потеряв данные сайтов..

а то ж специалистов хватает и каждый примерно что-то своё говорит.

а за советы благодарю!

в общем, написали что первый винт надо менять по любому, так как ошибки чтения имеются, и не факт что полный бэкап возможен..

вот интересно, можно ли как-то сделать в centOS чтобы при ошибке чтения все равно шло дальше, пропуская глючный момент, и записывая в логи- вот такой то файл коряв..тогда можно было бы восстановить это руками

рано радовался..это просто они только один кабель поменяли..потом еще поменяли другой..в итоге опять пошел ресинк и опять по кругу..

Mar 6 07:31:58 nebo-7 kernel: raid1: sda: unrecoverable I/O read error for block 635909760

Mar 6 08:17:27 nebo-7 smartd[4222]: Device: /dev/sda, 5 Currently unreadable (pending) sectors

походу на эом месте идет обрыв и всё по новой..

из хостинга написали что будут первый винт менять, но подождут ресинк..хотя как его ждать, если он идет уже по второму кругу..

страшные предчуствия терзают меня, что если такие ошибки- как диск тогда скопировать основной?

может можно как-то вылечить чтобы была возможность скопировать, а то идет по кругу и всё..

заменили кабель , потом в режиме recsue видимо запустили синхронизацию дисков и все заработало, теперь все нормально

---------- Добавлено 06.03.2012 в 02:13 ----------

правда теперь при запуске

команды smartctl -A /dev/sdb

smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen

Home page is http://smartmontools.sourceforge.net/

Smartctl open device: /dev/sdb failed: No such file or directory

---------- Добавлено 06.03.2012 в 02:15 ----------

и такая еще штука..

cat /proc/mdstat

Personalities : [raid1] [raid10] [raid0] [raid6] [raid5] [raid4]

md0 : active raid1 sda1[0]

4200896 blocks [2/1] [U_]

md1 : active raid1 sda2[0]

2104448 blocks [2/1] [U_]

md2 : active raid1 sda3[0]

726266432 blocks [2/1] [U_]

получается отключили что ли чего-то?

smartctl -A /dev/sda

smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen

Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===

SMART Attributes Data Structure revision number: 16

Vendor Specific SMART Attributes with Thresholds:

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE

1 Raw_Read_Error_Rate 0x000f 099 095 051 Pre-fail Always - 477

3 Spin_Up_Time 0x0007 082 082 011 Pre-fail Always - 6340

4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 6

5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0

7 Seek_Error_Rate 0x000f 100 100 051 Pre-fail Always - 0

8 Seek_Time_Performance 0x0025 094 094 015 Pre-fail Offline - 16967

9 Power_On_Hours 0x0032 097 097 000 Old_age Always - 17127

10 Spin_Retry_Count 0x0033 100 100 051 Pre-fail Always - 0

11 Calibration_Retry_Count 0x0012 100 100 000 Old_age Always - 1

12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 6

13 Read_Soft_Error_Rate 0x000e 099 095 000 Old_age Always - 476

183 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0

184 Unknown_Attribute 0x0033 100 100 000 Pre-fail Always - 0

187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 5586

188 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0

190 Airflow_Temperature_Cel 0x0022 066 063 000 Old_age Always - 34 (Lifetime Min/Max 33/37)

194 Temperature_Celsius 0x0022 066 062 000 Old_age Always - 34 (Lifetime Min/Max 33/38)

195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 433677178

196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0

197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 5

198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0

199 UDMA_CRC_Error_Count 0x003e 100 100 000 Old_age Always - 0

200 Multi_Zone_Error_Rate 0x000a 100 100 000 Old_age Always - 0

201 Soft_Read_Error_Rate 0x000a 099 099 000 Old_age Always - 47

smartctl -A /dev/sdb

smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen

Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===

SMART Attributes Data Structure revision number: 10

Vendor Specific SMART Attributes with Thresholds:

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE

1 Raw_Read_Error_Rate 0x000f 111 100 006 Pre-fail Always - 38534742

3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0

4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 5

5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0

7 Seek_Error_Rate 0x000f 075 060 030 Pre-fail Always - 36531623

9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 442

10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0

12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 5

183 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0

184 Unknown_Attribute 0x0032 100 100 099 Old_age Always - 0

187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0

188 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0

189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0

190 Airflow_Temperature_Cel 0x0022 062 053 045 Old_age Always - 38 (Lifetime Min/Max 21/39)

194 Temperature_Celsius 0x0022 038 047 000 Old_age Always - 38 (0 21 0 0)

195 Hardware_ECC_Recovered 0x001a 030 029 000 Old_age Always - 38534742

197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0

198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0

199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0

240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 62517543961027

241 Unknown_Attribute 0x0000 100 253 000 Old_age Offline - 213644770

242 Unknown_Attribute 0x0000 100 253 000 Old_age Offline - 36681593

а причём тут это? разве что спамеры какие-то присосались и понемногу спам пытаются слать, но это не напрягает и почтовые процессы все убиваются нафик)

только такое-что там часто диски портятся))) и у меня там сервер на fastvps

Всего: 525