Перейти к содержимому


Фото

Проблемы с сервером


  • Чтобы отвечать, сперва войдите на форум
29 ответов в теме

#1 KiberGus Опубликовано 14 Ноябрь 2010 - 15:43

KiberGus
  • Genius loci
  • 6 561 Сообщений:
  • Алексей Гусейнов
У нас проблемы с сервером, похоже аппаратные (похоже с материнской платой, сейчас выясняем точнее). В качестве временного решения МИЭМ нам выделил виртуалку (за что им огромное спасибо).

Хроника событий
Началось с софтовых проблем:
Возникли ошибки при обновлении системы. Не хотела обновляться glibc. В результате перестали запускаться почти все программы. День я пытался через единственную живую ssh сессию оживить систему, но не получилось. Пришлось ехать на место и разбираться с проблемами.
Аппаратные проблемы:
Приехав в МИЭМ я обнаружил что сервер вообще не грузится, вываливаются ошибки работы с дисковой подсистемой (ошибки чтения, ошибки общения с дисками, причем сразу на всех sata каналах). Как при попытке загрузки ОС, так и при попытке загрузки с liveDVD При отключении части дисков с raid контролллера проблемы почти исчезали, только раз появились сообщения об ошибках. SMART говаорит, что диски исправны.
Также напомню, что у нас уже возникала подобная плавающая ошибка, когда самопроизвольно падал и поднимался линк на сетевой карте (решилось установкой PCI карточк). Причем система тогда отказывалась включаться и проблема решилась магическими перестановками карт в PCI слотах и прочими шаманствами. Что конкретно заставило систему загрузиться тогда так и не поняли. А т.к. проблема не повторялась, про нее забыли.
Времени разбирать сервер у меня уже не было, пришлось закончить и ехать на работу.
Аппаратные проблемы день второй:
В МИЭМ поехал Денис Сумин. Сервер был извлечен из стойки и были предприняты попытки переключать диски на встроенный контроллер, отключать разные диски, пробовал вставлять другой sata контроллер.
Еще попробовали заменять старую PCI видеокарту на PCI-Express карточку от nvidia, которая служила мне верой и правдой, пока у меня не появился огромный монитор, родное разрешение которого она не поддерживает. Теперь ей нашли применение и она будет в сервере.
Также на материнской плате были обнаружены вздутые конденсаторы (что скорее всего и является причиной ошибки). В результате решили сервер увезти домой, а нам обещали сделать виртуалку, пока не починим сервер.
День третий:
С утра заработала виртуалка, мы ее донастроили, положили куда надо файлы и запустили сервисы... И поностальгировали. Когда я настраивал сервер я на отдельный раздел сделал полную копию системы. И Денис наткунлася на этот раздел раньше, чем на рабочий корневой раздел, и скопировал файлы оттуда. В результате сервисы восстановились на состояние 2008 года.
День четвертый:
Диски и контроллер у меня. Остальное железо у Дениса.К компьютеру подключен наш promise ST4 и к нему подключен наш RAID5 из 3х 750 гиговых винтов, остальные (2х80 и один на 400) подключены к материнке. Все работает стабильно, никаких ошибок. RAID массив пришлось пересобирать (во время сбоев на сервере один из дисков рассинхронизовался), что он успешно делает уже несколько часов и сейчас процесс прошел на 80%. так что стресс-тестирование дисковой системы можно считать состоявшимся.
Планы
Скорее всего у нас накрылась материнка, поэтому придется обновлято сервер. Ставить новую мать, оперативку и процессор. Более точно скажем, когда закончим тестировать то железо, что у нас есть.
Про программный сбой
Касательно того, что у нас произошло с операционкой... Могй сказать одно. Когда сервер окончательно вышел у меня из-под контроля bash отказывался что-либо запускать мотивируя это тем, что не может выделить память для fork. А до этого, после обновления glibc (когда система сломалась), программы не стартовали т.к. не могли найти символ guard_ (такио ошибки лезут, когда нарушается бинарная совместимость). Сейчас я сделал chroot в корневой раздел нашего сервера и все работвет. Так что возможно, что это тоже был аппаратный, а не программный сбой. На всякий случай я сделаю полную пересборку мира (это аналогично переустановке системы с сохранением конфигурационных файлов). Пересборка мира потребует пары дней т.к. сегодня я ее не закончу, а продолжить смогу только во вторник утром.
Что работает
Форум запущен на виртуалке в полном объеме. drupal... считайте, что он в read only. Мы решили не переносить ldap, так что drupal не работает аутиентификация. Галерею я не стал копировать, она слишком большая.
Личные сайты я могу восстановить по просьбе владельцев. Если просьбы нет, тона виртуалку они не переносятся (и восстановятся, когда починим сервер)
ftp на виртуалке поднимать не будем.

Обновить сервер, я надеюсь, получится в течении недели. Надо окончательно разобраться, что из железа у нас рабочее и понять, что нам еще нужно.

Железо

Жесткие диски:

3 X western digital WD7500AAKS по 750 GB. Объединены в RAID5 на 1.5 TB в порядке
2 X Seagate Barracuda ST380815AS по 80 GB. Объединены в RAID0. На них стоит ОС в порядке*
1 X Seagate Barracuda по 400 GB. в порядке*
Баракудам у меня жарковато и у них (у всех, включая одну мою) по смарту Raw_Read_Error_Rate и Seek_Error_Rate высокие (которые у всех WD нулевые). Но SMART говорит, что все в норме. Я думаю, что это особенности вычисления этих значений у разных производителей.

Платы расширения:
Promise SATA 300 TX4. На 4 sata порта. в порядке
Видеокарта PCI. Кажется ATI rage в утиль?
GigaByte GeForce 6600 GT с пассивным охлаждением в порядке

Остальное:
Процессор. AMD Athlon 62. Кажется 2000+. ?
Материнка Biostar NF4 Ultra-A9A вздуто 3 конденсатора
Память DDR II 333 4GB (4x1GB) Одна плашка битая и с ней система не грузится. Остальные вроде в порядке
Корпус в порядке
DVD привод в порядке
Блок питания Delta Electronics GPS-650AB как проверить?
Зато, обладая единственной в мире подводной орбитальной группировкой спутников глонасс...
gentoo.gif

#2 гык-sse2 Опубликовано 14 Ноябрь 2010 - 16:24

гык-sse2
  • Свои
  • 377 Сообщений:
  • Михаил Беляев
Однако, несмотря на виртуалку, 304 работает быстрее, чем раньше.

Видеокарта PCI. Кажется ATI rage в утиль?

Она сломана или просто потому что старая?
Медведь громит каны!

#3 KiberGus Опубликовано 14 Ноябрь 2010 - 16:27

KiberGus
  • Genius loci
  • 6 561 Сообщений:
  • Алексей Гусейнов

Однако, несмотря на виртуалку, 304 работает быстрее, чем раньше.


Она сломана или просто потому что старая?

Старая. Про сломанную не скажу, мы пока не тестировали.
И виртуалка у нас очень неплохая. 4GB оперативки, 2 процессора (каких не знаю, но возможно 2.7 Ghz). Это мощнее, чем наш сервер.
Зато, обладая единственной в мире подводной орбитальной группировкой спутников глонасс...
gentoo.gif

#4 Денис Опубликовано 14 Ноябрь 2010 - 16:27

Денис
  • Genius loci
  • 6 898 Сообщений:
  • Денис Сумин
Еще по поводу железа -- сетевая карта. Я отдал МИЭМовцам их intel 100Mbit/s, которую они поставили, когда наша стала глючить. Память сегодня проверю. Матю+проц+БП попробую потестировать. Методические советы будут приняты с благодарностью.

#5 DNAlh Опубликовано 14 Ноябрь 2010 - 16:30

DNAlh
  • Борцы со злом
  • 48 468 Сообщений:
  • Дмитрий Алхазашвили
Так, ребят, еще раз для гуманитариев... Что надо купить (материнку, насколько я понял, да?) и сколько это стоит? DN

#6 KiberGus Опубликовано 14 Ноябрь 2010 - 16:38

KiberGus
  • Genius loci
  • 6 561 Сообщений:
  • Алексей Гусейнов

Еще по поводу железа -- сетевая карта. Я отдал МИЭМовцам их intel 100Mbit/s, которую они поставили, когда наша стала глючить.

Память сегодня проверю. Матю+проц+БП попробую потестировать. Методические советы будут приняты с благодарностью.

Посмотри, чот там у нас за БП стоит. Я на него никогда и не смотрел. Если там что-то слабенькое, может имеет смысл тоже менять.

Так, ребят, еще раз для гуманитариев... Что надо купить (материнку, насколько я понял, да?) и сколько это стоит?

С этим пока определяемся. Мой прогноз: материнская плата, процессор, оперативная память, кулер (это хозяйство по частям не меняется, и сокеты у процессоров нынче другие и память теперь DDR III). Возможно блок питания.
Если мы не собираемся ставить серверные железки (а я думаю, что смысла нет), то (по совету Леши Василенко) стоит ориентироваться на intel i5 (~ 8 000). Материнка ~4000, память ~4000.
Зато, обладая единственной в мире подводной орбитальной группировкой спутников глонасс...
gentoo.gif

#7 armajty Опубликовано 14 Ноябрь 2010 - 16:41

armajty
  • Свои
  • 1 109 Сообщений:
  • Екатерина Макарова

Что надо купить (материнку, насколько я понял, да?) и сколько это стоит?
DN

Готова поучаствовать)
Когда дует непревзойденный свежий бриз,
какая польза от веера?

#8 DNAlh Опубликовано 14 Ноябрь 2010 - 16:49

DNAlh
  • Борцы со злом
  • 48 468 Сообщений:
  • Дмитрий Алхазашвили

Материнка ~4000, память ~4000.

Ну, что делать... Думаю, организуемся, скинемся (кто захочет поучаствовать) и купим.

DN

#9 Deimos Опубликовано 14 Ноябрь 2010 - 16:54

Deimos

    Самый голодный

  • Свои
  • 1 972 Сообщений:
  • Дмитрий Листвин

Готова поучаствовать)

+1

Незнание жизни не освобождает от жизни.
Неизбывная бестолочь сутолоки - бравада безволия.


#10 Ripper Опубликовано 14 Ноябрь 2010 - 17:41

Ripper
  • Свои
  • 497 Сообщений:
  • Павел Рустанович

Если мы не собираемся ставить серверные железки (а я думаю, что смысла нет), то (по совету Леши Василенко) стоит ориентироваться на intel i5 (~ 8 000). Материнка ~4000, память ~4000.

А почему именно i5? Вроде весь необходимый софт умеет обрабатывать запросы в отдельных потоках и сможет нагрузить все шесть ядер свежего amd 1090T, например.
Да и материнки под амд дешевле стоят.

Изменено: Ripper, 14 Ноябрь 2010 - 17:42

post-2756-0-28658900-1472313042.png


#11 KiberGus Опубликовано 14 Ноябрь 2010 - 18:33

KiberGus
  • Genius loci
  • 6 561 Сообщений:
  • Алексей Гусейнов

А почему именно i5? Вроде весь необходимый софт умеет обрабатывать запросы в отдельных потоках и сможет нагрузить все шесть ядер свежего amd 1090T, например.
Да и материнки под амд дешевле стоят.

Не знаю. Когда я в последний раз интересовался процессорами, рулил core 2. Леша Василенко посоветовал i5. Сейчас почитал обзоры, может 1090T и более хороший выбор. Поэтоу и хотелось бы услышать мнения форумчан.
Зато, обладая единственной в мире подводной орбитальной группировкой спутников глонасс...
gentoo.gif

#12 koraalex Опубликовано 14 Ноябрь 2010 - 18:39

koraalex
  • Свои
  • 1 946 Сообщений:
  • Алексей Коробов
Если таки сориентируемся на AMD и придётся экономить, отдам староватый Phenom 9650, лежит-пылится. Надо бы оценить, насколько младший серверный класс дороже десктопа. AMD, как раз, не особо, т.к. Феном - фактически серверный процессор, различие между платформами Феном и Оптерон в том, что Феном всегда один на материнке, а технологии там, кажется, поддерживаются практически на равных, даже ECC память. Кстати, для однопроцессорной системы память нужна небуфферизованная, недорогая. Только сориентирован AMD в большей степени на вычислительную математику, нежели на СУБД. Думаю, нужно уделить больше внимания блоку питания, охлаждению, мягкой подвеске винчестеров и RAID-контроллеру. Столкнулся как-то с проблемой: на гигабайтовской материнке встроенный контроллер был "игрушечным" - формально он поддерживал всякий RAID, однако функциональность была примитивной.

#13 гык-sse2 Опубликовано 14 Ноябрь 2010 - 18:44

гык-sse2
  • Свои
  • 377 Сообщений:
  • Михаил Беляев

мягкой подвеске винчестеров

Читал на форуме (то ли cxem.net, то ли overclockers.ru), что подвеска на резинках ухудшает охлаждение винчестера (корпус компа является радиатором) и увеличивает время перемещения головок, т.к. винчестер дергается по закону сохранения импульса. Но шум снижает.
Медведь громит каны!

#14 koraalex Опубликовано 14 Ноябрь 2010 - 18:45

koraalex
  • Свои
  • 1 946 Сообщений:
  • Алексей Коробов
Паша, у тебя юношеский максимализм? Посмотрел, что такое 1090Т, ну зачем же брать топовую модель?

#15 koraalex Опубликовано 14 Ноябрь 2010 - 18:51

koraalex
  • Свои
  • 1 946 Сообщений:
  • Алексей Коробов

подвеска на резинках ухудшает охлаждение винчестера

Во-первых под мягкой подвеской не подразумевались именно резинки. Нужно просто снизить вибрацию. По-моему оптимальный вариант - тяжёлая корзина на 6 винчестеров, закреплённая на каких-нибудь амортизаторах. Во-вторых охлаждение зависит от разных факторов. Гораздо важнее обеспечить хорошую циркуляцию воздуха. Отводить тепло можно по-разному.

#16 KiberGus Опубликовано 14 Ноябрь 2010 - 18:53

KiberGus
  • Genius loci
  • 6 561 Сообщений:
  • Алексей Гусейнов

Думаю, нужно уделить больше внимания блоку питания, охлаждению, мягкой подвеске винчестеров и RAID-контроллеру. Столкнулся как-то с проблемой: на гигабайтовской материнке встроенный контроллер был "игрушечным" - формально он поддерживал всякий RAID, однако функциональность была примитивной.

Охлаждению осбого внимания не надо. Сервер стоит в хорошо кондиционируемой серверной. Просто нужен добротный кулер. Что подразумевается под мягкой подвеской винчестеров? (у нас 3 диска стоят в отсеках корпуса прикрученные на винтики и еще 3 установлены в mobile rack'и. Можно конечто докупить корзинки, но это не вещь первой необходимости). Рейд мы используем софтовый. Аппаратные контроллеры дорогие, когда я в последний раз интересовался, от 10 000. Все что дешевле использовало центральный процессор или тормозило. наверное сейчас дешевле. И еще есть такой момент, что софтовый рейд я смонтирую на любой линуксовой машине. А с аппаратным контроллером я буду вынужден в случае чего искать такую же плату.
Зато, обладая единственной в мире подводной орбитальной группировкой спутников глонасс...
gentoo.gif

#17 KiberGus Опубликовано 14 Ноябрь 2010 - 18:56

KiberGus
  • Genius loci
  • 6 561 Сообщений:
  • Алексей Гусейнов

Во-первых под мягкой подвеской не подразумевались именно резинки. Нужно просто снизить вибрацию.

Какую вибрацию? Вибрацию от винчестера или вибрацию от серверной стойки стоящей на бетонном полу?
А против мощного процессора я лично не имею ничего против, пригодится. И даже готов его купить.
Зато, обладая единственной в мире подводной орбитальной группировкой спутников глонасс...
gentoo.gif

#18 Ripper Опубликовано 14 Ноябрь 2010 - 19:03

Ripper
  • Свои
  • 497 Сообщений:
  • Павел Рустанович

Паша, у тебя юношеский максимализм? Посмотрел, что такое 1090Т, ну зачем же брать топовую модель?

Ну так предлагалось брать i5 за 8 тысяч. Топовый 1090T будет даже чуть дешевле. Вот и предлагаю его

post-2756-0-28658900-1472313042.png


#19 starcev Опубликовано 14 Ноябрь 2010 - 19:32

starcev
  • Свои
  • 448 Сообщений:
  • . .

Я отдал МИЭМовцам их intel 100Mbit/s

Т.е. сейчас нет сетевой карты вообще? Оо

#20 KiberGus Опубликовано 14 Ноябрь 2010 - 19:49

KiberGus
  • Genius loci
  • 6 561 Сообщений:
  • Алексей Гусейнов

Т.е. сейчас нет сетевой карты вообще? Оо

Есть интегрированная. Когда-то она странно себя вела, периодически теряла линк. Поставили pci карту.
Зато, обладая единственной в мире подводной орбитальной группировкой спутников глонасс...
gentoo.gif




1 пользователей читают эту тему

0 пользователей, 1 гостей, 0 невидимых