ВТ (непрофильный форум) > Уголок SUNтехника, SF 4800
Разные ошибки, что всплыли
случайность:
Тема об ошибках что были замечены в процессе изучения сервера SF 4800
Буду рассматривать все замеченые ошибки, а так же их способы устранения.
случайность:
№1.
Первая ошибка была замечена во время прогона команды testboard sb0
--- Цитировать ---{/N0/SB0/P1} ERROR: TEST=Memory Tests,SUBTEST=Memory MATS+ ID=61.3
{/N0/SB0/P1} Component under test: /N0/SB0/P1 Memory
{/N0/SB0/P1} Correctable error count (2098) exceeds MPR threshold (2097)
{/N0/SB0/P1} logical bank 0, dimm 0 (J14300)
{/N0/SB0/P1} Failed Memory MATS+
--- Конец цитаты ---
Что то с памятью, указывается на палку памяти под номером J14300
случайность:
№2. РЕШЕНО, ремонт и замена вентиляторов БП
Вторая ошибка вылезла во время прогона команды testboard sb4, Но она не связана с процессорной платой. Это ошибка перегрева БП PS1.
--- Цитировать ---Mar 03 20:52:28 sc0.YYY.ru Platform.SC: WARNING: PS1 temperature is approaching max limit of 78C
Mar 03 20:52:28 sc0.YYY.ru Platform.SC: PS1 48 VDC 0 Temp. 0 value: 68 Degrees C
Mar 03 20:52:28 sc0.YYY.ru Platform.SC: Check for abnormal environmental operating conditions.
Mar 03 20:52:28 sc0.YYY.ru Platform.SC: PS1, sensor status, outside acceptable limits (7,1,0x605010b00030000)
--- Конец цитаты ---
Дождался окончания прогона теста и выключил сервер командой poweroff all Пока версия в вентиляторах, Потому что при подаче питания на этот БП он шумел вентилятором. Потом затих.
Пока БП не достать из корпуса в виду невозможности вытащить сервер. Нет колес.
следуюшие ошибки посыпались в консоль во время отключения сервера
--- Цитировать ---Mar 03 20:54:56 sc0.YYY.ru Platform.SC: Notice: PS1 48 VDC 0 Temp. 0 device temperature has stabilized.
Mar 03 20:54:56 sc0.mdi.ru Platform.SC: PS1 48 VDC 0 Temp. 0 normal operating temperature: value: 68 Degrees C
Mar 03 20:54:56 sc0.mdi.ru Platform.SC: PS1, sensor status, within acceptable limits (7,2,0x605010b00030000)
Mar 03 20:55:38 sc0.YYY.ru Platform.SC: CAUTION: Physically removing the last power supply will cause the system to lose power.
--- Конец цитаты ---
случайность:
3.
добыл процессорную плату, надежды было мало что живая, так и есть
ошибка
May 26 15:24:42 sc1.YYY.ru Platform.SC: /partition1/domain0/SB0: RepeaterHpu.pre
pare: sun.serengeti.HpuFailedException: SbbcGroup.fillPostStructs: CPU0DCB
/partition1/domain0/SB0: unable to prepare board due to SBBC group failure.
/N0/SB0: poweron may not have completed due to a hardware failure
случайность:
№4 РЕШЕНО, установка новой частоты ЦПУ в сервисном режиме SC
--- Цитировать ---Jun 16 15:28:01 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup0/cpuAB/
cpusafariagent0: CPU Serial number mismatch: please update cpu speed property v
ia:
sepromupdate //SB4 -cpu_speed A <cpu_speed>
Jun 16 15:28:08 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup0/cpuAB/
cpusafariagent1: CPU Serial number mismatch: please update cpu speed property v
ia:
sepromupdate //SB4 -cpu_speed B <cpu_speed>
Jun 16 15:28:09 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup1/cpuCD/
cpusafariagent0: CPU Serial number mismatch: please update cpu speed property v
ia:
sepromupdate //SB4 -cpu_speed C <cpu_speed>
Jun 16 15:28:17 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup1/cpuCD/
cpusafariagent1: CPU Serial number mismatch: please update cpu speed property v
ia:
sepromupdate //SB4 -cpu_speed D <cpu_speed>
--- Конец цитаты ---
Возникла при замене двух процов по 900Мгц на 4 штуки 1050Мгц
решил прогнать команду testboard sb4 В ней тоже всякая кака
--- Цитировать ---sc1.YYY.ru:SC> testboard sb4
Loading the test table from board SB4 PROM 0 ...
Jun 16 15:30:37 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup0/cpuAB/
cpusafariagent0: CPU Serial number mismatch: please update cpu speed property v
ia:
sepromupdate //SB4 -cpu_speed A <cpu_speed>
Jun 16 15:30:38 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup0/cpuAB/
cpusafariagent1: CPU Serial number mismatch: please update cpu speed property v
ia:
sepromupdate //SB4 -cpu_speed B <cpu_speed>
Jun 16 15:30:38 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup1/cpuCD/
cpusafariagent0: CPU Serial number mismatch: please update cpu speed property v
ia:
sepromupdate //SB4 -cpu_speed C <cpu_speed>
Jun 16 15:30:38 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup1/cpuCD/
cpusafariagent1: CPU Serial number mismatch: please update cpu speed property v
ia:
sepromupdate //SB4 -cpu_speed D <cpu_speed>
{/N0/SB4/P2} Running CPU POR and Set Clocks
{/N0/SB4/P3} Running CPU POR and Set Clocks
{/N0/SB4/P2} @(#) lpost 5.20.9 2008/02/26 13:13
{/N0/SB4/P3} @(#) lpost 5.20.9 2008/02/26 13:13
{/N0/SB4/P2} Copyright 2008 Sun Microsystems, Inc. All rights reserved.
{/N0/SB4/P3} Copyright 2008 Sun Microsystems, Inc. All rights reserved.
{/N0/SB4/P0} Running CPU POR and Set Clocks
{/N0/SB4/P2} Use is subject to license terms.
{/N0/SB4/P3} Use is subject to license terms.
{/N0/SB4/P1} Running CPU POR and Set Clocks
{/N0/SB4/P0} @(#) lpost 5.20.9 2008/02/26 13:13
{/N0/SB4/P1} @(#) lpost 5.20.9 2008/02/26 13:13
{/N0/SB4/P0} Copyright 2008 Sun Microsystems, Inc. All rights reserved.
{/N0/SB4/P1} Copyright 2008 Sun Microsystems, Inc. All rights reserved.
{/N0/SB4/P0} Use is subject to license terms.
{/N0/SB4/P1} Use is subject to license terms.
PostTestSequencer.sequencer: Cpu basic tests
cpuCD: All agents under test failed POST
{/N0/SB4/P2} Subtest: Setting Fireplane Config Registers for aid 0x12
{/N0/SB4/P2} Subtest: Display CPU Version, frequency
{/N0/SB4/P2} Version register = 003e0015.23000507
{/N0/SB4/P2} CPU features = 0000213f.003203ff
{/N0/SB4/P2} Ecache Control Register 00000000.07094400
{/N0/SB4/P2} Cpu/System ratio = 4, cpu actual frequency = 600
{/N0/SB4/P2} @(#) lpost 5.20.9 2008/02/26 13:13
{/N0/SB4/P2} Copyright 2008 Sun Microsystems, Inc. All rights reserved.
{/N0/SB4/P2} Use is subject to license terms.
{/N0/SB4/P3} Subtest: Setting Fireplane Config Registers for aid 0x13
{/N0/SB4/P3} Subtest: Display CPU Version, frequency
{/N0/SB4/P3} Version register = 003e0015.23000507
{/N0/SB4/P3} CPU features = 0000213f.003203ff
{/N0/SB4/P3} Ecache Control Register 00000000.07094400
{/N0/SB4/P3} Cpu/System ratio = 4, cpu actual frequency = 600
{/N0/SB4/P3} @(#) lpost 5.20.9 2008/02/26 13:13
{/N0/SB4/P3} Copyright 2008 Sun Microsystems, Inc. All rights reserved.
{/N0/SB4/P3} Use is subject to license terms.
PostTestSequencer.sequencer: Cpu basic tests
cpuAB: All agents under test failed POST
{/N0/SB4/P0} Subtest: Setting Fireplane Config Registers for aid 0x10
{/N0/SB4/P0} Subtest: Display CPU Version, frequency
{/N0/SB4/P0} Version register = 003e0015.23000507
{/N0/SB4/P0} CPU features = 0000213f.003203ff
{/N0/SB4/P0} Ecache Control Register 00000000.07094400
{/N0/SB4/P0} Cpu/System ratio = 4, cpu actual frequency = 600
{/N0/SB4/P0} @(#) lpost 5.20.9 2008/02/26 13:13
{/N0/SB4/P0} Copyright 2008 Sun Microsystems, Inc. All rights reserved.
{/N0/SB4/P0} Use is subject to license terms.
{/N0/SB4/P1} Subtest: Setting Fireplane Config Registers for aid 0x11
{/N0/SB4/P1} Subtest: Display CPU Version, frequency
{/N0/SB4/P1} Version register = 003e0015.23000507
{/N0/SB4/P1} CPU features = 0000213f.003203ff
{/N0/SB4/P1} Ecache Control Register 00000000.07094400
{/N0/SB4/P1} Cpu/System ratio = 4, cpu actual frequency = 600
{/N0/SB4/P1} @(#) lpost 5.20.9 2008/02/26 13:13
{/N0/SB4/P1} Copyright 2008 Sun Microsystems, Inc. All rights reserved.
{/N0/SB4/P1} Use is subject to license terms.
{/N0/SB4/P0} Failed
{/N0/SB4/P1} Failed
{/N0/SB4/P2} Failed
{/N0/SB4/P3} Failed
--- Конец цитаты ---
Навигация
Перейти к полной версии