ВТ (непрофильный форум) > Уголок SUNтехника, SF 4800

Разные ошибки, что всплыли

(1/2) > >>

случайность:
Тема об ошибках что были замечены в процессе изучения сервера SF 4800

Буду рассматривать все замеченые ошибки, а так же их способы устранения.

случайность:
№1.

Первая ошибка была замечена во время прогона команды testboard sb0

--- Цитировать ---{/N0/SB0/P1} ERROR: TEST=Memory Tests,SUBTEST=Memory MATS+ ID=61.3
{/N0/SB0/P1} Component under test: /N0/SB0/P1 Memory
{/N0/SB0/P1}    Correctable error count (2098) exceeds MPR threshold (2097)
{/N0/SB0/P1}    logical bank 0, dimm 0 (J14300)
{/N0/SB0/P1} Failed Memory MATS+

--- Конец цитаты ---

Что то с памятью, указывается на палку памяти под номером J14300

случайность:
№2. РЕШЕНО, ремонт и замена вентиляторов БП

Вторая ошибка вылезла во время прогона команды testboard sb4, Но она не связана с процессорной платой. Это ошибка перегрева БП PS1.


--- Цитировать ---Mar 03 20:52:28 sc0.YYY.ru Platform.SC: WARNING: PS1 temperature is approaching max limit of 78C
Mar 03 20:52:28 sc0.YYY.ru Platform.SC: PS1 48 VDC 0 Temp. 0 value: 68 Degrees C
Mar 03 20:52:28 sc0.YYY.ru Platform.SC: Check for abnormal environmental operating conditions.
Mar 03 20:52:28 sc0.YYY.ru Platform.SC: PS1, sensor status, outside acceptable limits (7,1,0x605010b00030000)

--- Конец цитаты ---

Дождался окончания прогона теста и выключил сервер командой poweroff all Пока версия в вентиляторах, Потому что при подаче питания на этот БП он шумел вентилятором. Потом затих.

Пока БП не достать из корпуса в виду невозможности вытащить сервер. Нет колес.

следуюшие ошибки посыпались в консоль во время отключения сервера


--- Цитировать ---Mar 03 20:54:56 sc0.YYY.ru Platform.SC: Notice: PS1 48 VDC 0 Temp. 0 device temperature has stabilized.
Mar 03 20:54:56 sc0.mdi.ru Platform.SC: PS1 48 VDC 0 Temp. 0 normal operating temperature: value: 68 Degrees C
Mar 03 20:54:56 sc0.mdi.ru Platform.SC: PS1, sensor status, within acceptable limits (7,2,0x605010b00030000)

Mar 03 20:55:38 sc0.YYY.ru Platform.SC: CAUTION: Physically removing the last power supply will cause the system to lose power.

--- Конец цитаты ---

случайность:
3.

добыл процессорную плату, надежды было мало что живая, так и есть

ошибка

May 26 15:24:42 sc1.YYY.ru Platform.SC: /partition1/domain0/SB0: RepeaterHpu.pre
pare: sun.serengeti.HpuFailedException: SbbcGroup.fillPostStructs: CPU0DCB
/partition1/domain0/SB0: unable to prepare board due to SBBC group failure.
/N0/SB0: poweron may not have completed due to a hardware failure

случайность:
№4 РЕШЕНО, установка новой частоты ЦПУ в сервисном режиме SC


--- Цитировать ---Jun 16 15:28:01 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup0/cpuAB/
cpusafariagent0: CPU Serial number mismatch:  please update cpu speed property v
ia:
        sepromupdate //SB4 -cpu_speed A <cpu_speed>
Jun 16 15:28:08 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup0/cpuAB/
cpusafariagent1: CPU Serial number mismatch:  please update cpu speed property v
ia:
        sepromupdate //SB4 -cpu_speed B <cpu_speed>
Jun 16 15:28:09 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup1/cpuCD/
cpusafariagent0: CPU Serial number mismatch:  please update cpu speed property v
ia:
        sepromupdate //SB4 -cpu_speed C <cpu_speed>
Jun 16 15:28:17 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup1/cpuCD/
cpusafariagent1: CPU Serial number mismatch:  please update cpu speed property v
ia:
        sepromupdate //SB4 -cpu_speed D <cpu_speed>

--- Конец цитаты ---

Возникла при замене двух процов по 900Мгц на 4 штуки 1050Мгц

решил прогнать команду testboard sb4 В ней тоже всякая кака


--- Цитировать ---sc1.YYY.ru:SC> testboard sb4
Loading the test table from board SB4 PROM 0 ...
Jun 16 15:30:37 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup0/cpuAB/
cpusafariagent0: CPU Serial number mismatch:  please update cpu speed property v
ia:
        sepromupdate //SB4 -cpu_speed A <cpu_speed>
Jun 16 15:30:38 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup0/cpuAB/
cpusafariagent1: CPU Serial number mismatch:  please update cpu speed property v
ia:
        sepromupdate //SB4 -cpu_speed B <cpu_speed>
Jun 16 15:30:38 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup1/cpuCD/
cpusafariagent0: CPU Serial number mismatch:  please update cpu speed property v
ia:
        sepromupdate //SB4 -cpu_speed C <cpu_speed>
Jun 16 15:30:38 sc1.YYY.ru Platform.SC: /partition1/domain0/SB4/bbcGroup1/cpuCD/
cpusafariagent1: CPU Serial number mismatch:  please update cpu speed property v
ia:
        sepromupdate //SB4 -cpu_speed D <cpu_speed>
{/N0/SB4/P2} Running CPU POR and Set Clocks
{/N0/SB4/P3} Running CPU POR and Set Clocks
{/N0/SB4/P2} @(#) lpost         5.20.9  2008/02/26 13:13
{/N0/SB4/P3} @(#) lpost         5.20.9  2008/02/26 13:13
{/N0/SB4/P2} Copyright 2008 Sun Microsystems, Inc.  All rights reserved.
{/N0/SB4/P3} Copyright 2008 Sun Microsystems, Inc.  All rights reserved.
{/N0/SB4/P0} Running CPU POR and Set Clocks
{/N0/SB4/P2} Use is subject to license terms.
{/N0/SB4/P3} Use is subject to license terms.
{/N0/SB4/P1} Running CPU POR and Set Clocks
{/N0/SB4/P0} @(#) lpost         5.20.9  2008/02/26 13:13
{/N0/SB4/P1} @(#) lpost         5.20.9  2008/02/26 13:13
{/N0/SB4/P0} Copyright 2008 Sun Microsystems, Inc.  All rights reserved.
{/N0/SB4/P1} Copyright 2008 Sun Microsystems, Inc.  All rights reserved.
{/N0/SB4/P0} Use is subject to license terms.
{/N0/SB4/P1} Use is subject to license terms.
PostTestSequencer.sequencer: Cpu basic tests
cpuCD: All agents under test failed POST
{/N0/SB4/P2} Subtest: Setting Fireplane Config Registers for aid 0x12
{/N0/SB4/P2} Subtest: Display CPU Version, frequency
{/N0/SB4/P2} Version register = 003e0015.23000507
{/N0/SB4/P2} CPU features = 0000213f.003203ff
{/N0/SB4/P2} Ecache Control Register 00000000.07094400
{/N0/SB4/P2} Cpu/System ratio = 4, cpu actual frequency = 600
{/N0/SB4/P2} @(#) lpost         5.20.9  2008/02/26 13:13
{/N0/SB4/P2} Copyright 2008 Sun Microsystems, Inc.  All rights reserved.
{/N0/SB4/P2} Use is subject to license terms.
{/N0/SB4/P3} Subtest: Setting Fireplane Config Registers for aid 0x13
{/N0/SB4/P3} Subtest: Display CPU Version, frequency
{/N0/SB4/P3} Version register = 003e0015.23000507
{/N0/SB4/P3} CPU features = 0000213f.003203ff
{/N0/SB4/P3} Ecache Control Register 00000000.07094400
{/N0/SB4/P3} Cpu/System ratio = 4, cpu actual frequency = 600
{/N0/SB4/P3} @(#) lpost         5.20.9  2008/02/26 13:13
{/N0/SB4/P3} Copyright 2008 Sun Microsystems, Inc.  All rights reserved.
{/N0/SB4/P3} Use is subject to license terms.
PostTestSequencer.sequencer: Cpu basic tests
cpuAB: All agents under test failed POST
{/N0/SB4/P0} Subtest: Setting Fireplane Config Registers for aid 0x10
{/N0/SB4/P0} Subtest: Display CPU Version, frequency
{/N0/SB4/P0} Version register = 003e0015.23000507
{/N0/SB4/P0} CPU features = 0000213f.003203ff
{/N0/SB4/P0} Ecache Control Register 00000000.07094400
{/N0/SB4/P0} Cpu/System ratio = 4, cpu actual frequency = 600
{/N0/SB4/P0} @(#) lpost         5.20.9  2008/02/26 13:13
{/N0/SB4/P0} Copyright 2008 Sun Microsystems, Inc.  All rights reserved.
{/N0/SB4/P0} Use is subject to license terms.
{/N0/SB4/P1} Subtest: Setting Fireplane Config Registers for aid 0x11
{/N0/SB4/P1} Subtest: Display CPU Version, frequency
{/N0/SB4/P1} Version register = 003e0015.23000507
{/N0/SB4/P1} CPU features = 0000213f.003203ff
{/N0/SB4/P1} Ecache Control Register 00000000.07094400
{/N0/SB4/P1} Cpu/System ratio = 4, cpu actual frequency = 600
{/N0/SB4/P1} @(#) lpost         5.20.9  2008/02/26 13:13
{/N0/SB4/P1} Copyright 2008 Sun Microsystems, Inc.  All rights reserved.
{/N0/SB4/P1} Use is subject to license terms.
{/N0/SB4/P0} Failed
{/N0/SB4/P1} Failed
{/N0/SB4/P2} Failed
{/N0/SB4/P3} Failed

--- Конец цитаты ---

Навигация

[0] Главная страница сообщений

[#] Следующая страница

Перейти к полной версии