Skip to main content

Dell PowerEdge Server維護筆記

Dell 服務器是否硬體異常

1.服務器燈號
2.iDrac 報錯誤訊息.

那內建的 Lifecycle controller Hardware diagnostics
ePSA (Enhanced Pre-Boot System Assessment) ,PSA Pre-Boot System Assessment. Diagnostics 是做啥用途?

其實ePSA , PSA 規劃原理
官方已經聲明了 
當您的 Dell 電腦、平板電腦或伺服器似乎無法正常運作時,診斷公用程式可用來協助 找出潛在的硬體問題
https://www.dell.com/support/kbdoc/zh-tw/000180971/resolve-hardware-issues-with-built-in-and-online-diagnostics-supportassist-epsa-epsa-or-psa-error-codes

這是給Dell 到府的上門工程師使用. 當做完硬體更換後 硬體還是繼續報錯後 用來找出很不好搞的問題.

假設ePSA 沒過,那真的代表電腦硬體就有立刻問題嗎?

翻開 Dell EMC PowerEdge Servers Troubleshooting Guide 

PSA 錯誤代碼參考 

有發現流程BIOS 都要求更新到最新嗎? 並且反覆測試
這是因為有可能會有BUG 還有誤判可能

如這PCI Device報錯誤 是BUG造成
https://www.dell.com/support/kbdoc/en-us/000195458/unknown-pcie-network-adapter-health-status-in-idrac9?lang=en

因此要PSA 完全都沒有錯誤
1. BIOS要更新到最新
2.重複做PSA流程
3.順便嘗試修正可能造成錯誤原因

總結
PSA 完整測試 是給你 “確定硬體或懷疑硬體有故障” 做的細節檢測方式… 並且主要給Dell上門維修工程師 檢測用

還不如 PSA 針對每項目 如DRAM ,CPU ,HDD 會比較簡單可確定資訊. 

特別是老機Server ,當只更換某些零件而要求 PSA 全通過. 這是比較沒有必要的.

Thx Chang

Author Thx Chang

More posts by Thx Chang