一、 對比組(替換法)
在有些情況,無法確定問題,就需要做實驗,通過每次修改不同變量,來確定問題。在進行對比實驗時,每次只能有一個變量作為變化,避免一次修改多個變量導致對實驗結果推斷的錯誤。在進行實驗時要詳盡的記錄實驗環境和操作步驟,以便為以后現象復現提供依據。
在日常工作中常用的對照組有故障前和故障后,通過思考故障前后操作的內容,以推斷是故障可能出現的原因。
時間服務器接收不到衛星信號?
第一步先采用拆分法,定位問題。天線部分實際上可分為三部分,蘑菇頭,線,設備。
測試設備ANT是否有5V,確定設備端是否正常;測試天線是否有阻值,以判斷線是否完整。如果上述都正常就可以采用替換法,先移動蘑菇頭放置的位置,將蘑菇頭放置在室外空曠位置,測試5分鐘是否接收到衛星信號。在排除天線和蘑菇頭問題外,可以更好的確定設備確實是否是設備故障。
時間服務器授時不同步問題排查步驟圖表
二、 終局思維
這件事本身是為了解決什么問題?回到事物需要解決的本源上去思考應該采取什么操作。終局思維要從客戶的最開始想解決的需求上去思考,而不是將思維限定在客戶開始設定的解決思路上。例如客戶經常會對NTP監控提出各種解決辦法,站在終局思維去思考,無非是證明NTP系統是否是正常的。
根據此出發監控指標就只有三個:設備兩臺之間偏差小于15毫秒,設備對外提供服務器正常,客戶端同步服務器正常。這個三個指標有個簡單的判斷,直接在客戶端執行ntpq–p,時間源前面為*和+的就是代表整個系統是正常的。遇到無法同步的解決思路,原因是萬兆交換機和子鐘波百兆特率不匹配,客戶要的是時間顯示正常,隨便找個系統內設備作為二級就可以了。
三、擱置問題
擱置觀察問題,不是說不解決;其基本思路是系統的復雜性導致我們不能直接給出解決辦法,故障的情況如果是問題就一定還會復現,如果不在復現,那么本身可能是某種未知的偶然性問題,本身不解決問題也不大。在實際工作中,擱置的問題一定要跟客戶約定再次溝通的時間,只有當觀察一段時間問題未在出現,那么問題才可以真正將其列為不在次范疇的問題。
什么問題適合擱置?
不知道什么原因導致的問題,猜測一種測試思路,讓客戶先測試一下。
四、概率的大小
任何事物都有一定的正確分布概率,思考問題的思路一定優先從大概率事件思考,當大概率可能排除后,才可以思考這件事的概率情況。例如:客戶反應新的HJ210設備其中一個網口不能使用的,ping不通網口,更換一臺設備后,運行一個月設備又出現這樣的現象。根據以往經驗HJ210的工控機沒出現過這樣的現象,一般工控機的故障在運行四五年之后才會出現,判斷可能是設備兩個網口設置在通一個IP段內,導致只有一個口可通信。
總結:
NTP服務器所出現的各種問題都是可以按章排除的,有時需要客戶耐心一點,配合技術工程師一步步的完成操作,完全可以解決授時過程中的一些困境。
掃一掃咨詢微信客服