本站小編為你精心準備了故障分析的數字電視論文參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
1遙控監測站點的特點及維護難點
1.1早期監測設備運行時間過長監測站點中2007年建設的站點占所有監測站點的半數以上,設備到現在已運行7年,遠遠超過電子設備平均壽命,監測主機、解調/解擾設備、監測板卡等硬件持續老化,突發性故障多發,導致故障率不斷升高而且故障點分散性、隨機性強,維護難度大。
1.2模擬及部分數字監測站點設備架構落后通過圖1可以發現,所有模擬監測站點及部分數字監測站點采用半嵌入式結構,存儲及各種軟件運行均依賴監測主機,多個可能的故障環節集中到工控機本身,工控機自身的故障多發導致設備故障率升高,同時給故障分析及故障環節定位帶來較大困難,不易進行有針對性的維護。
1.3多個廠商設備共存數字監測站點共采用三個生產廠家的設備,每個廠家的設備架構和組成都不一樣,底層運行協議及系統軟件均不同,雖然接口協議都符合總局標準及招標需求,但兼容性仍然不夠理想,增加了維護難度。
2常見故障分析及故障處理流程
根據監測站點的特點及日常維護工作總結,常見故障現象主要分為三大類,即網絡故障、軟件故障、硬件故障。
2.1網絡故障
2.1.1交換機及網線包括交換機電源故障、交換模塊故障、交換機配置文件損壞及網線松動等,交換機及網線故障一般不易遠程判斷,主要依靠站點代維人員通過觀察交換機指示燈及電源指示燈來判斷,通常需要更換交換機。
2.1.2協議轉換器江蘇省廣播電視監測網采用省廣電干線網SDH進行三級組網,現仍有8個地市的區縣采用協議轉換器(光電轉換)實現2M數據鏈路傳輸,協議轉換器成對使用,市、縣任何一端出現故障都會導致網絡異常,多數網絡故障都是由于協議轉換器的電源適配器損壞,協轉無法工作所致,需依靠站點代維人員輔助判斷,一般要更換協轉電源適配器。
2.1.3數據傳輸鏈路較少發生故障,如果排除上述兩個環節,就要考慮SDH傳輸鏈路中某個環節出現問題,需聯系各相關網絡機房網管或技術員幫助排查解決。
2.2硬件設備類故障
2.2.1電源包括遠程電源管理器故障、管理模塊故障、解調器電源模塊故障、場強儀電源模塊故障、板卡箱電源模塊故障、主機電源故障及電源線脫落等,在網絡正常的情況下可通過PING命令初步判斷各個設備運行狀態,進行初步排除,結合遠程維護軟件和站點人員現場查看確定故障環節,日常維護中主要以電源管理器及解調器電源模塊故障較多見。
2.2.2硬盤包括系統硬盤及陣列硬盤故障,系統硬盤故障及主機上的陣列硬盤一般遠程無法直接判斷,都會導致主機無法啟動或自檢失敗,遠程只能判斷出該站點主機是否通訊正常,需站點代維人員協助判斷。存儲器硬盤故障可通過存儲器管理口遠程判斷,存儲器硬盤可以快遞備品到站點并由站點人員代換,中心維護人員進行遠程配置,主機內硬盤必須現場更換并重新安裝系統或重做陣列,在維護中最耗時。
2.2.3風扇包括CPU風扇及機箱散熱風扇故障,風扇故障一般是由于運行時間過長或機房環境較差導致風扇停轉,風扇停轉的直接影響就是CPU無法工作致主機無法啟動或啟動后短時間內又自動關機,機箱散熱風扇故障極易導致硬盤、顯卡、監測板卡等過熱,設備壽命縮短。風扇故障需要現場拆機判斷及更換。
2.2.4監測板卡包括主機內的模擬監測板卡及數字嵌入式板卡故障,主要是由于板卡工作時間過長導致老化損壞,驅動無法加載,視頻無法采集,中心無法觀看視頻,可以通過遠程控制軟件訪問主機查看板卡狀態。模擬監測板卡單塊損壞會導致所有板卡驅動無法加載,需及時更換,數字監測板卡每塊對應一個IP流輸出,個別板卡故障不影響基本監測。
2.3軟件故障
2.3.1操作系統包括操作系統崩潰及系統假死,系統崩潰主要是由于系統運行時間過長或頻繁斷電重啟造成系統內核文件損毀,常見于LINUX操作系統的監測站點;系統運行產生的系統垃圾文件及監測軟件中的日志文件過大容易導致系統盤空間被占滿,從而造成系統假死,多見于WINDOWS操作系統的監測站點。系統假死可以通過遠程訪問刪除垃圾文件解決,系統崩潰需要到站點現場更換系統硬盤或重裝操作系統。
2.3.2運行軟件及配置文件包括軟件運行異常及配置錯誤,軟件運行異常主要由于運行時間過長導致的進程崩潰,看門狗軟件異常導致的軟件無法正常啟動及軟件版本不一致導致運行異常。配置錯誤及參數設置不正確容易造成軟件通訊、解擾、解調、存儲、上報等功能無法正常實現,兩種故障情況都主要依靠遠程調試及配置來解決。
2.4信號問題
2.4.1信號中斷常見的原因主要有信號線在機房施工中圖被挖斷、信號線脫落、分配器故障、模擬停傳等,信號中斷情況并不多見,主要依靠站點維護人員代為排查并幫助恢復。
2.4.2授權及信源錯誤主要是智能卡授權到期未能及時續授權及信號源不是最新的用戶端信號,需要和站點所在地網絡公司進行協調解決。
2.5故障處理的一般流程故障的處理要求準確、高效、具體、有針對性,一般采通過用戶反饋和每日一報獲取故障信息及維護請求,維護人進行簡單故障判斷、故障具體環節判斷和分析,根據判斷情況,優先采用遠程維護,無法解決的在確定故障環節的情況下制定完善的維護計劃,做好現場維護及備件準備。詳細故障處理流程見圖3。
3幾點維護經驗
3.1充分發揮中心軟件中的狀態監控功能中心軟件具有站點運行狀態查看功能,該功能通過不同顏色表示不同的工作狀態,根據狀態可以初步判定站點異常情況。比如紫色表示軟件工作異常,主機工作正常,可以通過遠程訪問來查看具體情況并遠程重啟計算機及軟件等;紅色表示主機通訊異常,無法上傳數據,在網絡和遠程電源管理器正常的情況下通過中心軟件可以進行遠程斷電重啟設備。充分利用狀態監控功能,能方便、快捷的處理一般簡單故障,也能更快的排除及定位故障環節。
3.2網絡故障環節的判斷要慎重網絡故障具體表現為站點所有設備都無法通訊,可能的原因多樣,故障環節的判斷較復雜,同時網絡故障有可能牽涉到第三方(網絡公司),所以對網絡故障環節判斷必須慎重,首先從站點網絡設備如交換機、網線、協議轉換器等入手,最后才考慮數據鏈路故障的可能,并請網絡公司人員幫助排查。
3.3用好遠程維護的技術手段站點的維護工作主要依靠遠程維護,大部分的非硬件故障都可以通過遠程解決,部分硬件故障也需要遠程軟件來協助進行故障分析和故障環節定位,因此要充分發揮遠程維護技術手段在維護中的作用。我們采用的技術手段主要有三種:1.遠程電源管理器、計算機遠程桌面控制軟件、遠程訪問命令及軟件,監測站點都配備遠程電源管理器,通過WEB訪問或中心軟件可以方便的對電源管理器供電的設備進行斷電重啟;2.計算機遠程桌面控制軟件較常用的有VNC和PCANYWHERE,共同的特點是可以對固定IP的站點計算機遠程訪問,遠程桌面會顯示在主控計算機上,通過鼠標、鍵盤實現對站點主機的操作,跟在現場操作一樣方便有效;3.對部分LINUX系統的站點,還可以通過PUTY軟件和TELNET進入系統內核通過命令行方式進行操作,適用于有一定LINUX系統基礎的技術人員。用好上述幾種遠程技術手段,不僅能及時完成站點大部分日常維護工作,同時也可以和現場維護相結合,提高維護效率。
3.4備品備件充分,方案完善,預防突發情況監測站點設備運行時間過長容易導致各種硬件故障,特別是采用工控機方式的站點,主機內部任何硬件的故障都可能導致主機無法啟動或頻繁死機現象,具體原因很難通過遠程手段來判斷,同時突發性故障也較常見,因此在通過遠程手段盡可能準確的定位故障環節的同時,還要充分做好維護方案,盡可能詳細的考慮各種可能的突發情況,備品備件要準備充分,風扇、硬盤、內存、電源、板卡等易損件必須常備。
3.5多依靠站點代維人員站點代維人員在維護中發揮著重要作用,特別是網絡故障及電源類故障特別需要依靠現場觀察來輔助定位故障環節,部分不需拆機更換的備件也是快遞給站點代維人員并委托其更換,多數需要現場操作的簡單維護都可以由其代為完成,保持和站點代維人員的良好溝通并充分發揮其維護能力不僅能更快的排除及定位故障環節,更能節省維護成本。
4改進維護工作的幾點建議與思考
4.1促進技術升級及設備更新
4.1.1加快設備更新加快嵌入式數字監測站點設備的安裝及更換,盡快啟動模擬監測設備向全嵌入式轉換,建設數字、模擬一體化的嵌入式監測站點,既能避免重復投入,又大大減少故障發生的幾率,也更加易于維護。
4.1.2推動SDH省市縣三級監測網絡擴容與改造將現在的縣級站點網絡傳輸模式向以太網方式轉變,摒棄協議轉換器這個易發故障的環節,部分提前轉換為以太接入的市縣運行情況表明,網絡故障的幾率將大大降低。同時對網絡帶寬進行擴容,以滿足監測業務的快速發展的需求。
4.1.3制定系統建設規范和接口標準建立一套適用于我省在建和已建監測系統的統一規范和接口協議標準,方便現有及新建系統功能擴展和在原系統基礎上的業務擴展,最終實現各業務系統之間互聯互通,站點設備和中心系統將在統一規范下相對獨立,不同廠商的設備在滿足該規范的條件下更好的兼容。
4.2改變維護方式及維護策略
4.2.1建立監測站點設備信息與維護記錄數據庫根據機房環境、供電情況、設備清單、設備年份、設備狀態等信息建立監測站點基本信息庫,并根據維護、巡檢情況對變化信息進行反饋和更新,為數據分析、設備趨勢預測和定期維護計劃制定提供基礎。
4.2.2改變維護策略按照設備使用年限、工作環境、老化程度和故障頻次將設備維護級別分為三個級別。一級優先級最高,設備年份最久,老化嚴重,故障隱患最大,二級次之,三級最低。根據級別分類,制定巡檢計劃,增加一級維護站點的巡檢次數,對可能存在隱患的設備環境、板卡、硬盤、風扇、系統等軟硬件環節進行排查及提前更換,做到提前維護,減少突發故障。
4.2.3簡化維護方式對所有監測站點配置文件進行備份,在對故障進行詳細分析的前提下,更多采用整機更換的方式,始終保證數套完整監測站點的備份,并根據監
測站點設備信息庫的數據及配置文件,快速還原故障站點需要更換的設備或主機,并遠程指導站點維護人員代為更換。
4.3加強培訓與溝通加強對我臺維護人員及站點代維人員的業務培訓,重點提高我臺維護人員的故障分析、判斷、遠程調試能力及現場維護水平;提高站點代維人員對站點設備構成及工作原理的了解并熟悉常見故障現象,同時和站點代維人員加強溝通,建立良好的合作關系。
5結束語
隨著廣播電視事業的快速發展,監測業務的需求不斷擴大,要求也不斷提高,監測站點設備所承載的功能也會越來越多,設備復雜性和多樣性增加,監測站點的維護難度會更高,重要性也更加突出。認真總結遙控監測站點的維護方法及維護經驗,積極探索改進維護工作的新辦法和新思路,是值得我們認真研究和探討的重要課題。
作者:蔣分田錢衛單位:江蘇省廣播電視監測臺