學習啦>論文大全>技術論文>

網絡故障檢測技術論文

時間: 家文952 分享

  計算機網絡故障種類較多,計算機網絡故障檢測是一個復雜的系統(tǒng)工程,不僅對網絡故障處理步驟有所要求,而且對網絡故障分析方法以及計算機故障維護都有極高的要求。下面是由學習啦小編整理的網絡故障檢測技術論文,謝謝你的閱讀。

  網絡故障檢測技術論文篇一

  網絡故障診斷技術概述

  摘 要:對網絡故障診斷技術進行了概述。介紹了網絡故障診斷的基本概念及一般過程,重點對網絡故障診斷中的故障檢測、定位、原因診斷三個主要階段的關鍵技術和方法進行了深入研究,總結了相關領域經典主流方法,并給出了方法具體過程和細節(jié)。

  關鍵詞:網絡故障;故障檢測;故障定位;故障診斷;專家系統(tǒng);數據挖掘;神經網絡

  中圖分類號:TP393.06

  隨著計算機、通信以及互聯(lián)網技術的飛速發(fā)展及應用,網絡作為一種重要的工具,在軍事、政治、經濟和科研等諸多領域起著越來越重要的作用,已經成為社會生產和生活必不可少的一部分。與此同時,網絡的規(guī)模和復雜性不斷增大,一旦網絡發(fā)生故障,如果不能在有效時間內對網絡故障進行診斷與修復,將會造成巨大的損失,甚至嚴重威脅社會的安全與穩(wěn)定,因此對網絡故障診斷技術進行研究具有越來越重要的應用價值和現(xiàn)實意義。

  1 網絡故障診斷一般過程

  通常來說,網絡故障診斷是以網絡原理、網絡配置和網絡運行的知識為基礎,根據網絡出現(xiàn)的故障現(xiàn)象,并使用專門的網管理和檢測工具以獲取告警信息進而對網絡中出現(xiàn)的故障進行診斷、恢復以及預測的過程,一般可分為以下五個部分[1]:

  (1)故障檢測,即網絡故障告警信息的獲取。網絡發(fā)生故障時,通過主動輪詢或異步收集方式,對網絡中的相關設備或服務的相關告警信息、設置和性能參數,狀態(tài)信息等進行收集和分析,及時發(fā)現(xiàn)網絡出現(xiàn)的故障及問題。

  (2)故障定位,即定位故障源。對故障檢測階段收集的海量告警數據進行分析和處理,在網絡中找出故障,為下一步的故障原因的診斷提供依據。

  (3)故障原因的診斷,即查找故障產生的根源。根據故障定位的結果綜合運用各種規(guī)則進行系統(tǒng)的推理,快速的找到故障產生的原因或者最可能的原因。

  (4)故障修復。根據網絡故障診斷結果修復網絡故障,恢復網絡的正常運行。

  (5)故障預測,即根據先驗知識和監(jiān)測數據預測網絡可能發(fā)生的故障。

  其中故障檢測,故障定位,故障原因診斷是必不可少的三個步驟,下面將重點對上述三個步驟進行詳細的介紹。

  2 網絡故障檢測

  通常計算機網絡通過以下兩種方式收集信息,通過分析收集到的信息來檢測故障[2]。

  (1)Trap機制。在網絡中每一個被管設備中都要運行一個程序以便和管理站中的管理程序進行通信。

  (2)主動輪詢。網絡中發(fā)生故障的被管設備或服務主動向網絡管理系統(tǒng)發(fā)出告警信息,能夠及時發(fā)現(xiàn)網絡中的故障,網絡管理系統(tǒng)還需通過主動輪詢這種方式了解與網絡性能密切相關的信息,并對這些影響網絡性能信息設置閾值,來判斷網絡性能,超過設定閾值也會觸發(fā)事件。

  3 網絡故障定位

  網絡系統(tǒng)中,一般通過監(jiān)測被管設備或服務等各種方法獲取大量原始告警數據或歷史積累信息,這些數據往往由于通信系統(tǒng)的復雜性、網絡結構異構性、噪聲、外界因素、因果關系等原因而具有相當大的不確定性和不精確性,導致故障癥狀和故障原因都存在非線性映射關系,需要利用關聯(lián)技術對數據進行處理和分析才有效的進行故障定位[3],目前常用的故障定位技術主要有下面幾種:

  3.1 基于人工智能的故障定位技術

  3.1.1 基于規(guī)則的推理技術

  基于規(guī)則的推理(Rule-based Reason,RBR)是最簡單的關聯(lián)技術,已被用于多種構架。一般而言,基于規(guī)則的系統(tǒng)由三個組成部分組成,如圖1所示。

  (1)推理引擎,主要提供解決問題所需要的策略。

  (2)知識庫,提供和定義與問題相關的規(guī)則和專家知識。

  (3)工作內存,主要提供解決問題所需要的數據。

  在基于規(guī)則的推理的網絡故障定位系統(tǒng)中,知識庫充當一個專家的角色,利用從人類專家獲取專家積累的經驗和知識,這些知識主要包括對網絡問題的定義以及當某一特定問題發(fā)生時,網絡故障定位系統(tǒng)需要執(zhí)行的操作。工作內存主要是利用具體的網絡協(xié)議對網絡中的被管設備或服務進行監(jiān)測,得到有關被管設備或服務的各種信息。在對網絡故障進行定位時,推理引擎與知識庫共同合作,將監(jiān)測得到的網絡中被管設備或服務的狀態(tài)信息與知識庫中定義好的條件部分進行比對,根據條件滿足與否,來進行網絡故障的定位。

  基于規(guī)則的網絡故障定位系統(tǒng),由于無需對專家系統(tǒng)的具體結構和操作細節(jié)進行深入了解,從而具有結構簡單等諸多優(yōu)點,并且實現(xiàn)起來比較簡單,非常適用于小型系統(tǒng)。但是基于規(guī)則的網絡故障定位系統(tǒng)在匹配規(guī)則時,需要網絡狀態(tài)與知識庫中的規(guī)則條件精確匹配,否則將推出整個推理過程,無法定位故障,并且規(guī)則存在不易維護性和指數增長性,所有這些缺點決定了基于規(guī)則的網絡故障定位系統(tǒng)不適用大型系統(tǒng)。

  3.1.2 基于模型的推理技術

  基于模型的推理(Model-based Reason,MBR)是建立在面向對象上的基礎之上,利用現(xiàn)有的專家經驗和知識,將具體的目標系統(tǒng)中的實體都模型化診斷對象,并且明確地表現(xiàn)出現(xiàn)實目標系統(tǒng)中對象之間存在的各種關聯(lián)關系,再根據系統(tǒng)模型對具體的目標系統(tǒng)的行為進行推測。由于通常情況下,具體的目標系統(tǒng)與理想的系統(tǒng)模型之間存在差異性,因此基于模型的推理的專家系統(tǒng)需要對推測的行為和目標系統(tǒng)的實際行為進行不一致診斷,以確定具體目標系統(tǒng)中的故障根源。

  為了更好地說明基于模型的推理專家系統(tǒng)的工作流程,文獻[4]使用一個物理模型和對應的對等模型分別如圖2、3所示的網絡系統(tǒng)。網絡系統(tǒng)按一定的周期,有規(guī)律的向圖2中的被管設備發(fā)送ping命令以監(jiān)測網絡系統(tǒng)中的被管設備是否運行正常。管理系統(tǒng)和被管設備之間通過一個模型對象實現(xiàn)彼此之間的相互通信,具體來說,如圖2所示,系統(tǒng)中的集線器模型向被管設備集線器發(fā)送ping命令,路由器模型則向被管設備路由器發(fā)送ping命令。當目標網絡發(fā)生故障時,如果故障發(fā)生在集線器1,則集線器1模型可以將其發(fā)現(xiàn)并且識別出來,如果集線器1模型連續(xù)3次向被管設備集線器1發(fā)送ping命令,在3次響應超時以后,集線器模型1根據現(xiàn)有的網絡現(xiàn)象推測被管設備集線器1有可能發(fā)生故障,或者說目標系統(tǒng)中的故障位于集線器1。集線器1模型則會在確定故障并正式發(fā)送告警信息之前,集線器1模型將分析自身與圖2中其他被管設備的模型之間的關系以此來確定其是否應該詢問網絡中路由器模型,如網絡中的路由器模型返回的是相應的被管路由器設備工作處于正常狀態(tài),則集線器1觸發(fā)警報。   3.1.3 基于范例的推理技術

  基于范例的推理(Case-based Reason,CBR)故障定位技術與前面的基于規(guī)則推理技術和基于模型推理技術相比具有很大的差異性,主要因為基于范例的推理技術的思想源于人類現(xiàn)實生活,主要根據過去積累的實際經驗或經歷,利用類比的推理方法對現(xiàn)有的新問題做出相似的解答,然后根據新問題與舊問題之間的差異對解答進行修改從而得到新問題的完全解答?;诜独评淼木W絡故障定位技術主要由四個部分組成,檢索 (Retrieve)、復用(Reuse)、修正(Revise)、保存(Retain),簡稱4R過程。

  基于范例推理的故障定位技術與基于規(guī)則推理的故障定位技術相比,由于在基于范例推理的故障定位技術中檢索只是基于對案例的部分匹配,而基于規(guī)則推理的故障定位技術則是完全匹配,因此基于范例推理的故障定位技術對網絡配置變化的適應度更好,更適用于問題的總體解決方案。

  3.2 模型遍歷技術

  模型遍歷技術(Model traversing techniques)是一種構建網絡故障傳播模型的方法,該方法在構建故障傳播模型時,主要根據網絡在運行時各種被管對象之間的相互關系,并且按照從引起事件的被管對象開始的順序進行構建。該方法主要適用于網絡中被管對象之間的相互關系類似于圖形,并且一般情況下較容易獲取的情況,并且在系統(tǒng)配置變化較頻繁時該方法的魯棒性很好。模型遍歷技術主要具有兩大特點,事件驅動和事件關聯(lián),所謂事件驅動是指在一個故障癥狀報告到來之前,系統(tǒng)一直處于等待故障癥狀狀態(tài);事件關聯(lián)則是確定兩個故障癥狀是否來源同一個事件源。

  一般情況下,模型遍歷技術需要在其事件報告中明確標識網絡系統(tǒng)中故障的征兆類型、征兆目標等相關信息,如果網絡系統(tǒng)中出現(xiàn)故障征兆,且不妨用si來表示該故障征兆,當si的目標和si來源相同,則說明si是一個次要征兆也就說明某些告警信息可以被忽略。模型遍歷技術的整個處理可分為以下3步:

  (1)首先,對網絡中的每個事件,依據網絡在運行時各種被管對象之間的相互關系對其構建一個和事件源相關的對象圖。

  (2)當給定的兩個事件的對象圖相交時,此時說明兩個圖至少包含同一個對象,則認為這兩個對象圖的事件源是關聯(lián)的。

  (3)當給定三個故障癥狀si,sj,sk,其中si,sj相互關聯(lián),sj,sk相互關聯(lián),則根據故障癥狀的傳遞性可知si是一個次要的故障癥狀。

  4 網絡故障原因診斷

  (1)基于信號處理方法。該方法主要是依據信號模型,直接對網絡系統(tǒng)中的可測信號進行分析與處理,并通過提取可測信號的頻率等特征值,對網絡中存在的故障原因進行診斷。

  (2)基于解析模型的方法?;诮馕瞿P偷姆椒ㄖ饕罁祵W模型和數學方法來進行故障原因的診斷,在診斷時需要建立對象的精確數學模型。

  (3)基于知識檢測的方法。與基于解析模型方法相比,此方法最大的特點在于其并不需要對象的精確數學模型就可以對網絡中的故障原因進行診斷。

  下面主要介紹幾種目前國內外研究學者研究比較多的基于知識檢測的方法,基于專家系統(tǒng)故障原因診斷方法和基于模糊理論故障原因診斷方法以及基于BP神經網絡故障原因檢測方法。

  4.1 基于專家系統(tǒng)故障原因診斷方法

  基于專家系統(tǒng)故障原因診斷系統(tǒng)主要是利用人類專家的經驗和歷史積累診斷數據,使用一定的方法將其轉化為系統(tǒng)能夠識別的規(guī)則存在專家系統(tǒng)的知識庫中。當網絡中出現(xiàn)故障時,診斷系統(tǒng)利用專家系統(tǒng)知識庫中的規(guī)則,對發(fā)生故障網絡中的被管對象的各項性能參數進行處理與分析以正確的確定網絡故障發(fā)生的具體原因[5]。組成由人機接口、推理機、知識庫等六部分組成:

  目前,國內外學者公認的專家系統(tǒng)瓶頸是知識獲取問題,因為專家系統(tǒng)在診斷過程中主要依賴于從人類專家領域內獲取的知識、經驗和以往診斷數據,而這些獲取起來途徑有限,操作起來具有一定的局限性和復雜性。另外,專家系統(tǒng)在實時性和學習能力等方面也存在一定的局限性,因此目前通常將專家系統(tǒng)同其他方法相結合以提高專家系統(tǒng)在這些方面存在的局限性和不足。

  4.2 模糊故障診斷方法

  很多時候,網絡中的故障與系統(tǒng)得到的網絡現(xiàn)象之間存在非線性的映射關系,這種非線性的映射關系很難用確定的數學公式或者模型來刻畫,相應的在故障原因診斷時,很難給出故障的精確原因。相反,只能給出故障發(fā)生的可能原因。對于這種存在一定模糊性的問題,可以使用模糊邏輯來解決。

  目前使用的比較多的是向量識別法,其診斷過程可分為以下3步:

  首先,需要根據網絡中的故障與表征網絡故障的數據,建立二者之間的關系,通常用關系矩陣R來表示。

  其次,對需要診斷的目標網絡系統(tǒng)(對象)進行狀態(tài)檢測,提取相關的特征參數以構建特征向量矩陣X。

  最后,根據模糊理論和矩陣理論,求解前面兩步構建的關系矩陣方程Y=X・R,得到關系矩陣方程的解Y,再根據隸屬度等原則,對目標網絡系統(tǒng)的故障向量Y進行處理,得到故障的原因。

  從上述診斷過程可知,在模糊故障診斷中,正確的進行故障原因診斷的前提是建立關系矩陣R、隸屬函數、特征值向量X,而這些矩陣、函數、向量的建立是人為構造而成,難免具有一定的主觀性,并且由于該模糊診斷方法對特征元素的選取也有一定的要求,所以兩者若處理不當,會導致該方法的診斷結果精度嚴重下降甚至完全錯誤。

  4.3 BP神經網絡診斷方法

  由于人工神經網絡的這些特性以及網絡中故障與征兆之間有可能存在的非線性映射關系,使得人工神經網絡在網絡故障診斷中大有用武之地。目前,人工神經網絡已經大量應用在網絡故障診斷領域。BP神經網絡是常用的人工神經網絡模型[6]。

  BP神經網絡故障診斷分為訓練和診斷兩個階段:

  (1)訓練階段。BP神經網絡對樣本進行訓練,以選定網絡結構和規(guī)模,確定網絡總層數、各層神經元數。借助BP學習算法,將原始網絡收集到的故障樣本的特征參數作為BP神經網絡輸入樣本集,以與之對應的網絡故障原因編碼為BP神經網絡的輸出,以此對BP神經網絡進行訓練。

  (2)故障診斷階段。主要對待檢測對象的故障樣本進行特征提取和歸一化處理,然后輸入到BP神經網絡進行診斷輸出診斷結果,整個過程分為以下4個步驟:1)故障樣本集預處理。2)BP網絡結構設計。3)訓練BP神經網絡。4)故障診斷。

  5 結束語

  本文對網絡故障的概念以及基本過程進行了概述,重點對當前網絡故障中的故障檢測、故障定位、故障診斷的關鍵技術及方法進行了研究和總結歸納,對開展網絡故障診斷技術研究具有一定的指導意義。

  參考文獻:

  [1]王成等.網絡故障診斷技術研究[J].科技信息,2011(11).

  [2]陳琳.一種網絡環(huán)境中的故障診斷模型[J].北京航空航天大學學報,2004(11).

  [3]張燕.網絡故障診斷關鍵技術[J].電腦知識與技術,2009(31).

  [4]李千目.戰(zhàn)略互聯(lián)網智能診斷技術研究[D].南京理工大學,2005.

  [5]吳曉知,李興明.網絡故障管理專家系統(tǒng)中知識庫的構造[J].微計算機信息,2008(06).

  [6]戚涌,劉鳳玉.基于BP神經網絡的網絡智能診斷系統(tǒng)[J].微電子學與計算機,2004(10).

  作者簡介:張璋(1987.12-),男,安徽蚌埠人,碩士研究生,研究方向:網絡安全、身份認證。

  作者單位:南京理工大學 計算機科學與工程學院,南京 210094

點擊下頁還有更多>>>網絡故障檢測技術論文

2794379