十年前,網(wǎng)絡(luò)相對(duì)簡(jiǎn)單。
網(wǎng)絡(luò)設(shè)備包括集線(xiàn)器、網(wǎng)橋和路由器等,每個(gè)設(shè)備都是一個(gè)獨(dú)立部分,相互之間可以識(shí)別。故障診斷也相對(duì)簡(jiǎn)單。如果連接的是一臺(tái)集線(xiàn)器,故障診斷則采取對(duì)沖突域進(jìn)行故障診斷的原則。在沖突域連接至一個(gè)網(wǎng)橋的地方所有問(wèn)題都消失了。故障診斷這時(shí)協(xié)議分析儀是故障診斷的最佳選擇之一,特別是當(dāng)用戶(hù)了解了網(wǎng)絡(luò)的基礎(chǔ)和使用的協(xié)議后會(huì)更為有效。
在這之后,出現(xiàn)了交換機(jī)。
交換網(wǎng)絡(luò)環(huán)境出現(xiàn)的問(wèn)題與前面提到的共享介質(zhì)環(huán)境的問(wèn)題有些類(lèi)似。例如:發(fā)生了什么問(wèn)題,問(wèn)題是誰(shuí)帶來(lái)的,問(wèn)題有多么嚴(yán)重?最主要的區(qū)別是問(wèn)題需要與交換機(jī)的一個(gè)特定端口相關(guān)聯(lián)。
在交換網(wǎng)絡(luò)環(huán)境中應(yīng)該考慮的問(wèn)題包括:每個(gè)端口的忙碌狀況
如何識(shí)別和跟蹤錯(cuò)誤源?
廣播風(fēng)暴的源頭是什么?
交換轉(zhuǎn)發(fā)表是否運(yùn)行正常?
哪個(gè)站點(diǎn)連接在這個(gè)端口上?
交換機(jī)對(duì)協(xié)議或端口是否有速率限制?
這個(gè)端口在VLAN中嗎?如果在是同服務(wù)器或服務(wù)在同一個(gè)VLAN中嗎?
在一個(gè)交換網(wǎng)絡(luò)里,您如何確定從哪里開(kāi)始動(dòng)手查找問(wèn)題?想深入“透視”一個(gè)交換網(wǎng)絡(luò)是非常困難的。首先,在2層交換的時(shí)候還是橋接轉(zhuǎn)發(fā)方式,但到了3層交換卻有了更高級(jí)的特性和轉(zhuǎn)發(fā)規(guī)則,例如VLAN。到了4層交換,就更加復(fù)雜了,出現(xiàn)了更高級(jí)的轉(zhuǎn)發(fā)和負(fù)載均衡技術(shù),故障診斷故障診斷和解決就需要更多的交換機(jī)配置知識(shí)。
在安裝完一臺(tái)交換機(jī)后,每個(gè)交換機(jī)的半雙工端口就構(gòu)成了一個(gè)沖突域。如果該端口連接了一個(gè)集線(xiàn)器,集線(xiàn)器下面連接若干站點(diǎn),那么沖突域會(huì)擴(kuò)大。但隨著交換產(chǎn)品的價(jià)格下跌,現(xiàn)在大多數(shù)新建的網(wǎng)絡(luò)每個(gè)交換端口都只連接一個(gè)站點(diǎn)。因此,在半雙工連接情況下,沖突域僅針對(duì)一個(gè)單獨(dú)的電纜鏈路。
交換機(jī)通常是一個(gè)獨(dú)立廣播域的一部分,包括串連或者并連的任意數(shù)目的其他交換機(jī)。如果使用了OSI模型3層的功能,就可以創(chuàng)建多廣播域,廣播域的數(shù)目與VLAN數(shù)目相等。最極限的情況,如果交換機(jī)功能允許,每個(gè)端口可以配置為一個(gè)獨(dú)立的廣播域。可以把這種情況描述為路由到桌面。為每個(gè)端口創(chuàng)建一個(gè)獨(dú)立的廣播域后,故障診斷就會(huì)嚴(yán)格受限。但是如果我們把每個(gè)端口設(shè)置為一個(gè)單獨(dú)的廣播域,交換機(jī)在轉(zhuǎn)發(fā)流量的時(shí)候,每個(gè)端口都需要路由服務(wù),這會(huì)占用交換機(jī)CPU的有限資源。在網(wǎng)絡(luò)環(huán)境中,對(duì)每個(gè)單獨(dú)的端口進(jìn)行路由請(qǐng)求和應(yīng)答是非常困難的,我們應(yīng)該避免這樣的配置。不幸的是,這種情況在實(shí)際情中非常常見(jiàn),網(wǎng)絡(luò)中經(jīng)常發(fā)現(xiàn)服務(wù)器全部在一個(gè)子網(wǎng)或者廣播域中,所有的客戶(hù)在另外的子網(wǎng)或者廣播域中。在這種情況下,所有的請(qǐng)求都必須路由。如果維護(hù)行為限制在一個(gè)單獨(dú)的服務(wù)器群里,那么考慮把服務(wù)器放進(jìn)單獨(dú)的VLAN里。然后把使用這臺(tái)服務(wù)器的用戶(hù)放到同一個(gè)VLAN。這樣就可以使用2層交換的橋接方式來(lái)交換流量,只有很少的請(qǐng)求需要路由。如果服務(wù)器支撐多于一個(gè)用戶(hù)區(qū),可以在服務(wù)器上多裝一塊網(wǎng)卡來(lái)實(shí)現(xiàn)到用戶(hù)的2層交換連接。
對(duì)交換機(jī)進(jìn)行故障診斷的5種技術(shù)
可以采取5種基本方式來(lái)透視交換機(jī)。每一種方法都不同,都有積極或者消極的一面。類(lèi)似在網(wǎng)絡(luò)中遇到的其他問(wèn)題一樣,沒(méi)有一個(gè)最好的答案。最合適的方案往往取決于您手中可以利用到的資源(什么工具可以使用或者以前安裝過(guò)什么工具),而且使用這些技術(shù)有可能造成服務(wù)中斷。
即使把這些方式組合起來(lái),也不能監(jiān)測(cè)到所連接的網(wǎng)絡(luò),在交換的環(huán)境里面,也不像集線(xiàn)器那樣方便監(jiān)測(cè)。我們幾乎不可能看到通過(guò)一個(gè)交換機(jī)的全部流量。大多數(shù)的故障診斷會(huì)假設(shè)流量會(huì)在站點(diǎn)和所連接的服務(wù)器之間或經(jīng)過(guò)故障診斷交換機(jī)uplink口通過(guò)。而實(shí)際上如果2臺(tái)主機(jī)直接傳輸信息的話(huà),就不會(huì)使用交換機(jī)的uplink口或者任何其他的端口來(lái)交換流量。除非你知道具體用到哪個(gè)端口,否則是監(jiān)測(cè)不到的。
舉個(gè)例子,如圖1,一臺(tái)服務(wù)器接入一臺(tái)交換機(jī)。在反映有問(wèn)題的用戶(hù)中,一部分是直接與這臺(tái)交換機(jī)相連,另外的一部分用戶(hù)是由這臺(tái)交換機(jī)的uplink口從其他路由器或者交換機(jī)連接上來(lái)的。故障報(bào)告是訪(fǎng)問(wèn)服務(wù)器“慢”,這樣的故障報(bào)告對(duì)技術(shù)支持工程師來(lái)說(shuō)基本上沒(méi)有任何價(jià)值。
方法1:通過(guò)TELNET或者串行口接入服務(wù)器
高級(jí)的網(wǎng)絡(luò)技術(shù)支持工程師或其他知道交換機(jī)密碼的人在進(jìn)行故障診斷時(shí)可以選擇通過(guò)TELENET或者交換機(jī)的串口登陸,來(lái)檢查交換機(jī)的配置。(如圖2)
交換機(jī)配置可以通過(guò)上面提到的2種方法查看,雖然問(wèn)題不一定是配置引起的。不管問(wèn)題是操作系統(tǒng)有BUG還是配置不完善,都不能從配置列表中輕易的查看出。配置信息在定位交換機(jī)是否像預(yù)期的那樣運(yùn)行上比較有用,但針對(duì)故障診斷就不是了。為了驗(yàn)證交換機(jī)的配置,往往需要使用多種的交換機(jī)故障診斷方法配合。
很多交換機(jī)都帶有實(shí)時(shí)的故障診斷工具,因?yàn)榻粨Q機(jī)生產(chǎn)廠(chǎng)家和型號(hào)的不同,這些故障解決工具的特征也各不相同。但是要使用好這些工具,必須依靠一定的理論知識(shí)和實(shí)際經(jīng)驗(yàn)。
方法2:連接到一個(gè)空閑端口
最簡(jiǎn)單的故障診斷方法是在交換機(jī)的空閑端口接入一個(gè)監(jiān)測(cè)工具,例如協(xié)議分析儀。
把監(jiān)測(cè)工具接入交換機(jī)的一個(gè)空閑端口,不用中斷服務(wù)就可以查看所屬?gòu)V播域。該監(jiān)測(cè)工具與廣播域里的其他站點(diǎn)一樣有相同的權(quán)限。
不幸的是,交換機(jī)(做為一個(gè)多端口的橋接設(shè)備)幾乎不轉(zhuǎn)發(fā)流量到監(jiān)測(cè)端口。因?yàn)闃蚪釉O(shè)備就是這樣設(shè)計(jì)的,流量直轉(zhuǎn)發(fā)到所屬的目的端口,不會(huì)去其他的端口。協(xié)議分析儀因此幾乎監(jiān)測(cè)不到流量。
圖4、交換機(jī)在源端口和目的端口之間轉(zhuǎn)發(fā)流量。非常少的流量會(huì)轉(zhuǎn)到其他端口。站點(diǎn)和服務(wù)器之間可能每秒鐘會(huì)轉(zhuǎn)發(fā)幾千個(gè)幀,但是監(jiān)測(cè)端口每分鐘只能看到幾個(gè)幀
轉(zhuǎn)發(fā)到監(jiān)測(cè)端口的流量幾乎全部都是廣播,包含一些零星的目的地址不明的幀。這些零星的幀是由于路由轉(zhuǎn)發(fā)表老化的結(jié)果,經(jīng)常是目的端口不明的幀。一些經(jīng)驗(yàn)不夠的技術(shù)人員看到這么高的廣播(接近100%),卻沒(méi)有注意到端口利用率很低,就誤判網(wǎng)絡(luò)出現(xiàn)了廣播風(fēng)暴,其實(shí)不是。
這樣查看交換網(wǎng)絡(luò)幾乎沒(méi)有用,因?yàn)楸O(jiān)測(cè)工具必須獲取流量。獲得的流量或者對(duì)廣播域的查詢(xún)對(duì)網(wǎng)絡(luò)搜索和發(fā)現(xiàn)其他類(lèi)型問(wèn)題是有很有幫助的,但對(duì)解決用戶(hù)連接慢的問(wèn)題并沒(méi)有多大的幫助。
對(duì)大多數(shù)交換機(jī)來(lái)說(shuō),都有一個(gè)更好的選擇,可以把需要監(jiān)測(cè)的端口流量備份到一個(gè)專(zhuān)門(mén)的空閑口。(見(jiàn)圖5)這種技術(shù)通常稱(chēng)為端口鏡像。
大多數(shù)交換機(jī)廠(chǎng)家都提供備份或鏡像流量的功能,可以把監(jiān)測(cè)工具接入交換機(jī)一個(gè)專(zhuān)門(mén)配置過(guò)的端口。老的交換機(jī)必須指定一個(gè)專(zhuān)門(mén)的監(jiān)測(cè)口做為鏡像口,但現(xiàn)在大多數(shù)新的交換機(jī)可以指定任何一個(gè)端口做為鏡像口。
雖然交換機(jī)廠(chǎng)家實(shí)現(xiàn)鏡像的方式各不相同,但是有一些基本相同的監(jiān)測(cè)選項(xiàng)。值得注意的是,幾乎在所有的情況下,交換機(jī)在轉(zhuǎn)發(fā)流量到鏡像口的時(shí)候,同時(shí)把錯(cuò)誤都過(guò)濾掉了。對(duì)于故障診斷來(lái)說(shuō),這意味著同時(shí)過(guò)濾掉了有用的信息。此外,實(shí)際操作當(dāng)中需要我們通過(guò)控制口(交換機(jī)的RS232端口),或者Telnet進(jìn)程來(lái)配置鏡像。這意味著除了監(jiān)測(cè)工具之外,我們通常還需要帶一臺(tái)電腦或者終端來(lái)對(duì)交換機(jī)進(jìn)行配置。
鏡像端口經(jīng)常只是一個(gè)“監(jiān)聽(tīng)”端口,不過(guò)很多交換機(jī)廠(chǎng)家允許把該端口配置成全雙工的。配置了鏡像口,監(jiān)測(cè)工具就可以查看報(bào)告連接慢的主機(jī)和服務(wù)器之間的實(shí)際流量的備份。鏡像口可以只監(jiān)測(cè)交換機(jī)的任意一個(gè)端口,甚至可以是Uplink口,也可以同時(shí)監(jiān)測(cè)交換機(jī)的多個(gè)端口。但是同時(shí)監(jiān)測(cè)的端口很多的話(huà),過(guò)高的流量就有可能會(huì)超過(guò)鏡像口的接收能力。監(jiān)測(cè)端口的輸出能力是一個(gè)很重要的問(wèn)題。鏡像口可以收,也可以發(fā)。在配置的時(shí)候,經(jīng)常關(guān)掉了鏡像口發(fā)的功能。但不管有沒(méi)有關(guān)掉鏡像口發(fā)的功能(不管鏡像口是全雙工或者不是),鏡像口的接收能力都是有限制的。如果被監(jiān)測(cè)的全雙工端口的速率和鏡像口是一樣的話(huà),交換機(jī)在轉(zhuǎn)發(fā)流量的時(shí)候很容易就會(huì)丟包,但是交換機(jī)不會(huì)通知您。
假設(shè)您在監(jiān)測(cè)一個(gè)以100M全雙工速率連接到交換機(jī)的服務(wù)器的話(huà),那么服務(wù)器在全雙工工作的時(shí)候,服務(wù)器的收發(fā)速率都是100M,那么總共就有了200M。然而交換機(jī)的100M鏡像口最多只能接收100M的流量。所以任何交換機(jī)的端口(全雙工的)利用率超過(guò)50%的時(shí)候,鏡像口接收到的包就會(huì)有丟失。
如果把多個(gè)端口鏡像到一個(gè)端口,丟包的問(wèn)題就會(huì)更加的嚴(yán)重。因?yàn)榇蠖鄶?shù)交換機(jī)都工作在低容量,這個(gè)問(wèn)題并不會(huì)被立刻注意到。大多數(shù)用戶(hù)連接的平均利用率都很低。只是偶爾會(huì)有流量的突發(fā)。
如果選擇一個(gè)高速的鏡像口,就可以減少丟包的問(wèn)題。例如把圖6中的100M鏡像口換成1000M,那么就可以很容易的接收200M的監(jiān)測(cè)流量了。
方法3:在鏈路上接入集線(xiàn)器
使用集線(xiàn)器很具有戰(zhàn)略意義。對(duì)很多網(wǎng)絡(luò)來(lái)說(shuō),大多數(shù)發(fā)送和接收的流量都來(lái)源于文件服務(wù)器之類(lèi)的共享設(shè)備。在交換機(jī)端口和文件服務(wù)器中間接入一個(gè)集線(xiàn)器,再把分析儀接入集線(xiàn)器,實(shí)際上就把分析儀和文件服務(wù)器接入了同一個(gè)廣播域。如圖7所示。使用這種方法,技術(shù)支持人員就可以看到文件服務(wù)器所有進(jìn)出的流量,幫助技術(shù)支持人員解決一系列的問(wèn)題,包括用戶(hù)登陸失敗、性能低效、連接丟失等。
接入集線(xiàn)器的方法很多時(shí)候都不實(shí)用,特別是在需要監(jiān)測(cè)多個(gè)服務(wù)器的時(shí)候。在哪里接入集線(xiàn)器合適?所有的服務(wù)器都要連接嗎?如果是用一個(gè)集線(xiàn)器,換來(lái)?yè)Q去連接的話(huà),您一定不希望您的網(wǎng)絡(luò)這樣頻繁地被干擾。連接集線(xiàn)器所帶來(lái)的時(shí)延,經(jīng)常會(huì)帶來(lái)連接的丟失。另外,很多時(shí)候監(jiān)測(cè)工具并不支持服務(wù)器所采用的技術(shù)或者連接速率。
使用共享集線(xiàn)器監(jiān)測(cè)一條鏈路上的所有流量和錯(cuò)誤仍然是一個(gè)有效的方法。這幾乎是唯一一種可以在交換網(wǎng)絡(luò)環(huán)境中實(shí)際查看和分析MAC層錯(cuò)誤的方法。使用SNMP來(lái)發(fā)現(xiàn)這些錯(cuò)誤也可以。但是,為了更好地進(jìn)行錯(cuò)誤分析,還是用監(jiān)測(cè)工具直接查看最直接。
接入集線(xiàn)器的方法有2種主要缺陷。服務(wù)器鏈路有可能不是全雙工的,或者和集線(xiàn)器的端口雙工狀態(tài)不匹配,這會(huì)給監(jiān)測(cè)帶來(lái)更多的不愿意看到的錯(cuò)誤結(jié)果。而且使用這種方法時(shí),手頭必須要有一個(gè)共享集線(xiàn)器,F(xiàn)在很多新型的集線(xiàn)器都類(lèi)似于交換機(jī),而不是共享的轉(zhuǎn)發(fā)設(shè)備。接入這種新型的集線(xiàn)器,相當(dāng)于接入了一個(gè)新的交換機(jī),您會(huì)看不到想要查看的流量,對(duì)監(jiān)測(cè)起不到什么作用。如果接入的是雙速率的集線(xiàn)器,例如10M/100M雙速率的,可能每個(gè)速率都提供了一個(gè)廣播域,兩個(gè)速率之間再進(jìn)行轉(zhuǎn)發(fā)。在這種情況下,需要確認(rèn)被監(jiān)測(cè)鏈路和監(jiān)測(cè)工具運(yùn)行在相同速率,才能夠使用這種雙速率集線(xiàn)器。還有一些集線(xiàn)器提供在所有端口之間轉(zhuǎn)發(fā)的功能,更因此把自己標(biāo)榜為價(jià)格便宜的交換機(jī),給人造成誤解。他們都不能用在這種監(jiān)測(cè)方法上。
方法4:使用一個(gè)TAP(監(jiān)測(cè)接口盒)或者分流器
這種方法類(lèi)似于加了一個(gè)共享集線(xiàn)器,不同點(diǎn)是TAP鏈路只是接收流量,不允許監(jiān)測(cè)工具發(fā)出流量。
TAP和分流器這2個(gè)詞有時(shí)候可以互換,雖然分流器通常應(yīng)用于光纖鏈路。在光纖鏈路上,分流器會(huì)把光在初始路徑和監(jiān)測(cè)路徑上進(jìn)行分光。典型的分光比率包括80:20、70:30以及50:50。以80:20為例,80%的光通過(guò)分光器繼續(xù)傳送到原始路徑,20%的光轉(zhuǎn)發(fā)到監(jiān)測(cè)路徑。如果光纖本來(lái)就有問(wèn)題,或者傳輸?shù)木嚯x很長(zhǎng)的話(huà),光分流器帶來(lái)的20%光丟失,很容易造成鏈路出現(xiàn)問(wèn)題。分流器在光纖鏈路上很容易就會(huì)帶來(lái)3dB的衰減。有些分流器要耐用一些,因此即使在鏈路的一端安裝分流器造成鏈路中斷,還可以將其換到另一端去安裝,讓鏈路正常工作。光分流器不需要電源就可以工作。需要注意的是,分流器是帶內(nèi)(Inbound)監(jiān)測(cè)設(shè)備,所以分流器的線(xiàn)纜正確連接就非常重要。
電口的TAP也會(huì)帶來(lái)信號(hào)丟失的問(wèn)題,因?yàn)門(mén)AP需要信號(hào)來(lái)識(shí)別通過(guò)的流量。對(duì)電纜來(lái)說(shuō),這相當(dāng)于增加了衰減,如果鏈路本身已經(jīng)有一定問(wèn)題或者鏈路很長(zhǎng)的話(huà),TAP的引入有可能會(huì)造成連接中斷。電口的TAP工作需要電源,信號(hào)被恢復(fù)并重傳到監(jiān)測(cè)端口。如果設(shè)計(jì)的好,在TAP掉電的時(shí)候,鏈路應(yīng)該也不會(huì)中斷。
對(duì)鏈路使用TAP進(jìn)行監(jiān)測(cè)的方式是一個(gè)很好的查看鏈路流量的方法。一旦安裝成功,TAP對(duì)被監(jiān)測(cè)的設(shè)備來(lái)說(shuō)就是透明的,可以隨時(shí)使用,而且不會(huì)帶來(lái)更多干擾。不幸的是,在接入TAP的時(shí)候,鏈路必須暫時(shí)中斷。此外,TAP或者分流器會(huì)按照2個(gè)獨(dú)立的方向提供流量。也就是說(shuō),發(fā)送和接收是分開(kāi)的。
為了同時(shí)監(jiān)測(cè)通過(guò)TAP鏈路的請(qǐng)求及響應(yīng),需要一個(gè)帶兩個(gè)輸入口的監(jiān)測(cè)工具。雙端口的監(jiān)測(cè)工具可以分別監(jiān)測(cè)每個(gè)方向,也可以把兩個(gè)方向的鏈路集中在一起分析。您也可以選擇每次只監(jiān)測(cè)一個(gè)方向的流量,但這樣分析起來(lái)會(huì)比較困難。對(duì)TAP來(lái)說(shuō),監(jiān)測(cè)全雙工鏈路和半雙工鏈路,操作上沒(méi)有什么區(qū)別,都可以監(jiān)測(cè)。您可以選擇一個(gè)單端口的監(jiān)測(cè)工具,監(jiān)測(cè)單一的方向,或者選擇一個(gè)雙端口的監(jiān)測(cè)工具,同時(shí)的監(jiān)測(cè)兩個(gè)方向。
方法5:用SNMP查詢(xún)交換機(jī)
對(duì)一個(gè)交換網(wǎng)絡(luò)進(jìn)行故障診斷的最有效辦法,應(yīng)該是通過(guò)直接詢(xún)問(wèn)交換機(jī)來(lái)查看網(wǎng)絡(luò)的狀況。這可以通過(guò)SNMP或者連接到交換機(jī)的控制口實(shí)現(xiàn)。顯然,直接連接到交換機(jī)的控制口不是理想的辦法,因?yàn)檫@就需要對(duì)網(wǎng)絡(luò)中的每臺(tái)交換機(jī)都有物理上的連接。稍微理想一點(diǎn)的替代方法是搭建連接到交換機(jī)控制口的終端服務(wù)器。SNMP是一個(gè)更好的選擇,它可以在交換網(wǎng)絡(luò)帶內(nèi)的任何地方進(jìn)行查詢(xún),不需要附加的硬件。如果您部署了網(wǎng)管系統(tǒng),還可以配置當(dāng)利用率、錯(cuò)誤、或者其他參數(shù)超過(guò)門(mén)限的時(shí)候,交換機(jī)主動(dòng)發(fā)出SNMP陷阱。然后利用網(wǎng)管或者監(jiān)測(cè)工具,研究是什么原因造成了門(mén)限超出。
事實(shí)上幾乎所有的交換機(jī)都提供SNMP功能,哪怕是最便宜的交換機(jī)。它們之間主要的區(qū)別就是提供的信息多少。一些價(jià)格便宜的交換機(jī)只提供簡(jiǎn)單的SNMP信息,且是針對(duì)整個(gè)交換機(jī)的;而那些價(jià)格貴一些的交換機(jī),還可以提供交換機(jī)每個(gè)端口的詳細(xì)信息。
SNMP可能是監(jiān)測(cè)交換網(wǎng)絡(luò)最常用和干擾最少的辦法。SNMP控制臺(tái)不需要非?拷槐O(jiān)測(cè)的設(shè)備,只要求有路由可達(dá)就可以了,同時(shí)交換機(jī)的安全配置允許控制臺(tái)與交換機(jī)的代理進(jìn)行通信。
雖然交換機(jī)可以識(shí)別到錯(cuò)誤,但交換機(jī)本身并不定時(shí)地報(bào)告錯(cuò)誤,所以使用SNMP查詢(xún)或許是最好的辦法。支持SNMP的交換機(jī)有不同的MIB庫(kù)(管理信息庫(kù))。每一種MIB都不同。除了某些對(duì)自己的交換機(jī)提供支持的私有MIB庫(kù),標(biāo)準(zhǔn)的MIB庫(kù)對(duì)交換網(wǎng)絡(luò)的監(jiān)測(cè)也非常有用。下面是對(duì)故障診斷非常有用的一些MIB庫(kù)。
RFC1213–MIB II
RFC1643–Ethernet-Like Interface MIB
RFC2819–RMON Ethernet
RFC2021–RMON 2
RFC2613–SMON
很多RFC生成之后就不斷地在更新和增強(qiáng)。因此我們要檢查最近更新的RFC。例如RFC1213,至少更新和增強(qiáng)了五次,生成了5個(gè)新的RFC(2011,2012,2013,2358和2665)。除了定義利用率和錯(cuò)誤的RFC之外,有關(guān)橋接的MIB(RFC1493)也是非常有用的。
使用SNMP監(jiān)測(cè)網(wǎng)絡(luò)的時(shí)候,必須注意安全性。如果SNMP代理沒(méi)有限制,那么潛在的任何地方的任何人都可以監(jiān)測(cè)到您的網(wǎng)絡(luò)動(dòng)態(tài)或修改交換機(jī)配置。交換機(jī)售出的時(shí)候默認(rèn)打開(kāi)了SNMP,并且使用的是一個(gè)非常通用的密碼。SNMP密碼叫做通信字符串,使用明文傳播,這帶來(lái)了潛在的危險(xiǎn)。SNMPV3提供對(duì)通信字符串的加密,減少了這種危險(xiǎn),但是SNMPV3還沒(méi)有廣泛使用。最常用的通信字符串是public。現(xiàn)在,使用public,很多Internet上的SNMP代理都可以被接入。
我們應(yīng)該立即修改通信字符串。SNMP代理應(yīng)該為不同的字符串配置不同的接入級(jí)別,不同的IP地址、不同的子網(wǎng)也有不同的接入級(jí)別。或者根據(jù)其它的配置來(lái)限制接入的級(jí)別。通過(guò)路由器接入SNMP代理可能會(huì)對(duì)SNMP的限制帶來(lái)一些影響。防火墻也有可能完全阻止SNMP。即使您能夠通過(guò)SNMP接入代理,也要求代理支持您所要查詢(xún)的MIB庫(kù)。大部分廠(chǎng)家完全支持標(biāo)準(zhǔn)的MIB庫(kù)。然而,也有一些廠(chǎng)家不支持。有時(shí)候?yàn)榱酥С制谕腗IB,還需要先對(duì)交換機(jī)的操作系統(tǒng)進(jìn)行升級(jí)。這種方法還有一個(gè)問(wèn)題,如果SNMP代理執(zhí)行的MIB不正確的話(huà),那么響應(yīng)就完全是錯(cuò)誤的了。雖然這并不是經(jīng)常發(fā)生的,但有時(shí)候程序設(shè)計(jì)的錯(cuò)誤,會(huì)帶來(lái)錯(cuò)誤的響應(yīng)。
交換機(jī)不響應(yīng)SNMP的查詢(xún)有很多原因。一旦這些問(wèn)題都解決了,SNMP就能夠提供非常有效的監(jiān)測(cè)和趨勢(shì)分析。
結(jié)論
故障診斷的一個(gè)普遍方法是等待用戶(hù)的投訴。這個(gè)方法雖然簡(jiǎn)單,但是非常有效。用戶(hù)能夠感知到網(wǎng)絡(luò)正常的性能是怎樣的。一旦有性能下降,網(wǎng)絡(luò)支持中心就會(huì)很快收到客戶(hù)的投訴。有了用戶(hù)投訴,您就應(yīng)該從他的接入點(diǎn)開(kāi)始做故障診斷了。這種方法的缺點(diǎn)是完全是被動(dòng)的,不具有前瞻性的。
理想的方法是使用前瞻性地監(jiān)測(cè)。包括定期地查詢(xún)每個(gè)交換機(jī)、監(jiān)測(cè)每個(gè)交換端口的流量、流量的趨勢(shì),同時(shí)檢測(cè)其他的相關(guān)網(wǎng)段。把問(wèn)題解決從故障診斷方式變成故障預(yù)防方式。
EtherScope™ES網(wǎng)絡(luò)通,通過(guò)對(duì)交換網(wǎng)絡(luò)的超級(jí)透視能力,快速地定位問(wèn)題,解決了交換網(wǎng)絡(luò)故障診斷的難題
將ES網(wǎng)絡(luò)通接入網(wǎng)絡(luò),您立即就可以透視交換機(jī)。
TraceSwitchRoute功能顯示了交換網(wǎng)絡(luò)中任意2個(gè)設(shè)備之間通信的路徑。問(wèn)題無(wú)處可逃。
利用ES網(wǎng)絡(luò)通,您將會(huì)看到:
交換機(jī)端口利用率、錯(cuò)誤和配置
端口連接的主機(jī)
交換機(jī)的VLAN劃分和交換機(jī)端口所屬VLAN
交換機(jī)掃描,交換機(jī)端口的流量概覽
讓我們看看ES網(wǎng)絡(luò)通是如何解決交換網(wǎng)絡(luò)中諸多棘手問(wèn)題的。
站點(diǎn)可以訪(fǎng)問(wèn)網(wǎng)絡(luò)和關(guān)鍵服務(wù)嗎?
這是故障診斷或者網(wǎng)絡(luò)驗(yàn)證的起點(diǎn)。我們必須首先確認(rèn)網(wǎng)絡(luò)連接的狀態(tài),站點(diǎn)是否能連接到關(guān)鍵服務(wù)。很多網(wǎng)絡(luò)故障解決專(zhuān)家都提到必須先從物理層開(kāi)始進(jìn)行驗(yàn)證。
對(duì)于網(wǎng)絡(luò)連接的丟失,ES網(wǎng)絡(luò)通首先診斷電纜的連接和鏈路的信號(hào)。首先是電纜連接的LINKLED鏈路燈點(diǎn)亮,表示以太網(wǎng)連接的脈沖存在。接著診斷連接的速率和全雙工狀態(tài),下一步再進(jìn)行網(wǎng)絡(luò)、VLAN和設(shè)備的查找。
通過(guò)查看電纜認(rèn)證的詳細(xì)信息,可以診斷電纜連接的任何錯(cuò)誤。顯示的結(jié)果包括電纜的狀態(tài)、是否存在線(xiàn)纜錯(cuò)誤(開(kāi)路、短路、串繞等)。
盡管以太網(wǎng)設(shè)備都承諾互操作性,但是自動(dòng)協(xié)商依然是困擾很多網(wǎng)管人員的問(wèn)題。以前遇到這樣的問(wèn)題,很難確定具體原因。現(xiàn)在有了ES網(wǎng)絡(luò)通的信號(hào)驗(yàn)證診斷功能,就可以透視設(shè)備自協(xié)商的過(guò)程。在這個(gè)測(cè)試進(jìn)程里,ES網(wǎng)絡(luò)通監(jiān)測(cè)有故障鏈路的電信號(hào),掃描直流電壓,掃描POE(PowerOverEthernet)、鏈路脈沖和數(shù)據(jù)信號(hào)、實(shí)際的FLP(快速以太網(wǎng)脈沖)信號(hào)、鏈路兩端設(shè)備的速率和雙工設(shè)置狀態(tài),從而解決鏈路的自協(xié)商問(wèn)題。
工作站連接在那里?
使用ES網(wǎng)絡(luò)通的“最近的交換測(cè)試”功能可以發(fā)現(xiàn)臨近交換機(jī)的插槽和端口號(hào),在ES網(wǎng)絡(luò)通的自動(dòng)測(cè)試結(jié)果中會(huì)顯示交換機(jī)名和所連接的插槽/端口號(hào)。突出加亮這一測(cè)試結(jié)果,預(yù)覽面板將顯示進(jìn)出端口流量、VLAN配置和所連接的工作站的數(shù)量。
ES網(wǎng)絡(luò)通還沒(méi)有停止測(cè)試,它利用網(wǎng)絡(luò)主動(dòng)搜索功能記錄在廣播域內(nèi)的每臺(tái)設(shè)備。通過(guò)對(duì)交換機(jī)橋轉(zhuǎn)發(fā)表?xiàng)l目上的MAC地址的比較,ES網(wǎng)絡(luò)通就可以知道工作站連接在網(wǎng)絡(luò)的位置。任一臺(tái)被搜索到的交換機(jī)的“設(shè)備詳細(xì)信息”都可以提供給您豐富的配置信息,包括最近的交換機(jī)和連接端口號(hào)。
每個(gè)端口的繁忙程度如何?
通過(guò)SNMP協(xié)議,ES網(wǎng)絡(luò)通在交換機(jī)掃描對(duì)話(huà)中對(duì)最近的交換機(jī)和另一臺(tái)進(jìn)行詢(xún)問(wèn),比如收/發(fā)端口利用率、速度設(shè)置和錯(cuò)誤指示(如果存在)等將被顯示出來(lái)。
當(dāng)前端口連接哪些工作站?
所選端口的“設(shè)備詳細(xì)信息”顯示連接在這個(gè)端口上的每臺(tái)設(shè)備。利用方便的搜索功能,通過(guò)通過(guò)匹配主機(jī)全部或部分名稱(chēng)、IP地址或MAC地址,可以快度地定位設(shè)備。
圖7、接口詳細(xì)信息
廣播風(fēng)暴源是什么?怎樣找到錯(cuò)誤根源?
“發(fā)送流量最多者”將發(fā)送包數(shù)量最多的站點(diǎn)進(jìn)行列表,可以根據(jù)通過(guò)協(xié)議類(lèi)型進(jìn)行過(guò)濾,通過(guò)MAC地址、錯(cuò)誤、廣播和多播來(lái)進(jìn)行排序,找到錯(cuò)誤源或過(guò)量廣播包非常簡(jiǎn)單,只需選擇標(biāo)準(zhǔn)然后查看最頂部的站點(diǎn)即可。還可深入查找交互機(jī)、插槽和端口的詳細(xì)信息。
如果交換機(jī)掃描顯示在某個(gè)端口上村雜錯(cuò)誤,點(diǎn)擊這個(gè)端口的“設(shè)備詳細(xì)信息”,有問(wèn)題的設(shè)備將作為主機(jī)被列出,CRC錯(cuò)誤和過(guò)量包沖突能指示自動(dòng)協(xié)商方面的問(wèn)題。
橋轉(zhuǎn)發(fā)表運(yùn)行是否正常?
每個(gè)網(wǎng)絡(luò)管理員都會(huì)依賴(lài)“TraceRoute”命令去測(cè)試網(wǎng)絡(luò)的連通性,了解設(shè)備之間的第三層路徑,但卻不能知道相應(yīng)的物理端口和第二層的連接路徑,這就使得網(wǎng)絡(luò)故障解決人員消耗大量時(shí)間(或者依賴(lài)過(guò)期的文檔)去尋找設(shè)備之間的連接關(guān)系。ES網(wǎng)絡(luò)通的“TraceSwitchRoute”功能可以收集交換機(jī)和端口上的每個(gè)連接以及網(wǎng)絡(luò)中交換機(jī)之間的連接,顯著的減少了縮小故障范圍的時(shí)間。
當(dāng)前端口是否屬于某個(gè)VLAN?如果是,它與服務(wù)器在同一個(gè)VLAN嗎?
作為網(wǎng)絡(luò)自動(dòng)搜索過(guò)程的一部份,ES網(wǎng)絡(luò)通可以發(fā)現(xiàn)廣播域內(nèi)的VLAN配置信息。點(diǎn)擊首頁(yè),然后點(diǎn)擊“VLAN搜索”,可以進(jìn)行VLAN目錄的預(yù)覽。選擇“詳細(xì)信息”可以查看VLAN的列表,當(dāng)VLAN被展開(kāi)后,可以看到交換機(jī)端口與VLAN的對(duì)應(yīng)關(guān)系。點(diǎn)擊一個(gè)端口,選擇“詳細(xì)信息”,就可以得到這個(gè)端口的狀態(tài)、端口流量和設(shè)備配置等信息。ES網(wǎng)絡(luò)通是一款主要應(yīng)用于廣播域的產(chǎn)品,可以自動(dòng)搜索到被測(cè)廣播域內(nèi)所有的設(shè)備,包括所有交換機(jī)。為了幫助自動(dòng)搜索過(guò)程,使用“設(shè)備添加”功能,可以將本地或非本廣播域內(nèi)的設(shè)備添加到“搜索”數(shù)據(jù)庫(kù)中,這個(gè)功能位于用戶(hù)界面的“設(shè)備搜索”和“關(guān)鍵設(shè)備”兩個(gè)頁(yè)面上。用戶(hù)增加的設(shè)備將保存在儀器中,故障解決過(guò)程中將一直存在。如果儀器復(fù)位到出廠(chǎng)初始值,它們將丟失。