靜態(tài)路由故障
1、靜態(tài)路由和有類別查找
當(dāng)路由選擇表進(jìn)程檢查一條使用中間地址(路由選擇表中作為下一跳引用的 IP 地址)的可解析的靜態(tài)路由時(shí),這個(gè)檢查總是在有類別方式下完成的,無論是否使用 ip classless命令如果在路由選擇表中有類別方式下的中間地址不能解析,則刪除該靜態(tài)路由。
使用 show ip route 查看路由選擇表。
使用 debug 可以顯示某個(gè)網(wǎng)絡(luò)宕掉了。
如果使用無類別方式并有一條默認(rèn)路由存在, 那么具有高管理距離的備份表態(tài)路由將永遠(yuǎn)不會(huì)在主靜態(tài)路由失效時(shí)裝入到路由選擇表中。這是因?yàn)槿魏戊o態(tài)路由, 即便是指向不存在的中間地址的靜態(tài)路由,都會(huì)使用默認(rèn)路由進(jìn)行解析。
CISCO 路由選擇表進(jìn)程每 60S 調(diào)用一個(gè)檢查路由選擇表的靜態(tài)路由功能來根據(jù)動(dòng)態(tài)變化的路由選擇表安裝或刪除靜態(tài)路由。
2、靜態(tài)路由和中間地址
靜態(tài)路由可以使用中間網(wǎng)絡(luò)地址或出接口來創(chuàng)建。大多數(shù)情況下, 使用出接口在路由選擇表進(jìn)程中解析靜態(tài)路由更加有效。
只要中間 IP 地址可以在路由選擇表中解析,它不必是真實(shí)的下一跳路由器的接口。靜態(tài)網(wǎng)絡(luò)路由(如中間地址)必須最終被解析為路由選擇表中一條具有出接口的路由。
每當(dāng)路由選擇表進(jìn)程需要為 x.x.x.0/24 網(wǎng)絡(luò)使用靜態(tài)路由表項(xiàng)時(shí),它還需要解析中間地址 y.y.y.y,稱為遞歸查找。一次額外的路由查找或許對(duì)路由選擇進(jìn)程的性能沒有多少影響。但是,采取多次遞歸查找來獲得解析的靜態(tài)路由可能會(huì)影響性能。
3、靜態(tài)路由優(yōu)化
為避免遞歸查找:串行網(wǎng)絡(luò):使用出接口
以太網(wǎng)絡(luò):同時(shí)使用中間地址和出接口
4、反復(fù)的靜態(tài)路由安裝和刪除
盡可能地使用出接口而不是中間地址來配置靜態(tài)路由。
5、使用丟棄路由
有時(shí)網(wǎng)絡(luò)中有環(huán)路的產(chǎn)生。通過周期性的查看路由器接口上的計(jì)數(shù)器可以看到路由選擇環(huán)路的結(jié)果。
clear counters serial0/0
show interface serial0/0
路由環(huán)路的問題在網(wǎng)絡(luò)中產(chǎn)生了一個(gè)黑洞。一旦 IP 頭中的生存期( TTL )減到 0 就丟棄分組。
解決 1:有類別模式的路由選擇( no ip classless) —— 在用戶網(wǎng)絡(luò)路由器上使用 no ip classless.路由器在至少一個(gè)已知子網(wǎng)存在時(shí)不會(huì)使用任何超網(wǎng)或默認(rèn)路由。但不是首選。因?yàn)樗淖兞怂蟹纸M的路由選擇表查找行為。
解決 2:使用一條丟棄路由 —— 當(dāng)路由選擇表中沒有特定的匹配,而且使用一條超網(wǎng)或默認(rèn)路由來轉(zhuǎn)發(fā)那些分組并不合適時(shí),一條丟棄路由把分組送給了 null0 ,即比特桶。
ip route x.x.0.0 255.255.0.0 null0
ip route x.x.0.0 255.255.0.0 null0 200
后一個(gè)命令行配置僅在主路由失效時(shí)使用的另一條丟棄路由。通過將靜態(tài)路由的默認(rèn)管理距離改為比所使用的動(dòng)態(tài)路由選擇協(xié)議的管理距離更高的一個(gè)值來實(shí)現(xiàn)。
排除 RIP 故障
1、不兼容的版本類型
debug ip rip
show ip protocols 對(duì)檢查接口上發(fā)送和接收的 RIP 分組版本十分有用。
如果 R1 不支持 V2 的版本,只能接收 RIPv1 分組,那么 R2 配置成 RIPv1 和 RIPv2
可在接口級(jí)指定發(fā)送和接收 RIP 分組的特定版本
interface e0
ip rip send version 1 2
ip rip receive version 1 2
2、不匹配的認(rèn)證密鑰
RIPv2 的一個(gè)選項(xiàng)是可以認(rèn)證的 RIPv2 更新,為了增強(qiáng)安全性,當(dāng)使用認(rèn)證時(shí),必須在雙方配置口令。這個(gè)口令被稱為認(rèn)證密鑰。如果這一密鑰與另一方的密鑰不匹配, 雙方都將忽略 RIPv2 更新。
在接口上配置 ip rip authentication key-chain cisco 用 debug ip rip 調(diào)試。
3、達(dá)到 RIP 的路數(shù)限制
RIP 度量標(biāo)準(zhǔn)的最大值是 15 跳。無法克服這個(gè)問題。可以使用非 15 跳限制的路由選擇協(xié)議。
IGRP 最大跳數(shù)是 255,EIGRP 最大跳數(shù)是 224,二者默認(rèn)都是 100。
4、不連續(xù)網(wǎng)絡(luò)
當(dāng)主網(wǎng)絡(luò)被另一個(gè)主網(wǎng)絡(luò)分隔開時(shí),被稱為不連續(xù)網(wǎng)絡(luò)。
解決 1:使用靜態(tài)路由
解決 2:在路由器之間的鏈路地址改為左右不連續(xù)網(wǎng)絡(luò)中的一部分。
解決 3:在兩臺(tái)路由器上用 no auto-summary 配置啟用 RIPv2 的無類別路由選擇版本。
router rip
version 2
network x.x.x.0
no auto-summary
解決 4:使用無類別路由選擇協(xié)議。如 OSPF,EIGRP ,IS-IS 替代 RIPv1 路由選擇協(xié)議。
5、不合法的源地址
當(dāng) RIP 告訴路由選擇表安裝路由時(shí),它執(zhí)行源合法性檢查。如果源所在子網(wǎng)與本地接口不同, RIP 則忽略更新并且不在路由選擇表中安裝從這個(gè)源來的路由。當(dāng)一方是有編號(hào)而另一方是無編號(hào)時(shí),必須關(guān)閉這個(gè)檢查。
router rip
no validate-update-source
6、翻動(dòng)( flApping)路由
路由翻動(dòng)是指路由選擇表中一條路由的不斷刪除和再插入。為了檢查路由是否真的翻動(dòng),檢查路由選擇表并查看路由的壽命( age)。如果壽命被不斷的重置為 00:00:00,這就意味這路由正在翻動(dòng)。
RIP 有 180S 沒有收到一條路由,那么該路由將保持 240S,然后被清除。
使用 show interface 來檢查接口統(tǒng)計(jì)值。
最常見幀中繼環(huán)境分組丟失。
使用 show ip route rip 可以檢查 RIP 多久沒有更新。
使用 show interface serial 0 可查看到接口上有大量的廣播分組是否被丟棄。幀中繼情況下,可能需要調(diào)整幀中繼廣播隊(duì)列。在非幀中繼的環(huán)境中, 可能需要增加輸入或輸出保留隊(duì)列。
7、大型路由選擇表
接口上使用 ip summary-address 匯總路由。
排除 EIGRP 故障
1、不匹配的 K 值
EIGRP 為了建立它的鄰居關(guān)系,計(jì)算 EIGRP 度量標(biāo)準(zhǔn)的 K 常數(shù)值必須相同。
K1-帶寬 K2- 負(fù)載 K3- 延遲 K4, K5- 可靠性
router eigrp 1
network x.x.x.x
metric weights 0 1 1 1 1 0
2、不匹配的 AS 編號(hào)
EIGRP 不會(huì)與具有不同自治系統(tǒng)編號(hào)的路由器形成任何鄰居關(guān)系。
3、活動(dòng)粘滯
(1)確定問題
可能的原因有:
· 壞的或擁塞的鏈路;
· 低的路由器資源,如路由器上的低內(nèi)存和高 CPU 處理。
· 長的查詢范圍
· 過多的冗余
默認(rèn)活動(dòng)粘滯定時(shí)器只有 180S.
使用 show ip eigrp topology active 命令幫助故障排除 EIGRP 活動(dòng)粘滯錯(cuò)誤, 僅在問題發(fā)生時(shí)有用, 用戶一次只有 180S 的時(shí)間來確定。鄰居有一個(gè)r跟在后面表示它沒有應(yīng)答查詢。
(2)故障排除方法
追蹤查詢,一跳接一跳,在每一跳找出活動(dòng)路由的狀態(tài)。
(3)最終解決方案
盡可能手工匯總路由并有一個(gè)分層次的網(wǎng)絡(luò)設(shè)計(jì)。EIGRP匯總的網(wǎng)絡(luò)越多,主收斂發(fā)生時(shí)需要做的事情越少。
4、重復(fù)的路由 ID
EIGRP 只是為了外部路由而使用路由器 ID 的概念來防止環(huán)路。EIGRP 基于路由器上回環(huán)接口的最大 IP 地址來選擇路由器 ID. 如果路由器沒有回環(huán)接口, 則選擇所有接口中最大的激活 IP 地址作為 EIGRP 的路由器 ID.
debug ip eigrp 可以看到接口上通告某個(gè)網(wǎng)絡(luò)。
經(jīng)驗(yàn)法則:永遠(yuǎn)不要在網(wǎng)絡(luò)的兩個(gè)地方配置相同的 IP 地址。
排除OSPF故障
1、不匹配的參數(shù)
使用 debug ip ospf adj 命令能夠看到大多數(shù)的不匹配問題。
(1) hello/dead 間隔不匹配 —— 匹配才可以形成鄰居。
(2)不匹配的認(rèn)證類型 —— OSPF 下有 MD5 和純文本認(rèn)證。
router ospf 1
area 0 authentication message-digest
network x.x.0.0 0.0.255.255 area 0
(3)不匹配的區(qū)域 ID —— 區(qū)域信息在 OSPF 的 HELLO 分組中發(fā)送。不同,不會(huì)形成鄰接。
(4)不匹配的短截 /傳輸 /NSSA 區(qū)域選項(xiàng) —— 當(dāng)OSPF與一個(gè)鄰居交換 HELLO 分組時(shí),它所交換的一項(xiàng)內(nèi)容是由8比特表示的可選能力。選項(xiàng)字段之一是E比特, 即OSPF短截標(biāo)志。當(dāng) E 比特置0時(shí),該路由關(guān)聯(lián)的區(qū)域是一個(gè)短截區(qū)域, 外部 LSA 不允許進(jìn)入這個(gè)區(qū)域。
2、OSPF 狀態(tài)問題
成為鄰居的路由器不保證交換鏈路狀態(tài)更新。一旦路由器決定與一個(gè)鄰居形成鄰接, 它就開始交換其鏈路狀態(tài)數(shù)據(jù)庫的一份完整拷貝。
(1)OSPF 陷入 ATTEMPT —— 僅對(duì) neighbor 語句的 NBMA 網(wǎng)絡(luò)有效。陷入 ATTEMPT是指一臺(tái)路由器試圖通過發(fā)送它的 HELLO 來聯(lián)系鄰居但是它沒有收到響應(yīng)。
show ip ospf neighbor 查看。
原因:錯(cuò)誤配置 neighbor;NBMA 上的單播連通性斷了,這可能是由錯(cuò)誤的 DLCI ,訪問列表或轉(zhuǎn)換單播的 NAT 引起的。
(2)OSPF 陷入 INIT —— INIT 狀態(tài)表示路由器收到來自鄰居的 HELLO 分組,但是雙向通信并沒有建立 。
原因:
· 一方訪問列表阻止了 HELLO ;
· 一方的多播能力失效(一個(gè)交換機(jī)故障) ;
· 僅在一方啟用了認(rèn)證;
· 一方的 frame-relay map/dialer map 語句缺少了 broadcast 關(guān)鍵字。
· 一方的 HELLO 在第 2 層丟失了。
(3)OSPF 陷入 2-WAY —— 雙向狀態(tài)是指路由器在 HELLO 分組的鄰居字段中見到了自己的路由器 ID.類似于所有路由器的優(yōu)先級(jí)都為 0,則不會(huì)發(fā)生選舉,所有路由器停留在雙向狀態(tài)中。
解決:確保至少一臺(tái)路由器具有一個(gè)至少為 1 的 IP OSPF 優(yōu)先級(jí)。
(4)OSPF 陷入 EXSTART/EXCHANGE —— 在 EXSTART 或 EXCHANGE 狀態(tài)的 OSPF鄰居正處于嘗試交換 DBD (數(shù)據(jù)庫描述)分組的過程中。
原因:
· 不匹配的接口 MTU
· 鄰居上重復(fù)的路由器 ID
· 無法用超過特定 MTU 長度進(jìn)行 PING
· 斷掉的單播連通性,它可能是因?yàn)殄e(cuò)誤的 DLCI ,訪問列表或轉(zhuǎn)單播的 NAT
( 5)OSPF 陷入 LOADING —— 鄰居沒有應(yīng)答或鄰居的應(yīng)答從未到達(dá)本地路由器, 路由器也會(huì)陷入 LOADING 狀態(tài)。常有 "%OSPF-4-BADLSA" 控制臺(tái)信息。
原因:
· 不匹配的 MTU
· 錯(cuò)誤的鏈路狀態(tài)請(qǐng)求分組
3、點(diǎn)到點(diǎn)鏈路的一方是無編號(hào)的
interface s0
ip unnumbered loopback0
解決:雙方都需要成為一個(gè)有編號(hào)點(diǎn)到點(diǎn)鏈路或一個(gè)無編號(hào)點(diǎn)到點(diǎn)鏈路。
4、ABR 沒有產(chǎn)生一個(gè)類型 4 的匯總 LSA
類型4 的匯總 LSA 的一個(gè)功能是宣告到其他區(qū)域的 ASBR 的可達(dá)性。如果同一個(gè)區(qū)域中存在 ASBR 則不需要類型 4 的 LSA.
show ip ospf database external 命令的輸出顯示在路由器的外部 OSPF 數(shù)據(jù)庫中是否存在路由。
show ip ospf database asbr-summary 命令的輸出顯示路由是否有類型4的 LSA.
檢查 R 是否真是 ABR. 如果是,則產(chǎn)生類型 3 或類型 4 的匯總 LSA.show ip ospf
5、轉(zhuǎn)發(fā)地址不能通過區(qū)域內(nèi)或區(qū)域間路由獲知
當(dāng) OSPF 獲得一條外部 LSA 時(shí),它在將該路由裝入路由選擇表之前要確定轉(zhuǎn)發(fā)地址可通過一條 OSPF 區(qū)域內(nèi)或區(qū)域間路由獲知。如果轉(zhuǎn)發(fā)地址不能通過區(qū)域內(nèi)或區(qū)域間路由獲知,OSPF不會(huì)將路由裝入路由選擇表中。
有可能的解決:
· 不在 ABR 上進(jìn)行匯總
· 在 ASBR 上過濾再分布入 OSPF 中的直接子網(wǎng)
router ospf 1
redistribute rip subnets
6、路由匯總問題
兩種類型匯總:
· 可執(zhí)行在 ABR 上的區(qū)域間路由匯總
· 可執(zhí)行在 ASBR 上的外部路由匯總
(1)區(qū)域間匯總
router ospf 1
area 3 range x.x.x.0 255.255.255.0
通過 show ip ospf 可以查看
(2)外部匯總
router ospf 1
summary-address x.0.0.0 255.0.0.0
7、CPUHOG 問題
產(chǎn)生在:鄰居形成過程
LSA 刷新過程
8、SPF 計(jì)算和路由翻動(dòng)
只要拓?fù)溆凶兓?OSPF 就運(yùn)行 SPF 算法再次計(jì)算最短路徑優(yōu)先樹。可能引起鏈路的不穩(wěn)定。
原因:
· 區(qū)域內(nèi)的接口翻動(dòng)
· 區(qū)域內(nèi)的鄰居接口翻動(dòng)
· 重復(fù)的路由器 ID
使用 show ip ospf 命令可查看在一個(gè)給定區(qū)域中 SPF 算法運(yùn)行的次數(shù);
使用 debug ip ospf monitor 來隔離一個(gè)翻動(dòng)的 LSA ;
使用 show log 命令顯示由接口引起的翻動(dòng)。
解決:
· 修復(fù)正在翻動(dòng)的鏈路
· 重新定義區(qū)域邊界
排除 IS-IS 故障
1、IS-IS 鄰接問題
通常由鏈路故障和配置錯(cuò)誤引起。
show clns neighbors 顯示所有希望與被調(diào)查的路由器成為鄰接的鄰居
debug isis adj-packets 命令來調(diào)試
2、部分或所有鄰接沒有形成
步驟 1—— 檢查鏈路故障。show ip interface brief
步驟 2—— 檢查配置錯(cuò)誤。show run
步驟 3—— 檢查不匹配的 1 級(jí)和 2 級(jí)接口。
步驟 4—— 檢查區(qū)域的錯(cuò)誤配置。
步驟 5—— 檢查錯(cuò)誤配置的子網(wǎng)
步驟 6—— 檢查重復(fù)的系統(tǒng) ID
3、鄰接陷入 INIT 狀態(tài)
常見原因:不匹配的接口 MTU 和認(rèn)證參數(shù)。show clns neighbors 可看到
步驟 1—— 檢查認(rèn)證 debug isis adj-packets
步驟 2—— 檢查不匹配的 MTU debug isis adj-packets
步驟 3—— 檢查 IS-IS 的 HELLO 填充禁止 (命令同上)
使用 show clns interface 查看接口上的 HELLO 填充狀態(tài)
4、ES-IS 鄰接形成代替了 IS-IS 鄰接形成
在 IP 環(huán)境中運(yùn)行 IS-IS 的 CISCO 路由器仍然監(jiān)聽 ES-IS 協(xié)議所產(chǎn)生的 ISH.當(dāng)物理層和數(shù)據(jù)鏈路層工作時(shí),即使沒有建立IS-IS鄰接的適當(dāng)條件,仍能形成ES-IS鄰接。
show clns neighbors
5、路由通告問題
大多數(shù)路由通告問題都可被限制為源端的配置問題或鏈路狀態(tài)分組 (LSP)的傳播問題。
Dijkstra 算法運(yùn)行在 LS 數(shù)據(jù)庫上來獲得每個(gè)被通告路由的最佳路徑。
debug isis update-packets
debug isis snp-packets
以上兩個(gè)調(diào)試幫助故障排除 LSP 洪泛問題和鏈路狀態(tài)數(shù)據(jù)庫同步。
路由沒有到達(dá)網(wǎng)絡(luò)遠(yuǎn)端的問題可能有許多潛在原因,包括鄰接問題,第 1/2 層問題,IS-IS錯(cuò)誤配置以及其他問題。
6、路由翻動(dòng)問題
網(wǎng)絡(luò)中 SPF 進(jìn)程的高 CPU 利用率( SHOW PROCESS CPU 命令)也應(yīng)標(biāo)記為不穩(wěn)定。
不穩(wěn)定鏈路。
翻動(dòng)還有可能是由 LSP 的錯(cuò)誤風(fēng)暴或一個(gè)路由選擇環(huán)路引起。
show isis spf-log 命令顯示哪個(gè) LSP 變化最頻繁以及哪個(gè) LSP 角發(fā)了 SPF 計(jì)算。
show isis update-packets
排除 BGP 故障
1、故障排除 BGP 鄰居關(guān)系問題
遵循:首先,應(yīng)檢查第 1/2 層,然后是 IP 連通性(第 3 層),TCP 連接(第4層),最后是 BGP 配置。
(1)直接的外部 BGP 鄰居沒有初始化
自治系統(tǒng)( AS)不會(huì)向 AS 發(fā)送或從 AS 接收任何 IP 前綴更新,除非鄰居關(guān)系達(dá)到established 狀態(tài),該狀態(tài)是 BGP 鄰居建立的最后階段。當(dāng) AS 有一條單一的 EBGP 連接時(shí),直到 BGP 完成了它的收發(fā) IP 前綴操作后 IP 連通性才能發(fā)生。
原因:
· 第 2 層宕掉了,阻止了與直接的 EBGP 鄰居通信
· 在 BGP 配置中有錯(cuò)誤的鄰居 IP 地址
命令:show ip bgp summary 和 show ip bgp neighbors 檢查 BGP 鄰居關(guān)系
active 狀態(tài)表示鄰居間沒有發(fā)生成功的通信, 并且鄰居未形成。
用 PING 測(cè)試其連通性,失敗則表示要修復(fù)第 1/2 層問題。
debug ip bgp 能夠幫助診斷問題
(2)非直接的外部 BGP 鄰居沒有初始化
有些情況下, EBGP 鄰居不是直連的。BGP 鄰居關(guān)系能夠建立在試圖形成由一臺(tái)或多臺(tái)路由器分隔開的 EBGP 鄰居關(guān)系的路由器之間。這種鄰居在 IOS 中被稱為 EBGP 多跳。
當(dāng)路由器之間存在多個(gè)接口并且需要在那些接口之間 IP 流量負(fù)載均衡時(shí),通常在回環(huán)接口之間建立 EBGP 對(duì)等實(shí)體。
可能的原因:
· 到非直連對(duì)等實(shí)體地址的路由從路由選擇表中丟失了
· BGP 配置中缺少 ebgp-multihop 命令
· 缺少 update-source interface 命令
命令:show ip bgp summary 和 show bgp neighbors
router bgp 109
neighbor x.x.x.x remote-as 110
neighbor x.x.x.x ebgp-multihop 2
neighbor x.x.x.x update-source loopback0
(3)內(nèi)部 BGP 鄰居沒有初始化
原因:
· 到非直接 IBGP 鄰居的路由丟失了
· BGP 配置中缺少 update-source interface 命令
(4)BGP 鄰居(外部和內(nèi)部)沒有初始化
接口訪問列表 /過濾是 BGP 鄰居活動(dòng)問題的一個(gè)常見原因。
2、故障排除 BGP 路由通告
發(fā)生在 BGP 路由通告的產(chǎn)生和接收中。
(1)沒有產(chǎn)生 BGP 路由
原因:
· IP 路由選擇表中沒有匹配的路由
· 發(fā)生了配置錯(cuò)誤
· BGP 自動(dòng)匯總到有類別 /網(wǎng)絡(luò)邊界
(2)向 IBGP/EBGP 鄰居傳播 /產(chǎn)生一條 BGP 路由的問題配置的分布列表過濾可能是該問題的起因,或者是策略路由選擇有問題。
(3)向 EBGP 鄰居但沒有向 IBGP 鄰居傳播一條 BGP 路由的問題
show run
show ip bgp
show ip bgp summary
解決:
· 使用 IBGP 全互聯(lián)
· 設(shè)計(jì)一個(gè)路由反射器模型。
router bgp 109
neighbor x.x.x.x route-reflector-client
設(shè)計(jì)一個(gè)聰明模型
(4)向 IBGP/EBGP 鄰接傳播一條 IBGP 路由的問題
一條 BGP 路由只有首先通過 IGP 或靜態(tài)路由獲得后才是同步的。
show ip bgp 命令的輸出顯示了 BGP 表中的不同步路由。
3、排除路由沒有裝入 IP 路由選擇表中的故障
原因:
( 1) IBGP 原因
· BGP 路由不同步
· BGP 下一跳不可達(dá)
( 2)EBGP 原因
· 在多跳 EBGP 情況下 BGP 下一跳不可達(dá)
· BGP 路由被抑制
· 多出口鑒別器( MED )值為無窮
4、BGP 下一跳不可達(dá)
解決:
使用靜態(tài)路由或再分布經(jīng)由 IGP 宣告 EBGP 下一跳
router ospf 1
network x.x.x.0 0.0.0.255 area 0
使用 next-hop-self 命令將下一跳改變?yōu)橐粋€(gè)內(nèi)部對(duì)等實(shí)體地址
router bgp 109
router ospf x.x.x.x next-hop-self
BGP 路由被抑制
抑制( dampening)是減小本地 BGP 網(wǎng)絡(luò)中來自 EBGP 鄰居的不穩(wěn)定 BGP 路由所引起的不穩(wěn)定性的方法。
抑制是一種為一條翻動(dòng)的 BGP 路由指派一個(gè)罰點(diǎn)的方法。
router bgp 109
bgp dampening