A. 路由器原理和常用的路由協議及演算法的介紹
近十年來,隨著計算機網路規模的不斷擴大,大型互聯網路(如Internet)的迅猛發展,路由技術在網路技術中已逐漸成為關鍵部分,路由器也隨之成為最重要的網路設備。用戶的需求推動著路由技術的發展和路由器的普及,人們已經不滿足於僅在本地網路上共享信息,而希望最大限度地利用全球各個地區、各種類型的網路資源。而在目前的情況下,任何一個有一定規模的計算機網路(如企業網、校園網、智能大廈等),無論採用的是快速以大網技術、FDDI技術,還是ATM技術,都離不開路由器,否則就無法正常運作和管理。
1、網路互連
把自己的網路同其它的網路互連起來,從網路中獲取更多的信息和向網路發布自己的消息,是網路互連的最主要的動力。網路的互連有多種方式,其中使用最多的是網橋互連和路由器互連。
1.1 網橋互連的網路
網橋工作在OSI模型中的第二層,即鏈路層。完成數據幀(frame)的轉發,主要目的是在連接的網路間提供透明的通信。網橋的轉發是依據數據幀中的源地址和目的地址來判斷一個幀是否應轉發和轉發到哪個埠。幀中的地址稱為「MAC」地址或「硬體」地址,一般就是網卡所帶的地址。
網橋的作用是把兩個或多個網路互連起來,提供透明的通信。網路上的設備看不到網橋的存在,設備之間的通信就如同在一個網上一樣方便。由於網橋是在數據幀上進行轉發的,因此只能連接相同或相似的網路(相同或相似結構的數據幀),如乙太網之間、乙太網與令牌環(tokenring)之間的互連,對於不同類型的網路(數據幀結構不同),如乙太網與X.25之間,網橋就無能為力了。
網橋擴大了網路的規模,提高了網路的性能,給網路應用帶來了方便,在以前的網路中,網橋的應用較為廣泛。但網橋互連也帶來了不少問題:一個是廣播風暴,網橋不阻擋網路中廣播消息,當網路的規模較大時(幾個網橋,多個乙太網段),有可能引起廣播風暴(broadcastingstorm),導致整個網路全被廣播信息充滿,直至完全癱瘓。第二個問題是,當與外部網路互連時,網橋會把內部和外部網路合二為一,成為一個網,雙方都自動向對方完全開放自己的網路資源。這種互連方式在與外部網路互連時顯然是難以接受的。問題的主要根源是網橋只是最大限度地把網路溝通,而不管傳送的信息是什麼。
1.2 路由器互連網路
路由器互連與網路的協議有關,我們討論限於TCP/IP網路的情況。
路由器工作在OSI模型中的第三層,即網路層。路由器利用網路層定義的「邏輯」上的網路地址(即IP地址)來區別不同的網路,實現網路的互連和隔離,保持各個網路的獨立性。路由器不轉發廣播消息,而把廣播消息限制在各自的網路內部。發送到其他網路的數據茵先被送到路由器,再由路由器轉發出去。
IP路由器只轉發IP分組,把其餘的部分擋在網內(包括廣播),從而保持各個網路具有相對的獨立性,這樣可以組成具有許多網路(子網)互連的大型的網路。由於是在網路層的互連,路由器可方便地連接不同類型的網路,只要網路層運行的是IP協議,通過路由器就可互連起來。
網路中的設備用它們的網路地址(TCP/IP網路中為IP地址)互相通信。IP地址是與硬體地址無關的「邏輯」地址。路由器只根據IP地址來轉發數據。IP地址的結構有兩部分,一部分定義網路號,另一部分定義網路內的主機號。目前,在Internet網路中採用子網掩碼來確定IP地址中網路地址和主機地址。子網掩碼與IP地址一樣也是32bit,並且兩者是一一對應的,並規定,子網掩碼中數字為「1」所對應的IP地址中的部分為網路號,為「0」所對應的則為主機號。網路號和主機號合起來,才構成一個完整的IP地址。同一個網路中的主機IP地址,其網路號必須是相同的,這個網路稱為IP子網。
通信只能在具有相同網路號的IP地址之間進行,要與其它IP子網的主機進行通信,則必須經過同一網路上的某個路由器或網關(gateway)出去。不同網路號的IP地址不能直接通信,即使它們接在一起,也不能通信。
路由器有多個埠,用於連接多個IP子網。每個埠的IP地址的網路號要求與所連接的IP子網的網路號相同。不同的埠為不同的網路號,對應不同的IP子網,這樣才能使各子網中的主機通過自己子網的IP地址把要求出去的IP分組送到路由器上。
2、路由原理
當IP子網中的一台主機發送IP分組給同一IP子網的另一台主機時,它將直接把IP分組送到網路上,對方就能收到。而要送給不同IP於網上的主機時,它要選擇一個能到達目的子網上的路由器,把IP分組送給該路由器,由路由器負責把IP分組送到目的地。如果沒有找到這樣的路由器,主機就把IP分組送給一個稱為「預設網關(defaultgateway)」的路由器上。「預設網關」是每台主機上的一個配置參數,它是接在同一個網路上的某個路由器埠的IP地址。
路由器轉發IP分組時,只根據IP分組目的IP地址的網路號部分,選擇合適的埠,把IP分組送出去。同主機一樣,路由器也要判定埠所接的是否是目的子網,如果是,就直接把分組通過埠送到網路上,否則,也要選擇下一個路由器來傳送分組。路由器也有它的預設網關,用來傳送不知道往哪兒送的IP分組。這樣,通過路由器把知道如何傳送的IP分組正確轉發出去,不知道的IP分組送給「預設網關」路由器,這樣一級級地傳送,IP分組最終將送到目的地,送不到目的地的IP分組則被網路丟棄了。
目前TCP/IP網路,全部是通過路由器互連起來的,Internet就是成千上萬個IP子網通過路由器互連起來的國際性網路。這種網路稱為以路由器為基礎的網路(routerbasednetwork),形成了以路由器為節點的「網間網」。在「網間網」中,路由器不僅負責對IP分組的轉發,還要負責與別的路由器進行聯絡,共同確定「網間網」的路由選擇和維護路由表。
路由動作包括兩項基本內容:尋徑和轉發。尋徑即判定到達目的地的最佳路徑,由路由選擇演算法來實現。由於涉及到不同的路由選擇協議和路由選擇演算法,要相對復雜一些。為了判定最佳路徑,路由選擇演算法必須啟動並維護包含路由信息的路由表,其中路由信息依賴於所用的路由選擇演算法而不盡相同。路由選擇演算法將收集到的不同信息填入路由表中,根據路由表可將目的網路與下一站(nexthop)的關系告訴路由器。路由器間互通信息進行路由更新,更新維護路由表使之正確反映網路的拓撲變化,並由路由器根據量度來決定最佳路徑。這就是路由選擇協議(routingprotocol),例如路由信息協議(RIP)、開放式最短路徑優先協議(OSPF)和邊界網關協議(BGP)等。
轉發即沿尋徑好的最佳路徑傳送信息分組。路由器首先在路由表中查找,判明是否知道如何將分組發送到下一個站點(路由器或主機),如果路由器不知道如何發送分組,通常將該分組丟棄;否則就根據路由表的相應表項將分組發送到下一個站點,如果目的網路直接與路由器相連,路由器就把分組直接送到相應的埠上。這就是路由轉發協議(routedprotocol)。
路由轉發協議和路由選擇協議是相互配合又相互獨立的概念,前者使用後者維護的路由表,同時後者要利用前者提供的功能來發布路由協議數據分組。下文中提到的路由協議,除非特別說明,都是指路由選擇協議,這也是普遍的習慣。
3、路由協議
典型的路由選擇方式有兩種:靜態路由和動態路由。
靜態路由是在路由器中設置的固定的路由表。除非網路管理員干預,否則靜態路由不會發生變化。由於靜態路由不能對網路的改變作出反映,一般用於網路規模不大、拓撲結構固定的網路中。靜態路由的優點是簡單、高效、可靠。在所有的路由中,靜態路由優先順序最高。當動態路由與靜態路由發生沖突時,以靜態路由為准。
動態路由是網路中的路由器之間相互通信,傳遞路由信息,利用收到的路由信息更新路由器表的過程。它能實時地適應網路結構的變化。如果路由更新信息表明發生了網路變化,路由選擇軟體就會重新計算路由,並發出新的路由更新信息。這些信息通過各個網路,引起各路由器重新啟動其路由演算法,並更新各自的路由表以動態地反映網路拓撲變化。動態路由適用於網路規模大、網路拓撲復雜的網路。當然,各種動態路由協議會不同程度地佔用網路帶寬和CPU資源。
靜態路由和動態路由有各自的特點和適用范圍,因此在網路中動態路由通常作為靜態路由的補充。當一個分組在路由器中進行尋徑時,路由器首先查找靜態路由,如果查到則根據相應的靜態路由轉發分組;否則再查找動態路由。
根據是否在一個自治域內部使用,動態路由協議分為內部網關協議(IGP)和外部網關協議(EGP)。這里的自治域指一個具有統一管理機構、統一路由策略的網路。自治域內部採用的路由選擇協議稱為內部網關協議,常用的'有RIP、OSPF;外部網關協議主要用於多個自治域之間的路由選擇,常用的是BGP和BGP-4。下面分別進行簡要介紹。
3.1 RIP路由協議
RIP協議最初是為Xerox網路系統的Xeroxparc通用協議而設計的,是Internet中常用的路由協議。RIP採用距離向量演算法,即路由器根據距離選擇路由,所以也稱為距離向量協議。路由器收集所有可到達目的地的不同路徑,並且保存有關到達每個目的地的最少站點數的路徑信息,除到達目的地的最佳路徑外,任何其它信息均予以丟棄。同時路由器也把所收集的路由信息用RIP協議通知相鄰的其它路由器。這樣,正確的路由信息逐漸擴散到了全網。
RIP使用非常廣泛,它簡單、可靠,便於配置。但是RIP只適用於小型的同構網路,因為它允許的最大站點數為15,任何超過15個站點的目的地均被標記為不可達。而且RIP每隔30s一次的路由信息廣播也是造成網路的廣播風暴的重要原因之一。
3.2 OSPF路由協議
80年代中期,RIP已不能適應大規模異構網路的互連,0SPF隨之產生。它是網間工程任務組織(1ETF)的內部網關協議工作組為IP網路而開發的一種路由協議。
0SPF是一種基於鏈路狀態的路由協議,需要每個路由器向其同一管理域的所有其它路由器發送鏈路狀態廣播信息。在OSPF的鏈路狀態廣播中包括所有介面信息、所有的量度和其它一些變數。利用0SPF的路由器首先必須收集有關的鏈路狀態信息,並根據一定的演算法計算出到每個節點的最短路徑。而基於距離向量的路由協議僅向其鄰接路由器發送有關路由更新信息。
與RIP不同,OSPF將一個自治域再劃分為區,相應地即有兩種類型的路由選擇方式:當源和目的地在同一區時,採用區內路由選擇;當源和目的地在不同區時,則採用區間路由選擇。這就大大減少了網路開銷,並增加了網路的穩定性。當一個區內的路由器出了故障時並不影響自治域內其它區路由器的正常工作,這也給網路的管理、維護帶來方便。
3.3 BGP和BGP-4路由協議
BGP是為TCP/IP互聯網設計的外部網關協議,用於多個自治域之間。它既不是基於純粹的鏈路狀態演算法,也不是基於純粹的距離向量演算法。它的主要功能是與其它自治域的BGP交換網路可達信息。各個自治域可以運行不同的內部網關協議。BGP更新信息包括網路號/自治域路徑的成對信息。自治域路徑包括到達某個特定網路須經過的自治域串,這些更新信息通過TCP傳送出去,以保證傳輸的可靠性。
為了滿足Internet日益擴大的需要,BGP還在不斷地發展。在最新的BGp4中,還可以將相似路由合並為一條路由。
3.4 路由表項的優先問題
在一個路由器中,可同時配置靜態路由和一種或多種動態路由。它們各自維護的路由表都提供給轉發程序,但這些路由表的表項間可能會發生沖突。這種沖突可通過配置各路由表的優先順序來解決。通常靜態路由具有默認的最高優先順序,當其它路由表表項與它矛盾時,均按靜態路由轉發。
4、路由演算法
路由演算法在路由協議中起著至關重要的作用,採用何種演算法往往決定了最終的尋徑結果,因此選擇路由演算法一定要仔細。通常需要綜合考慮以下幾個設計目標:
——(1)最優化:指路由演算法選擇最佳路徑的能力。
——(2)簡潔性:演算法設計簡潔,利用最少的軟體和開銷,提供最有效的功能。
——(3)堅固性:路由演算法處於非正常或不可預料的環境時,如硬體故障、負載過高或操作失誤時,都能正確運行。由於路由器分布在網路聯接點上,所以在它們出故障時會產生嚴重後果。最好的路由器演算法通常能經受時間的考驗,並在各種網路環境下被證實是可靠的。
——(4)快速收斂:收斂是在最佳路徑的判斷上所有路由器達到一致的過程。當某個網路事件引起路由可用或不可用時,路由器就發出更新信息。路由更新信息遍及整個網路,引發重新計算最佳路徑,最終達到所有路由器一致公認的最佳路徑。收斂慢的路由演算法會造成路徑循環或網路中斷。
——(5)靈活性:路由演算法可以快速、准確地適應各種網路環境。例如,某個網段發生故障,路由演算法要能很快發現故障,並為使用該網段的所有路由選擇另一條最佳路徑。
路由演算法按照種類可分為以下幾種:靜態和動態、單路和多路、平等和分級、源路由和透明路由、域內和域間、鏈路狀態和距離向量。前面幾種的特點與字面意思基本一致,下面著重介紹鏈路狀態和距離向量演算法。
鏈路狀態演算法(也稱最短路徑演算法)發送路由信息到互聯網上所有的結點,然而對於每個路由器,僅發送它的路由表中描述了其自身鏈路狀態的那一部分。距離向量演算法(也稱為Bellman-Ford演算法)則要求每個路由器發送其路由表全部或部分信息,但僅發送到鄰近結點上。從本質上來說,鏈路狀態演算法將少量更新信息發送至網路各處,而距離向量演算法發送大量更新信息至鄰接路由器。
由於鏈路狀態演算法收斂更快,因此它在一定程度上比距離向量演算法更不易產生路由循環。但另一方面,鏈路狀態演算法要求比距離向量演算法有更強的CPU能力和更多的內存空間,因此鏈路狀態演算法將會在實現時顯得更昂貴一些。除了這些區別,兩種演算法在大多數環境下都能很好地運行。
最後需要指出的是,路由演算法使用了許多種不同的度量標准去決定最佳路徑。復雜的路由演算法可能採用多種度量來選擇路由,通過一定的加權運算,將它們合並為單個的復合度量、再填入路由表中,作為尋徑的標准。通常所使用的度量有:路徑長度、可靠性、時延、帶寬、負載、通信成本等。
5、新一代路由器
由於多媒體等應用在網路中的發展,以及ATM、快速乙太網等新技術的不斷採用,網路的帶寬與速率飛速提高,傳統的路由器已不能滿足人們對路由器的性能要求。因為傳統路由器的分組轉發的設計與實現均基於軟體,在轉發過程中對分組的處理要經過許多環節,轉發過程復雜,使得分組轉發的速率較慢。另外,由於路由器是網路互連的關鍵設備,是網路與其它網路進行通信的一個「關口」,對其安全性有很高的要求,因此路由器中各種附加的安全措施增加了CPU的負擔,這樣就使得路由器成為整個互聯網上的「瓶頸」。
傳統的路由器在轉發每一個分組時,都要進行一系列的復雜操作,包括路由查找、訪問控製表匹配、地址解析、優先順序管理以及其它的附加操作。這一系列的操作大大影響了路由器的性能與效率,降低了分組轉發速率和轉發的吞吐量,增加了CPU的負擔。而經過路由器的前後分組間的相關性很大,具有相同目的地址和源地址的分組往往連續到達,這為分組的快速轉發提供了實現的可能與依據。新一代路由器,如IPSwitch、TagSwitch等,就是採用這一設計思想用硬體來實現快速轉發,大大提高了路由器的性能與效率。
新一代路由器使用轉發緩存來簡化分組的轉發操作。在快速轉發過程中,只需對一組具有相同目的地址和源地址的分組的前幾個分組進行傳統的路由轉發處理,並把成功轉發的分組的目的地址、源地址和下一網關地址(下一路由器地址)放人轉發緩存中。當其後的分組要進行轉發時,茵先查看轉發緩存,如果該分組的目的地址和源地址與轉發緩存中的匹配,則直接根據轉發緩存中的下一網關地址進行轉發,而無須經過傳統的復雜操作,大大減輕了路由器的負擔,達到了提高路由器吞吐量的目標。
B. 網路協議-- 底層網路知識詳解(從二層到三層)
網線
Hub 採取的是廣播的模式,如果每一台電腦發出的包,宿舍的每個電腦都能收到,那就麻煩了。這就需要解決幾個問題:
這幾個問題,都是第二層, 數據鏈路層 ,也即 MAC 層要解決的問題。 MAC 的全稱是 Medium Access Control ,即媒體訪問控制。控制什麼呢?其實就是控制在往媒體上發數據的時候,誰先發、誰後發的問題。防止發生混亂。這解決的是第二個問題。這個問題中的規則,學名叫 多路訪問 。
三種方式:
方式一:分多個車道。每個車一個車道,你走你的,我走我的。這在計算機網路里叫作 信道劃分 ;
方式二:今天單號出行,明天雙號出行,輪著來。這在計算機網路里叫作 輪流協議 ;
方式三:不管三七二十一,有事兒先出門,發現特堵,就回去。錯過高峰再出。我們叫作 隨機接入協議 。著名的乙太網,用的就是這個方式。
接下來要解決第一個問題:發給誰,誰接收?這里用到一個物理地址,叫作 鏈路層地址 。但是因為第二層主要解決媒體接入控制的問題,所以它常被稱為 MAC 地址 。
解決第一個問題就牽扯到第二層的網路包格式。
對於乙太網,第二層的最後面是 CRC,也就是循環冗餘檢測。通過 XOR 異或的演算法,來計算整個包是否在發送的過程中出現了錯誤,主要解決第三個問題。
這里還有一個沒有解決的問題,當源機器知道目標機器的時候,可以將目標地址放入包裡面,如果不知道呢?一個廣播的網路裡面接入了 N 台機器,我怎麼知道每個 MAC 地址是誰呢?這就是 ARP 協議 ,也就是已知 IP 地址,求 MAC 地址的協議。
ARP 是通過吼的方式(廣播)來尋找目標 MAC 地址的,吼完之後記住一段時間,這個叫作緩存。
誰能知道目標 MAC 地址是否就是連接某個口的電腦的 MAC 地址呢?這就需要一個能把 MAC 頭拿下來,檢查一下目標 MAC 地址,然後根據策略轉發的設備,這個設備顯然是個二層設備,我們稱為 交換機 。
交換機是有 MAC 地址學習能力的,學完了它就知道誰在哪兒了,不用廣播了。(剛開始不知道的時候,是需要廣播的)
當交換機的數目越來越多的時候,會遭遇環路問題,讓網路包迷路,這就需要使用 STP 協議,通過華山論劍比武的方式,將有環路的圖變成沒有環路的樹,從而解決環路問題。
在數據結構中,有一個方法叫做 最小生成樹 。有環的我們常稱為圖。將圖中的環破了,就生成了樹。在計算機網路中,生成樹的演算法叫作 STP ,全稱 Spanning Tree Protocol 。
STP 協議比較復雜,一開始很難看懂,但是其實這是一場血雨腥風的武林比武或者華山論劍,最終決出五嶽盟主的方式。
交換機數目多會面臨隔離問題,可以通過 VLAN 形成 虛擬區域網 ,從而解決廣播問題和安全問題。
對於支持 VLAN 的交換機,有一種口叫作 Trunk 口。它可以轉發屬於任何 VLAN 的口。交換機之間可以通過這種口相互連接。
ping 是基於 ICMP 協議工作的。
ICMP 全稱 Internet Control Message Protocol ,就是 互聯網控制報文協議 。
ICMP 報文是封裝在 IP 包裡面的。因為傳輸指令的時候,肯定需要源地址和目標地址。它本身非常簡單。因為作為偵查兵,要輕裝上陣,不能攜帶大量的包袱。
ICMP總結:
ICMP 相當於網路世界的偵察兵。我講了兩種類型的 ICMP 報文,一種是主動探查的查詢報文,一種異常報告的差錯報文;
ping 使用查詢報文,Traceroute 使用差錯報文。
在進行網卡配置的時候,除了 IP 地址,還需要配置一個Gateway 的東西,這個就是 網關 。
一旦配置了 IP 地址和網關,往往就能夠指定目標地址進行訪問了。由於在跨網關訪問的時候,牽扯到 MAC 地址和 IP 地址的變化,這里有必要詳細描述一下 MAC 頭和 IP 頭的細節。
路由器是一台設備,它有五個網口或者網卡,相當於有五隻手,分別連著五個區域網。每隻手的 IP 地址都和區域網的 IP 地址相同的網段,每隻手都是它握住的那個區域網的網關。
對於 IP 頭和 MAC 頭哪些變、哪些不變的問題,可以分兩種類型。我把它們稱為「歐洲十國游」型和「玄奘西行」型。
之前我說過, MAC 地址是一個區域網內才有效的地址。因而,MAC 地址只要過網關,就必定會改變,因為已經換了區域網 。
兩者主要的區別在於 IP 地址是否改變。不改變 IP 地址的網關,我們稱為 轉發網關 ;改變 IP 地址的網關,我們稱為 NAT 網關 。
網關總結:
路由分靜態路由和動態路由,靜態路由可以配置復雜的策略路由,控制轉發策略;
動態路由主流演算法有兩種, 距離矢量演算法 和 鏈路狀態演算法 。
距離矢量路由(distance vector routing)。它是基於 Bellman-Ford 演算法的。
這種演算法的基本思路是,每個路由器都保存一個路由表,包含多行,每行對應網路中的一個路由器,每一行包含兩部分信息,一個是要到目標路由器,從那條線出去,另一個是到目標路由器的距離。
由此可以看出,每個路由器都是知道全局信息的。那這個信息如何更新呢?每個路由器都知道自己和鄰居之間的距離,每過幾秒,每個路由器都將自己所知的到達所有的路由器的距離告知鄰居,每個路由器也能從鄰居那裡得到相似的信息。
每個路由器根據新收集的信息,計算和其他路由器的距離,比如自己的一個鄰居距離目標路由器的距離是 M,而自己距離鄰居是 x,則自己距離目標路由器是 x+M。
這種演算法存在的問題:
第一個問題:好消息傳得快,壞消息傳得慢。
第二個問題:每次發送的時候,要發送整個全局路由表。
所以上面的兩個問題,限制了距離矢量路由的網路規模。
鏈路狀態路由(link state routing),基於 Dijkstra 演算法。
這種演算法的基本思路是:當一個路由器啟動的時候,首先是發現鄰居,向鄰居 say hello,鄰居都回復。然後計算和鄰居的距離,發送一個 echo,要求馬上返回,除以二就是距離。然後將自己和鄰居之間的鏈路狀態包廣播出去,發送到整個網路的每個路由器。這樣每個路由器都能夠收到它和鄰居之間的關系的信息。因而,每個路由器都能在自己本地構建一個完整的圖,然後針對這個圖使用 Dijkstra 演算法,找到兩點之間的最短路徑。
不像距離距離矢量路由協議那樣,更新時發送整個路由表。鏈路狀態路由協議只廣播更新的或改變的網路拓撲,這使得更新信息更小,節省了帶寬和 CPU 利用率。而且一旦一個路由器掛了,它的鄰居都會廣播這個消息,可以使得壞消息迅速收斂。
基於兩種演算法產生兩種協議,BGP 協議和 OSPF 協議。
OSPF(Open Shortest Path First,開放式最短路徑優先) 就是這樣一個基於鏈路狀態路由協議,廣泛應用在數據中心中的協議。由於主要用在數據中心內部,用於路由決策,因而稱為 內部網關協議(Interior Gateway Protocol,簡稱 IGP) 。
內部網關協議的重點就是找到最短的路徑。在一個組織內部,路徑最短往往最優。當然有時候 OSPF 可以發現多個最短的路徑,可以在這多個路徑中進行負載均衡,這常常被稱為 等價路由 。
但是外網的路由協議,也即國家之間的,又有所不同。我們稱為 外網路由協議(Border Gateway Protocol,簡稱 BGP) 。
在網路世界,這一個個國家成為自治系統 AS(Autonomous System)。自治系統分幾種類型。
每個自治系統都有邊界路由器,通過它和外面的世界建立聯系。
BGP 又分為兩類, eBGP 和 iBGP 。自治系統間,邊界路由器之間使用 eBGP 廣播路由。內部網路也需要訪問其他的自治系統。邊界路由器如何將 BGP 學習到的路由導入到內部網路呢?就是通過運行 iBGP,使得內部的路由器能夠找到到達外網目的地的最好的邊界路由器。
BGP 協議使用的演算法是 路徑矢量路由協議 (path-vector protocol)。它是距離矢量路由協議的升級版。
前面說了距離矢量路由協議的缺點。其中一個是收斂慢。在 BGP 裡面,除了下一跳 hop 之外,還包括了自治系統 AS 的路徑,從而可以避免壞消息傳得慢的問題,也即上面所描述的,B 知道 C 原來能夠到達 A,是因為通過自己,一旦自己都到達不了 A 了,就不用假設 C 還能到達 A 了。
另外,在路徑中將一個自治系統看成一個整體,不區分自治系統內部的路由器,這樣自治系統的數目是非常有限的。就像大家都能記住出去玩,從中國出發先到韓國然後到日本,只要不計算細到具體哪一站,就算是發送全局信息,也是沒有問題的。
參考:
極客時間-趣談網路協議
極客時間-趣談網路協議
極客時間-趣談網路協議
極客時間-趣談網路協議-網關
C. 圖解TCP/IP
計算機使用模式的演變:
20世紀50年代 批處理時代
20世紀60年代 分時系統時代
20世紀70年代 計算機間通信時代
20世紀80年代 計算機網路時代
20世紀90年代 互聯網普及時代
2000年 以互聯網為中心的時代
2010年 無論何時何地地一切皆TCP/IP的網路時代
在計算機網路與信息通信領域,人們經常提及 「協議」 。簡單來說。 協議 就是計算機與計算機之間通過網路實現通信時事先達成的一種「約定」。這種「約定」使那些由不同廠商的設備、不同的CPU以及不同的操作系統組成的計算機之間,只要遵循相同的協議就能實現通信。換句話說, 協議 就是計算機之氏猜此間的通信語言,只有支持相同的協議,計算機之間才能相互通信。
計算機通信也會在每一個分組中附加上源主機地址和目標主機地址送給通信線路。這些發送端地址、接收端地址以及分組序號寫入的部分稱為 「報文首部」 。
TCP/IP協議並非ISO(國際標准化組織)所制定的某種國際標准,而是由IETF(Internet Engineering Task Force國際互聯網工程任務組)所建議的、致力於推進器標准化作業的一種協議。
OSI參考模型
應用層 :針對特定應用的協議。以電子郵件為例,用戶A在主機A上新建一封電子郵件,指定收件人為B,並輸入郵件內容為「早上好」。應用層協議會在所要傳遞數據的前端附加一個首部(標簽)信息,該首部標明了郵件內容為「早上好」和收件人為B。
表示層 :設備固有數據格式和網路標准數據格式的轉換。用戶A和用戶B使用的郵件客戶端一致,便能夠順利收取和閱讀郵件,不一致時表示層就發揮作用了:將數據從「某個計算機特定的數據格式」轉換為「網路通用的標准數據格式」後再發送出去,接收端也進行相應處理。表示層與表示層之間為了識別編碼格式也會附加首部信息,從而將實際傳輸的數據轉交給下一層處理。
會話層 :通信管理。負責建立和斷開通信連接(數據流動的邏輯通路)。管理傳輸層以下的分層。假定用戶A新建了5封電子郵件准備發送給用戶B,是建立一次連殲迅接一起發送,還是分別建立5次連接各自發送,都是會話層決定的,會話層和表示層一樣,也會在數據前段附加首部或標簽信息再轉發給下一層。而這些首部或標簽中兆和記錄著數據傳送順序的信息。
傳輸層 :管理兩個節點之間的數據傳輸。負責可靠傳輸(確保數據被可靠傳送到目標地址)。用主機A將「早上好」這一數據發送給主機B,期間可能因為某些原因導致數據損壞,主機B只收到「早上」,此時也會將這一事實告訴主機A,主機A得知情況會將後面的「好」重發給主機B。保證數據傳輸的可靠性是傳輸層的一個重要作用。為了確保可靠性,這一層所要傳輸的數據附加首部以識別這一分層的數據。然而,實際上將數據傳輸給對端的處理是由網路層來完成的。
網路層 :地址管理與路由選擇。兩端主機之間雖然有眾多數據鏈路,但能夠將數據從主機A送到主機B也都是網路層的功勞。相當於TCP/IP協議中的IP協議,網路層不能保證數據的可達性,所以需要傳輸層TCP協議確保可達性,所以TCP/IP協議實現了可靠傳輸。
數據鏈路層 :互連設備之間傳送和識別數據幀。網路層負責將整個數據發送給最終目標地址,而數據鏈路層則只負責發送一個分段內的數據。
物理層 :以「0」、「1」代表電壓的高低、燈光的閃滅。界定連接器和網線的規格。將數據的0、1轉換為電壓和脈沖光傳輸給物理的傳輸介質。
計算機之間的網路連接通過 電纜 相互連接。任何一台計算機連接網路時,必須要使用 網卡 (網路適配器、NIC、LAN卡), 中繼器 的作用是將電纜傳過來的信號調整和放大再傳給另一個電纜,可以完成不同媒介之間的連接工作。 網橋 是數據鏈路層面上連接兩個網路的設備,提供的是傳遞數據幀的作用,並且還具備自學機制。 路由器 是在網路層面上(OSI七層模型網路層)連接兩個網路、並對分組報文進行轉發的設備。 網橋 是根據物理地址(MAC地址)進行處理,而路由器/3層交換機則是根據IP地址進行處理的。由此,TCP/IP中網路層的地址就成為了IP地址。對於並發訪問量非常大的一個企業級Web站點,使用一台伺服器不足以滿足前端的訪問需求,這時通常會架設多台伺服器來分擔。這些伺服器的訪問的入口地址通常只有一個,為了能通過同一個URL將前端訪問分發到後台多個伺服器上,可以將這些伺服器的前端加一個負載均衡器。這種負載均衡器就是4-7層交換機的一種。 網關 是OSI參考模型中負責將從傳輸層到應用層的數據進行轉換和轉發的設備。在兩個不能進行直接通信的協議之間進行翻譯,最終實現兩者的通信。非常典型的例子就是互聯網郵件和手機郵件之間的轉換服務。防火牆也是一款通過網關通信,針對不用應用提高安全性的產品。
美國軍方利用分組交換技術組件的ARPANET網路是互聯網的鼻祖。而BSD UNIX操作系統實現了TCP/IP協議,隨著UNIX系統的普及,TCP/IP協議開始盛行。TCP/IP可以單純的指這兩種協議,然而在很多情況下,它指的是包含HTTP、SMTP、FTP、TCP、UDP、IP、ARP等很多協議的 網際協議族 。
發送數據包的過程,和上節OSI參考模型中介紹的差不多。數據鏈路層是由網路介面(乙太網驅動)來處理的,它會改數據附加上 乙太網首部 , 乙太網首部 中包含接收端的MAC地址、發送端MAC地址以及標志乙太網類型的乙太網數據的協議。
在乙太網普及之初,一般多台終端使用同一根同軸電纜的 共享介質型 連接方式,訪問控制一般以半雙工通信為前提採用CSMA/CD方式。隨著ATM交換技術的進步和CAT5 UTP電纜的普及很快發生了變化,逐漸採用像 非共享介質網路 那樣直接與交換機連接的方式。
網路層與數據鏈路層的關系
某人要去一個很遠的地方旅行,並計劃先後乘坐飛機、火車、公交車到達目的地。旅行社不僅幫他預訂好了飛機票和火車票,甚至還為他指定了一個詳細的行程表,詳細到幾點幾分需要乘坐飛機或火車都一目瞭然。機票和火車票只能夠在某一限定區間內移動,此處的「區間內」就如同通信網路上的數據鏈路。這個區間內的出發地點和目的地點就如同某一個數據鏈路的源地址和目標地址等首部信息。整個行程表的作用就相當於網路層。
DNS :將域名和IP地址相匹配。
ARP :以目標IP地址為線索,用來定位下一個應該接受數據分包的網路設備對應的MAC地址。ARP只適用於IPv4,IPv6可以用ICMPv6替代ARP發送鄰居探索消息。
ICMP :在IP通信中如果某個IP包因為某種原因未能送達目標地址,那麼這個具體的原因將由ICMP負責通知。
DHCP :使用移動設備時,每移動到一個新地方,都要重新設置IP地址,為了實現自動設置IP地址、統一管理IP地址分配,就產生了DHCP協議。
NAT :是用於在本地網路中使用私有地址,在連接互聯網時轉而使用全局IP地址的技術。
IP隧道 :IPv4和IPv6之間進行通信的技術就是IP隧道。
TCP用於低速可靠傳輸
UDP用於高速不可靠傳輸
埠號就是用來識別同一台計算機中進行通信的不同應用程序,也被稱為程序地址。
TCP傳輸利用 窗口控制 提高速度,無需等到每次應答來進行下一次發送,而是有個窗口進行緩沖,來提高吞吐量。
TCP擁塞控制,利用擁塞窗口來調節發送的數據量,擁塞時減小窗口,流暢是增大窗口來控制吞吐量。
我們日常網路訪問的 http 用的是 tcp ,那還是看一下這個過程吧
tcp 可以提供全雙工的數據流傳輸服務,全雙工說白了,就是同一時間 A 可以發信息給 B , B 也可以發消息給 A ,倆人同時都可以給對方發消息;半雙工就是某個時間段 A 可以發給 B ,但 B 不能給 A ,換個時間段,就反過來了。
這個過程理解起來,就像兩人在喊話:
A:喂,有人嗎,我想建立連接
B:有哇,你建立吧,等你吆
A:好噠,我來啦
然後倆人就建立連接了...
一定要三次握手么,兩次行不行?
這么一個場景:
A->B: 洞幺洞幺,我是洞拐,收到請回復。
B->A: 洞拐洞拐,洞幺收到。
請問根據以上對話判斷:
1、B是否能收到A的信息? (答案是肯定的)
2、A是否能收到B的信息? (你猜?)
tcp的核心思想是保證數據可靠傳輸,如果 2 次,顯然不行,但 3 次就一定行么?未必,可能第三次的時候網路中斷了,然後 A 就認為 B 收到了,然後一通發消息,其實 B 沒收到,但這是無法完全保證的。無論握手多少次都不能滿足傳輸的絕對可靠,為了效率跟相對可靠而看, 3 次剛剛好,所以就 3 次了(正好 AB 相互確認了一次)。
舉個栗子:把客戶端比作男孩,伺服器比作女孩。通過他們的分手來說明「四次揮手」過程:
"第一次揮手" :日久見人心,男孩發現女孩變成了自己討厭的樣子,忍無可忍,於是決定分手,隨即寫了一封信告訴女孩。
「第二次揮手」 :女孩收到信之後,知道了男孩要和自己分手,怒火中燒,心中暗罵:你算什麼東西,當初你可不是這個樣子的!於是立馬給男孩寫了一封回信:分手就分手,給我點時間,我要把你的東西整理好,全部還給你!男孩收到女孩的第一封信之後,明白了女孩知道自己要和她分手。隨後等待女孩把自己的東西收拾好。
「第三次揮手」 :過了幾天,女孩把男孩送的東西都整理好了,於是再次寫信給男孩:你的東西我整理好了,快把它們拿走,從此你我恩斷義絕!
「第四次揮手」 :男孩收到女孩第二封信之後,知道了女孩收拾好東西了,可以正式分手了,於是再次寫信告訴女孩:我知道了,這就去拿回來!
為什麼連接的時候是三次握手,關閉的時候卻是四次握手?
答:因為當 Server端 收到 Client端 的 SYN 連接請求報文後,可以直接發送 SYN+ACK報文 。其中 ACK報文 是用來應答的, SYN報文 是用來同步的。但是關閉連接時,當 Server端 收到 FIN報文 時,很可能並不會立即 關閉SOCKET ,所以只能先回復一個 ACK報文 ,告訴 Client端 ,"你發的 FIN報文 我收到了"。只有等到我 Server端 所有的報文都發送完了,我才能發送 FIN報文 ,因此不能一起發送。故需要四步握手。
靜態路由 是指事先設置好路由器和主機中並將路由信息固定的一種方法。缺點是某個路由器發生故障,基本上無法自動繞過發生故障的節點,只有在管理員手工設置以後才能恢復正常。
動態路由 是管理員先設置好路由協議,其設定過程的復雜程度與具體要設置路由協議的類型有直接關系。在路由器個數較多的網路,採用動態路由顯然能夠減輕管理員負擔。網路發生故障,只要有一個可繞的其他路徑,數據包會自動選擇這個路徑,但路由器需要定期相互交換必要的路由控制信息,會增加一定程度的負荷。
根據路由控制范圍分為 IGP (內部網關協議)和 EGP (外部網關協議)
路由演算法分為 距離向量演算法 和 鏈路狀態演算法
距離向量演算法 :通過距離與方向確定通往目標網路的路徑
鏈路狀態演算法 :鏈路狀態中路由器知道網路的連接狀態,並根據鏈路信息確定通往目標網路的路徑。
IGP包含RIP、RIP2、OSPF
EGP包含EGP、BGP
RIP是距離向量型的一種路由協議,廣泛應用於LAN
RIP2是RIP的第二版。新增以下特點:使用多播、支持子網掩碼、路由選擇域、外部路由標志、身份驗證密鑰
OSPF是一種鏈路狀態型路由協議。
在RIP和OSPF中利用IP的網路地址部分進行著路由控制,然而BGP則需要放眼整個互聯網進行路由控制。BGP的最終路由控製表有網路地址和下一站的路由器組來表示,不過它會根據所要經過的AS個數進行路由控制。有了AS編號的域,就相當於有了自己一個獨立的「國家」。AS的代表可以決定AS內部的網路運營和相關政策。與其他AS相連的時候,可以像一位「外交官」一樣簽署合約再進行連接。正是有了這些不同地區的AS通過簽約的相互連接,才有了今天全球范圍內的互聯網。
轉發IP數據包的過程中除了使用路由技術外,還在使用標記交換技術。最有代表性的就是多協議標記交換技術(MPLS)。
MPLS的標記不像MAC地址直接對應到硬體設備。因此,MPLS不需要具備以外網或ATM等數據鏈路層協議的作用,而只需要關注它與下面一層IP層之間的功能和協議即可。
MPLS優點:
1.轉發速度快
2.利用標記生成虛擬路徑,並在它的上面實現IP等數據包的通信。