CloudFabric云數(shù)據(jù)中心網(wǎng)解決方案-組播設(shè)計(jì)指南_第1頁(yè)
CloudFabric云數(shù)據(jù)中心網(wǎng)解決方案-組播設(shè)計(jì)指南_第2頁(yè)
CloudFabric云數(shù)據(jù)中心網(wǎng)解決方案-組播設(shè)計(jì)指南_第3頁(yè)
CloudFabric云數(shù)據(jù)中心網(wǎng)解決方案-組播設(shè)計(jì)指南_第4頁(yè)
CloudFabric云數(shù)據(jù)中心網(wǎng)解決方案-組播設(shè)計(jì)指南_第5頁(yè)
已閱讀5頁(yè),還剩52頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

CloudFabric云數(shù)據(jù)中心網(wǎng)解決方案

設(shè)計(jì)指南(組播)

目錄

1概述.........................................................................1

2CloudFabricOverlay組播應(yīng)用場(chǎng)景............................................3

3Overlay組播方案關(guān)鍵技術(shù)....................................................5

3.1IGMP簡(jiǎn)述.................................................................................6

3.2PIM簡(jiǎn)述..................................................................................9

3.3NGMVPNForIPv4...........................................................................................................................................................13

3.4MSDPForIPv4...................................................................................................................................................................17

4IPv4Overlay組播方案選擇...................................................19

4.1頭端復(fù)制or組播復(fù)制......................................................................19

4.2跨越公網(wǎng)方式和不跨越公網(wǎng)方式.............................................................21

4.3PIMSMorPIMSSM.........................................................................................................................................................22

5CloudFabricIPv4Overlay組播場(chǎng)景設(shè)計(jì).......................................23

5.1組播源和組播成員均在Fabric內(nèi)部...........................................................24

5.2組播源在Fabric外部,組播成員在Fabric內(nèi)部.................................................28

5.3組播源在Fabric內(nèi)部,組播成員在Fabric外部.................................................32

5.4IPv4UnderlayRP可靠性設(shè)計(jì)................................................................35

5.5IPv4OverlayRP可靠性設(shè)計(jì).................................................................36

5.6MSDP可靠性設(shè)計(jì).........................................................................37

5.7組播成員/組播源接入可靠性設(shè)計(jì)............................................................40

6Underlay組播和Overlay組播對(duì)比............................................49

7參考圖片....................................................................55

1概述

IP網(wǎng)絡(luò)提供無(wú)連接服務(wù),按照“盡力而為”和“廣而告之”的原則轉(zhuǎn)發(fā)1P報(bào)文,不保

證傳輸時(shí)延、正確性和可靠性。在IP網(wǎng)絡(luò)中,有兩種沿用至今的轉(zhuǎn)發(fā)行為:

?單播轉(zhuǎn)發(fā):某主機(jī)與網(wǎng)絡(luò)中某個(gè)目的主機(jī)進(jìn)行“一對(duì)一”通信。

?廣播轉(zhuǎn)發(fā):某主機(jī)與網(wǎng)絡(luò)中其他所有主機(jī)進(jìn)行“一對(duì)所有”通信。

單播轉(zhuǎn)發(fā)和廣播轉(zhuǎn)發(fā)均可實(shí)現(xiàn)某主機(jī)與網(wǎng)絡(luò)中部分主機(jī)進(jìn)行“一對(duì)多”通信的訴求,

但是無(wú)論采用何種方式,都存在一些缺陷:

?單播轉(zhuǎn)發(fā):?jiǎn)尾?bào)文需復(fù)制多份后依次轉(zhuǎn)發(fā)到多個(gè)目的主機(jī),重復(fù)復(fù)制方式效率

低下,且多次傳輸導(dǎo)致帶寬浪費(fèi)。

?廣播轉(zhuǎn)發(fā):廣播報(bào)文會(huì)到網(wǎng)絡(luò)中所有主機(jī),網(wǎng)絡(luò)不需要此信息的主機(jī)也會(huì)收到IP

報(bào)文,導(dǎo)致帶寬浪費(fèi)和報(bào)文內(nèi)容泄露。

隨著“一對(duì)多”通信的業(yè)務(wù)訴求增多,無(wú)論單播還是廣播都不能很好的滿(mǎn)足業(yè)務(wù)訴

求,于是組播技術(shù)應(yīng)運(yùn)而生。組播是指將數(shù)據(jù)報(bào)文轉(zhuǎn)發(fā)到一組特定的接收者,在“一

對(duì)多”場(chǎng)景相比單播和廣播,組播可以有效地節(jié)約網(wǎng)絡(luò)帶寬和提高網(wǎng)絡(luò)交互實(shí)時(shí)性。

組播目前被廣泛應(yīng)用在在線(xiàn)直播、IPTV、遠(yuǎn)程教育、網(wǎng)絡(luò)電臺(tái)、遠(yuǎn)程會(huì)議等場(chǎng)景。隨

著數(shù)據(jù)中心虛擬化和VxLAN等技術(shù)的廣泛應(yīng)用,業(yè)務(wù)流量逐漸從Underlay層面上升

到Overlay層面,相關(guān)網(wǎng)絡(luò)技術(shù)也開(kāi)始適配Overlay,比如DHCP、ARP代理、PBR、

動(dòng)態(tài)路由等。組播也不例外,同樣希望Overlay層面可以維護(hù)組播表項(xiàng)和轉(zhuǎn)發(fā)組播流

量。

本文檔將著重講解IPv4Overlay組播,而非傳統(tǒng)組播技術(shù),但閱讀本文檔需要對(duì)傳統(tǒng)

組播和CloudFabric方案有一定的了解,本文檔范圍包括Overlay組播原理、模型、應(yīng)

用場(chǎng)景以及轉(zhuǎn)發(fā)邏輯。

為了方便閱讀和理解,下面介紹相關(guān)術(shù)語(yǔ):

1.NGMVPN:是IP組播數(shù)據(jù)穿越BGP/MPLSVPN網(wǎng)絡(luò)的新一代框架,復(fù)用BGP

的信令傳遞模式,使得組播和單播業(yè)務(wù)統(tǒng)一在同一個(gè)VRN架構(gòu)中。

2.MSDP:是基于多個(gè)PIM-SM域互聯(lián)而開(kāi)發(fā)的一種域間組播解決方案,當(dāng)前僅支

持IPv4。

3.PIM:可以構(gòu)建組播分發(fā)樹(shù),用來(lái)指導(dǎo)網(wǎng)絡(luò)中組播數(shù)據(jù)的轉(zhuǎn)發(fā),本協(xié)議可實(shí)現(xiàn)按

需創(chuàng)建組播路由、動(dòng)態(tài)感應(yīng)網(wǎng)絡(luò)拓?fù)渥兓?、按照路由表?xiàng)執(zhí)行轉(zhuǎn)發(fā)等功能。

4.P1M-SM:是一種ASM模型,適合大型網(wǎng)絡(luò)中組播接收者相對(duì)稀疏,廣泛分布的

場(chǎng)景。

5.PIM-SSM:是一種SSM模型,適合組播成員預(yù)先知道組播源位置,直接向指定的

組播源請(qǐng)求組播數(shù)據(jù)的場(chǎng)景。

6.IGMP:可以實(shí)現(xiàn)主機(jī)動(dòng)態(tài)加入/離開(kāi)組播組,以及組播路由器對(duì)本地網(wǎng)絡(luò)組成員

的管理。

7.RP:在PIM-SM模式中作為組播源和組播成員的匯聚點(diǎn)。

8.CE:華為數(shù)據(jù)中心CloudEngine系列交換機(jī)。

CloudFabricOverlay組播應(yīng)用場(chǎng)景

組播業(yè)務(wù)場(chǎng)景可以從運(yùn)營(yíng)商和互聯(lián)網(wǎng)企業(yè)兩個(gè)方面闡述,運(yùn)營(yíng)商負(fù)責(zé)搭建公網(wǎng),主要

負(fù)責(zé)連接各個(gè)公司、政企、機(jī)構(gòu)、家庭用戶(hù)等等,而互聯(lián)網(wǎng)企業(yè)主要是利用運(yùn)營(yíng)商建

立的網(wǎng)絡(luò),為千千萬(wàn)萬(wàn)個(gè)家庭或機(jī)構(gòu)提供應(yīng)用服務(wù)。以網(wǎng)絡(luò)直播舉例,觀(guān)眾可能來(lái)自

世界各地,涉及多個(gè)國(guó)家不同運(yùn)營(yíng)商,如果此場(chǎng)景通過(guò)組播方式傳輸,則需要傳輸設(shè)

備支持組播協(xié)議和維持不同運(yùn)營(yíng)商的組播表項(xiàng),組播分發(fā)樹(shù)建立難度十分巨大,所以

直播行業(yè)還是通過(guò)CDN的方式。組播業(yè)務(wù)目前還需應(yīng)用在專(zhuān)網(wǎng)中,使得組播分發(fā)樹(shù)可

控,如IPTV、金融交易和證券行情。

?IPTV業(yè)務(wù)主要通過(guò)機(jī)頂盒傳輸,機(jī)頂盒不同于個(gè)人PC,不易被黑客或病毒入

侵,使得點(diǎn)播業(yè)務(wù)安全可靠。IPTV是基于DVBOverIP的技術(shù),將從衛(wèi)星接收的

信號(hào)或從企業(yè)獲取資源,經(jīng)過(guò)視頻壓縮處理和IP流化,通過(guò)運(yùn)營(yíng)商專(zhuān)網(wǎng)傳輸?shù)接?/p>

戶(hù),所以市面上不同運(yùn)營(yíng)商提供的IPTV內(nèi)容略有不同。

?金融和證券交易領(lǐng)域,市場(chǎng)行情瞬息萬(wàn)變,贏(yíng)利點(diǎn)轉(zhuǎn)瞬即逝,所以此類(lèi)行業(yè)對(duì)網(wǎng)

絡(luò)要求更多的體現(xiàn)在時(shí)延。目前國(guó)際大部分交易所普遍采用組播網(wǎng)絡(luò),既降低了

帶寬的時(shí)延,又提高了傳輸效率。并且采用PIM-SSM模型建立組播網(wǎng)絡(luò),不僅部

署和運(yùn)維簡(jiǎn)單,還可以通過(guò)指定組播源進(jìn)一步提高組播業(yè)務(wù)安全性。

隨著EVPN-VxLAN廣泛應(yīng)用,用戶(hù)逐漸習(xí)慣業(yè)務(wù)在Overlay層,承載在Underlay層,

如果組播不支持Overlay,則需要用戶(hù)對(duì)現(xiàn)有業(yè)務(wù)系統(tǒng)進(jìn)行夫量改造。CloudFabric

Overlay組播解決方案將SDN控制器、EVPN-VxLAN、組播等技術(shù)有機(jī)地結(jié)合在一

起,將組播和單播業(yè)務(wù)都統(tǒng)一在同一套VPN架構(gòu)中?不同VPC之間組播業(yè)務(wù)互相隔

離,且同一個(gè)VPC的單播和組播業(yè)務(wù)也不會(huì)互相干擾。而EVPN-VxLAN、M-LAG、

Overaly組播等技術(shù)配置復(fù)雜,通過(guò)SDN架構(gòu),可以有效降低配置難度,且提高配置

準(zhǔn)確率,避免出現(xiàn)人工配置失誤。

圖2-1Overlay組播與Underlay示意圖

在CloudFabric解決方案中,Overlay組播僅支持單Fabric場(chǎng)景和Multi-Pod場(chǎng)景,且

Multi-Pod場(chǎng)景南北向組播業(yè)務(wù)僅支持集中出口場(chǎng)景,Multi-Pod主備出口場(chǎng)景和Multi-

Site場(chǎng)景均不支持。

Overlay組播方案關(guān)鍵技術(shù)

Overlay組播涉及關(guān)鍵技術(shù)有PIM、IGMP、MVPN、MSDP,應(yīng)用位置如下圖所示。

圖3-1Overlay組播關(guān)鍵技術(shù)應(yīng)用位置一覽

Soureel

?I

WAN

PIM

MSDP

MVPN

3.1IGMP簡(jiǎn)述

3.2PIM簡(jiǎn)述

3.3NGMVPNForIPv4

3.4MSDPForIPv4

3.1IGMP簡(jiǎn)述

IGMP是負(fù)責(zé)IPv4組播成員管理的協(xié)議,組播路由器通過(guò)與組播組成員交互IGMP報(bào)

文實(shí)現(xiàn)組成員管理。IGMP協(xié)議發(fā)展至今,IGMP共有三個(gè)版本:IGMPvl、IGMPv2和

IGMPv3。IGMPvl中定義了基本的組成員查詢(xún)和報(bào)告過(guò)程;IGMPv2在IGMPvl的基

礎(chǔ)上增加了查詢(xún)器選舉、組成員報(bào)告抑制、組成員離開(kāi)的機(jī)制;IGMPv3在IGMPv2的

基礎(chǔ)上增加了接收或不接收指定組播源的機(jī)制。IGMP在歷代版本發(fā)展中,始終保持向

前兼容。

IGMPvl、IGMPv2、IGMPv3的對(duì)比參見(jiàn)下表。

功能IGMPvlIGMPv2IGMPv3

查詢(xún)器選舉方式支持支持支持

普遍組查詢(xún)方式支持支持支持

成員報(bào)告方式支持支持支持

特定組查詢(xún)報(bào)文不支持支持支持

成員離開(kāi)報(bào)文不支持支持支持

特定源組查詢(xún)報(bào)文不支持不支持支持

指定組播源不支持不支持支持

ASM模型支持支持支持

SSM模型配合IGMPSSM配合IGMPSSM支持

MappingMapping

IGMPvl

如下圖所示,IGMPvl協(xié)議支持普遍組查詢(xún)報(bào)文和組播組報(bào)告報(bào)文,主機(jī)離開(kāi)組播組時(shí)

不會(huì)主動(dòng)發(fā)送離開(kāi)報(bào)文,只能待組成員定時(shí)器超時(shí)后組播路由器刪除組播成員表項(xiàng)。

圖3-2IGMPvl示意圖

IGMP互詢(xún)器

(Group!)(Group2)(Group3)

—>組報(bào)告報(bào)文

普通組查詢(xún)

IGMPv2

如下圖所示,相比IGMPvl,IGMPv2增加了三個(gè)功能:

I.除了普遍組查詢(xún),還支持特定組查詢(xún):查詢(xún)器支持發(fā)送特定組IGMP查詢(xún)報(bào)文,

用于查詢(xún)特定組播組是否存在成員。

2.組報(bào)告報(bào)文抑制:某主機(jī)收到其他主機(jī)發(fā)送的IGMP報(bào)告報(bào)文,該主機(jī)不會(huì)向組

播路由器發(fā)送該組播組的IGMP報(bào)告報(bào)文。

3.增加成員離開(kāi)功能:主機(jī)退出某組播組,該主機(jī)會(huì)主動(dòng)發(fā)送一個(gè)該組播組的IGMP

離開(kāi)報(bào)文,由于IGMPv2存在組報(bào)告報(bào)文抑制機(jī)制,所以當(dāng)組播路由器收到IGMP

離開(kāi)報(bào)文,會(huì)主動(dòng)發(fā)起IGMP特定組查詢(xún)報(bào)文。

圖3-3IGMPv2示意圖

IGMP查詢(xún)器

----->組查詢(xún)報(bào)文

IGMP離開(kāi)報(bào)文

HostAHostB--------?IGM噬告報(bào)文

IGMPv3

如下圖所示,相比IGMPv2,IGMPv3做了兩個(gè)改變:

1.IGMPv3取消IGMPv2報(bào)告報(bào)文抑制功能,所有主機(jī)收到普遍組查詢(xún)報(bào)文時(shí),均會(huì)

響應(yīng)IGMP加入報(bào)文。

2.支持IGMPv3協(xié)議的主機(jī),發(fā)送IGMPv3Join報(bào)文時(shí),可以為組播組指定組播

源。

圖3-4IGMPv3示意圖

Source!Source2

IGMPSSMMapping

通過(guò)在組播路由器配置靜態(tài)SSM地址的映射,將IGMPvl和IGMPv2報(bào)告報(bào)文中(*,G)

表項(xiàng)轉(zhuǎn)化為對(duì)應(yīng)的(S,G)表項(xiàng),從而實(shí)現(xiàn)SSM功能。并非所有組播組地址都可以靜態(tài)映

射,需要遵從以下原則:

I.若組播組地址為224.0.1.0~231.255.255.255和233.0.0.0-238.255.255.255為ASM組

播組地址,IGMPSSMMapping不對(duì)此類(lèi)IGMP報(bào)告報(bào)文服務(wù)。

2.若組播組地址為232.0.0.0~232.255.255.255,1GMPSSMMapping按照規(guī)則將(*,G)

表項(xiàng)轉(zhuǎn)化為對(duì)應(yīng)的(S,G)表項(xiàng)。

圖3-5IGMPSSMMapping示意圖

SoureelSource2

G1映射到S1

3.2PIM簡(jiǎn)述

組播數(shù)據(jù)在網(wǎng)絡(luò)中轉(zhuǎn)發(fā),需要依賴(lài)中間設(shè)備實(shí)現(xiàn)組播報(bào)文的復(fù)制和轉(zhuǎn)發(fā),若沒(méi)有特定

組播協(xié)議支持,中間設(shè)備會(huì)按照廣播行為處理組播報(bào)文。通過(guò)PIM協(xié)議可以構(gòu)建組播

流量的分發(fā)樹(shù),從而指導(dǎo)組播流量的轉(zhuǎn)發(fā)。PIM協(xié)議是目前最廣泛的域內(nèi)組播協(xié)議,

得益于PIM組播路由協(xié)議不依賴(lài)其他路由協(xié)議,PIM組播路由協(xié)議可以利用單播路由

信息指導(dǎo)組播數(shù)據(jù)轉(zhuǎn)發(fā)。PIM目前實(shí)現(xiàn)方式有PIM-SM(ASM模型)、P1M-SM(SSM

模型)兩種。

PIM-SM(ASM模型)

PIM-SM(ASM模型),適用網(wǎng)絡(luò)中組成員相對(duì)稀疏,分布廣泛的大型網(wǎng)絡(luò)。網(wǎng)絡(luò)中需

要指定一臺(tái)PIM路由器作為RP,用于匯聚組播源和組播成員信息。若組播成員上線(xiàn),

則建立一顆以RP為根的RPT。ASM模型中機(jī)制包括如下內(nèi)容。

?PIM鄰居發(fā)現(xiàn)

只有當(dāng)PIM鄰居建立完畢,彼此之間才可以接收其他PIM協(xié)議報(bào)文和創(chuàng)建PIM

組播路由表項(xiàng),PIM鄰居共同決定組播分發(fā)樹(shù),如果PIM鄰居出現(xiàn)故障,則會(huì)觸

發(fā)組播分發(fā)樹(shù)遷移、組播路由收斂等負(fù)面行為。

*DR競(jìng)選

如果多個(gè)PIM路由器連接到同一個(gè)網(wǎng)段,則這些PIM優(yōu)先級(jí)需要對(duì)比DR優(yōu)先級(jí)

或IP地址,由選舉出的DR角色負(fù)責(zé)組播源和組播成員的組播報(bào)文分發(fā),DR主

要作用如下:

a.多個(gè)PIM路由器與組播源互聯(lián),由DR負(fù)責(zé)向RP發(fā)送Register報(bào)文,此時(shí)該

DR被稱(chēng)為源端DR。

b.多個(gè)PIM路由器與組播成員互聯(lián),由DR負(fù)責(zé)向RP發(fā)送Join報(bào)文,此時(shí)該

DR被稱(chēng)為組成員DR。

?靜態(tài)RP、組播成員RPT構(gòu)建和組播源注冊(cè)

P1MSM模型需要RP角色,負(fù)責(zé)收集組播源和組播成員信息,在P1M域內(nèi)所有

PIM路由器都需要指定某個(gè)PIM路由器扮演RP角色。每個(gè)組播組只能對(duì)應(yīng)一個(gè)

RP。CloudFarbicOverlay組播方案當(dāng)前僅支持靜態(tài)RP。靜態(tài)RP主要存在以下兩

個(gè)場(chǎng)景,如下圖所示:

a.組成員DR收到IGMPJoin報(bào)文時(shí),組成員DR主動(dòng)向PIM域內(nèi)RP角色發(fā)送

Join報(bào)文,通向RP的路徑上PIM路由器逐跳創(chuàng)建(*,G)表項(xiàng),生成一顆以RP

為根的分發(fā)樹(shù)。

b.源端DR收到組播流量時(shí),源端DR將組播報(bào)文封裝到PIMRegister報(bào)文中,

主動(dòng)向PIM域內(nèi)RP角色發(fā)送PIMRegister報(bào)文。

圖3-6靜態(tài)RP、組播成員RPT構(gòu)建和組播源注冊(cè)示意圖

Source1

-------?PIMJoin報(bào)文HostA

--------*IGMPJoin報(bào)文

?SPT切換

在PIM域內(nèi),一個(gè)組播組只能對(duì)應(yīng)一個(gè)RP,也就意味著一個(gè)組播組只能對(duì)應(yīng)一棵

RPT,同時(shí)該RP對(duì)應(yīng)的組播路由器也可以作為其他組播組的RP,隨著組播業(yè)務(wù)

發(fā)展,組播表項(xiàng)與組播流量不斷增加,導(dǎo)致RP角色負(fù)擔(dān)過(guò)重,為了解決此問(wèn)題,

提出SPT切換機(jī)制,可以從兩方面實(shí)現(xiàn)SPT切換:

a.RP節(jié)點(diǎn)觸發(fā)SPT切換

當(dāng)RP收到源端DR發(fā)送的PIMRegister報(bào)文,RP會(huì)將PIMRegister報(bào)文封

裝的組播報(bào)文沿RPT轉(zhuǎn)發(fā)給組播成員,同時(shí),RP會(huì)向源端DR逐跳發(fā)送PIM

Join報(bào)文,路徑上所有PIM路由器都會(huì)創(chuàng)建(S,G)表項(xiàng),生成一顆從源端DR

至ijRP的SPT,

b.組成員DR觸發(fā)SPT切換

組成員DR會(huì)周期性檢測(cè)組播報(bào)文的轉(zhuǎn)發(fā)速率,當(dāng)轉(zhuǎn)發(fā)速率超過(guò)一定閾值

后,則觸發(fā)SPT切換。組成員DR逐跳向源端DR發(fā)送PIMJoin報(bào)文,沿途

每個(gè)PIM路由器都會(huì)創(chuàng)建(S,G)表項(xiàng),生成一顆從組成員DR到源端DR的

SPT;與此同時(shí),組成員DR會(huì)向RP逐跳發(fā)送剪枝報(bào)文,刪除(*,G)表項(xiàng)以及

對(duì)應(yīng)的下游接口,若RP不經(jīng)過(guò)新生成的SPT,則RP需要繼續(xù)向源端DR發(fā)

送剪枝報(bào)文,刪除(*,G)表項(xiàng)以及對(duì)應(yīng)的下游接口,使得流量沿SPT轉(zhuǎn)發(fā)。

圖3-7組成員DR觸發(fā)SPT切換示意圖

Source!RP

*IGMPJoin報(bào)文

*PIMPrune報(bào)文

?剪枝

剪枝報(bào)文主要作用阻止上游PIM路由器發(fā)送不需要的組播報(bào)文,通常有兩種場(chǎng)

景:

a.PIM路由器收到組播報(bào)文且沒(méi)有組播下游出口時(shí),PIM路由器會(huì)向上游發(fā)送

剪枝報(bào)文,通知上游PIM路由將收到剪枝報(bào)文的接口從(S,G)表項(xiàng)對(duì)應(yīng)的下游

接口列表刪除(PIM-DM)o

b.SPT切換時(shí),組成員DR主動(dòng)向RP發(fā)送剪枝報(bào)文,若RP不在SPT路徑上,

則RP繼續(xù)向源端DR發(fā)送剪枝報(bào)文(PIM-SM)。

?斷言

當(dāng)多個(gè)PIM路由器都向某網(wǎng)段轉(zhuǎn)發(fā)組播報(bào)文時(shí),需要通過(guò)斷言機(jī)制保證僅有一個(gè)

PIM路由器轉(zhuǎn)發(fā)組播報(bào)文。

圖3-8斷言機(jī)制示意圖

---------*PIMAsser報(bào)文1HostA

*PIMAsser報(bào)文2

PIM-SM(SSM模型)

PIM-SM(SSM模型)如下圖所示,適用網(wǎng)絡(luò)中組成員預(yù)先知道組播源的位置,PIM

域中無(wú)需維護(hù)RP角色,自然PIM域中也無(wú)需構(gòu)建RPT,組播成員與組播源之間建立

SPT。SSM模型機(jī)制包括:

?鄰居發(fā)現(xiàn),與ASM模型機(jī)制相同。

?DR競(jìng)選,與ASM模型機(jī)制相同。

?SPT構(gòu)建,組成員DR直接與組播源建立SPT,用于組播流量分發(fā)。

圖3-9PIM-SM(SSM模型)示意圖

Soureel

------>PIMJoin報(bào)文2HostA

3.3NGMVPNForIPv4

NGMVPN可以實(shí)現(xiàn)IP組播流量穿越Underlay網(wǎng)絡(luò),使得私網(wǎng)組播流量可以借助公網(wǎng)

組播隧道從組播源轉(zhuǎn)發(fā)至組播組成員,且組播和單播業(yè)務(wù)都可以統(tǒng)一在同一個(gè)VPN架

構(gòu)中。CloudFabric解決方案中CE交換機(jī)僅引入NGMVPN部分工作機(jī)制,使得組播

路由信息可以在VxLAN網(wǎng)絡(luò)中傳遞。NGMVPN路由類(lèi)型包括:

類(lèi)型名稱(chēng)作用

1類(lèi)路由Intra-ASI-PMSIA-D用于同一MVPN域成員自動(dòng)發(fā)現(xiàn)

route

5類(lèi)路由SourceActiveA-D將CE發(fā)現(xiàn)的新組播源信息,通知給其他MVPN

route鄰居

6類(lèi)路由ShareTreeJoinroute當(dāng)成員DR收到(C-*,C-G)表項(xiàng),即組播成員IGMP

Report點(diǎn)播組播組時(shí),用于替代PIM(C-*,C-G)力口

入,向源端DR發(fā)送

注:非SSM模型時(shí),此時(shí)源端DR為RP

7類(lèi)路由SourceTreeJoin當(dāng)成員DR收到(C-SC-G)表項(xiàng),即組播成員

routeIGMPReport點(diǎn)播特定組播源組播組時(shí),用于替代

PIM(C-S,C-G)加入,向源端DR發(fā)送

NGMVPN協(xié)議在VxLAN網(wǎng)絡(luò)中模型如下圖所示。

圖3-10CloudFabric解決方案中的NGMVPN網(wǎng)絡(luò)模型

VxLANNetworkLeaf2

Host2-----------?IGMPReport

NGMVPN主要機(jī)制如下:

?MVPN成員自動(dòng)發(fā)現(xiàn)(涉及NGMVPN1類(lèi)路由)

MVPN成員自動(dòng)發(fā)現(xiàn)機(jī)制借助BGP實(shí)現(xiàn),為此BGP專(zhuān)門(mén)為MVPN定義了BGP-

MVPN地址族,不同Leaf之間可自動(dòng)協(xié)商建立BGP-MVPN地址族下的BGP

MVPN鄰居關(guān)系。同一MVPN的各個(gè)Leaf之間將MVPN消息封裝到BGP信令

中,在BGP鄰居之間傳遞。于是,每個(gè)Leaf設(shè)備都可以發(fā)現(xiàn)屬于同一MVPN的

其他Leaf節(jié)點(diǎn)。

?I-PMSI隧道建立

Leaf設(shè)備需要將收到的組播數(shù)據(jù)根據(jù)組播路由表項(xiàng)轉(zhuǎn)發(fā)到同一MVPN的其他Leaf

設(shè)備,如圖3-10所示,Spine等同于公網(wǎng)PE角色,Leaf之間轉(zhuǎn)發(fā)私網(wǎng)組播流量需

要穿越公網(wǎng)PE。通常做法是Leaf設(shè)備之間建立轉(zhuǎn)發(fā)隧道,用于承載私網(wǎng)組播流

量,而Leaf之間穿越公網(wǎng)建立的隧道就是PMSI隧道。在CloudFabricOverlay組

播方案中,僅支持I-PMSI隧道,即屬于同一MVPN的所有Leaf之間建立的隧

道,且I-PMSI隧道僅支持VxLAN類(lèi)型,通過(guò)VxLAN報(bào)文VNI字段實(shí)現(xiàn)私網(wǎng)問(wèn)

組播流量隔離。

?組播路由傳遞(涉及NGMVPN5、6、7類(lèi)路由)

a.PIMSM模型,(*,G)不跨越公網(wǎng)方式

圖3-11PIMSM模型,(*,G)不跨越公網(wǎng)方式過(guò)程示意圖

___Leaf2

SourceLeafl、、、RPHostl

Spine卜?組播成員加入

?生成組插表項(xiàng)

G發(fā)送組播數(shù)據(jù)A

0生成組插表項(xiàng)

—O^MVPN5類(lèi)路由3

將組播表項(xiàng)轉(zhuǎn)化為

MVPN7類(lèi)路由

卜?傳遞MVPN7類(lèi)路由

處理MVPN7類(lèi)路由

3將I-PMSI隧道添加到下游出口

III

--------公網(wǎng)

<-------->MVPN鄰居

-------?組播數(shù)據(jù)

-----------?IGMPreport

背景:Leafl和Leaf2建立MVPN鄰居,組播成員先上線(xiàn),Leaf2作為RP角

色。

i.組播成員先上線(xiàn),發(fā)送IGMPReport報(bào)文到Leaf2。

ii.Leaf2生成(*,G)組播表項(xiàng),由于Leaf2本身是RP角色,不會(huì)向上游發(fā)送

PIMJoin報(bào)文,Hostl與Leaf2建立RPT完畢。

iii.組播源發(fā)送組播數(shù)據(jù)到Leafl。

iv.Leafl生成(S,G)組播表項(xiàng),并生成MVPN5類(lèi)路由(SourceActiveA-D

route)o

V,Leafl向所有同一MVPN域的鄰居,發(fā)送MVPN5類(lèi)路由。

vi.Leaf2收到MVPN5類(lèi)路由,生成(S,G)組播表項(xiàng),并繼承己有(*,G)組播

表項(xiàng)的出接口。同時(shí)Leaf2發(fā)起SPT切換,生成MVPN7類(lèi)路由(Source

TreeJoinroute)o

vii.Leaf2將MVPN7類(lèi)路由通過(guò)BGP信令傳遞到Leafl,>

viii.Leafl處理MVPN7類(lèi)路由,將I-PMSI隧道作為(S,G)的下游出接口,最

終組播數(shù)據(jù)通過(guò)SPT分發(fā)到Leaf2。

b.PIMSM模型,(*,G)跨越公網(wǎng)方式

圖3-12PIMSM模型,(*,G)跨越公網(wǎng)方式過(guò)程示意圖

Spine

Leaf3

SourceLeaflLeaf2Host1

卜9組播成員加入

Wf生成組播表項(xiàng)

U生成MVPN6類(lèi)路由

傳遞MVPN

?°6類(lèi)路由

?生成組播(3G)表項(xiàng)

一0發(fā)送組播數(shù)據(jù)

傳遞MVPN

5類(lèi)路由

-遞MVPN5類(lèi)路由

生成組插表項(xiàng)

3生成MVPN7類(lèi)路由

。傳遞MVPN7類(lèi)路由--------

Q處理MVPN7類(lèi)路由

"將I-PMSI隧道添加到下游出口4GSPT切換

.’9發(fā)送(5,G)翦枝

■發(fā)送(S,G)翦枝

---------公網(wǎng)

?-------->MVPN鄰居

-------->組播數(shù)據(jù)

------------*-IGMPreport

背景:Leafl、Leaf2和Leaf?建立MVPN鄰居,組播成員先上線(xiàn),Leaf3作為

RP角色。

i.組播成員上線(xiàn),向Leaf2發(fā)送IGMPReport報(bào)文。

ii.Leaf2生成(*,G)組播表項(xiàng),下游接口為接收到IGMPReport報(bào)文的接口,

同時(shí)構(gòu)造MVPN6類(lèi)路由。

iii.Leaf2將構(gòu)造的MVPN6類(lèi)路由通過(guò)BGP信令傳遞給RP角色Leaf3。

iv.Leaf3作為RP角色,收到MVPN6類(lèi)路由,生成(*,G)組播表項(xiàng),下游接

口為L(zhǎng)eaf3與Leaf2的I-PMSI隧道,至此RPT建立完畢。

v.組播源上線(xiàn),向Leaf1發(fā)送組播流量。

vi.Leaf1生成MVPN5類(lèi)路由,通過(guò)BGP信令傳遞給RP角色Leaf3。

Leaf3收到MVPN5類(lèi)路由,生成(S,G)組播表項(xiàng),并繼承之前(*,G)表項(xiàng)

的下游接口。此時(shí),組播流量會(huì)按照

Source->Leafl->Leaf3->Leaf2->Hostl路徑轉(zhuǎn)發(fā)。

vii.Leafl將MVPN5類(lèi)路由,通過(guò)BGP信令傳遞給Leaf2。

viii.Leaf2收至ljMVPN5類(lèi)路由,生成(S,G)組播表項(xiàng),并繼承之前(*,G)表項(xiàng)

的下游接口。若沒(méi)有配置SPT切換流量閾值,則會(huì)直接觸發(fā)SPT切換,

上游接口為L(zhǎng)eafl與Leaf2的I-PMSI隧道,同時(shí)Leaf2構(gòu)造MVPN7類(lèi)

路由。

ix.Leaf2將MVPN7類(lèi)路由,通過(guò)BGP信令傳遞給Leafl?

x.Leafl處理MVPN7類(lèi)路由,將Leafl與Leaf2之間的I-PMS1隧道添加

到下游出口,組播流量會(huì)通過(guò)該隧道轉(zhuǎn)發(fā)到Leaf2o

xi.Leaf2向Leaf3發(fā)送PIM剪枝報(bào)文,Leaf3將與Leaf2之間的I-PMSI隧道

從(S,G)表項(xiàng)下游接口中刪除。

xii.若Leaf2(S,G)表項(xiàng)下游接口為空,則Leaf3繼續(xù)向上游Leafl發(fā)送PIM

剪枝報(bào)文。

PIMSSM模型

圖3-13PIMSSM模型示意圖

SourceLeafl//SpineLeaf2Host1

6

?記錄SAEC和VRIEC

G收到點(diǎn)播信息

i

但構(gòu)造7類(lèi)路由C-Multicast

<@傳遞7類(lèi)路由

轉(zhuǎn)換7K路由,---------公網(wǎng)

生成組播表項(xiàng)<-------->MVPN鄰居

-------->組播數(shù)據(jù)

------------?IGMPreport

背景:Leafl和Leaf?建立MVPN鄰居,組播源先上線(xiàn)。

i.組播源先上線(xiàn),Leafl發(fā)布EVPNType2路由到Leaf2,同時(shí)攜帶Source

ASExtendedCommunity和VRFRouteImportExtendedCommunity信息。

ii.Leaf2記錄SourceASExtendedCommunity和VRFRouteImportExtended

Community信息。

iii.Host1發(fā)送IGMPReport報(bào)文,Leaf2收到(S,G)點(diǎn)播。

iv.Leaf2將IGMPReport特定組點(diǎn)播報(bào)文,轉(zhuǎn)化為PIMJoin,結(jié)合Source

ASExtendedCommunity和VRFRouteImportExtendedCommunity信息,

將PIMSSMJoin報(bào)文轉(zhuǎn)化為MVPN7類(lèi)路由(SourceTreeJoinroute)。

v.Leaf2將MVPN7類(lèi)路由通過(guò)BGP信令傳遞到Leafl。

vi.Leafl將MVPN7類(lèi)路由轉(zhuǎn)化為PIMSSMJoin報(bào)文,生成組播表項(xiàng),下

游接口為I-PMSI隧道(VxLAN隧道)。

3.4MSDPForIPv4

在P1M-SM模型中,源端DR和組成員DR都會(huì)向RP角色注冊(cè)組播信息,所以RP角

色通??芍揚(yáng)IM-SM域所有組播源和組播成員的信息。隨著該P(yáng)IM-SM域組播業(yè)務(wù)

規(guī)模增大,為了緩解RP壓力和方便管理,網(wǎng)絡(luò)管理員可能會(huì)將一個(gè)PIM-SM域按照業(yè)

務(wù)劃分成多個(gè)PIM-SM域。此時(shí)每個(gè)PIM-SM域的RP角色彼此獨(dú)立,RP角色無(wú)法獲

取除了本PIM-SM域以外的組播源信息。借助MSDP協(xié)議可以解決此場(chǎng)景問(wèn)題,用于

接收其他PIM-SM域的組播源信息。不同PIM-SM域的RP角色之間建立MSDP對(duì)等

體,對(duì)等體之間通過(guò)交互SA(Source-Active)消息、,共享組播源信息。

為了保證所有PIM-SM域所有RP角色都能參與組播源信息交換,推薦僅在PIM-SM

域的RP角色之間配置MSDP對(duì)等體,MSDP協(xié)議主要機(jī)制如下。

?對(duì)等體建立

a.RP1和PR2分別使能MSDP,RP之間建立MSDPPeer關(guān)系;

b.兩個(gè)RP之間對(duì)比地址,地址小的RP角色主動(dòng)發(fā)起TCP連接,地址大的RP

角色監(jiān)聽(tīng)TCP639端口;

c.建立TCP連接時(shí),可以設(shè)置加密認(rèn)證,支持MD5和Keychain兩種加密方

式,當(dāng)前CloudFabric僅支持編排MD5加密認(rèn)證;

d.TCP會(huì)話(huà)建立成功后,peer之間持續(xù)發(fā)送keepalive,保活TCP會(huì)話(huà)。

圖3-14MSDP對(duì)等體建立

?RPF檢查

當(dāng)網(wǎng)絡(luò)中存在多個(gè)MSDP對(duì)等體時(shí),SA消息可能在對(duì)等體之間環(huán)路,所以引入

RPF機(jī)制,在MSDP對(duì)等體接收SA消息時(shí)進(jìn)行RPF檢查。檢查規(guī)則:MSDP設(shè)

備收到SA消息后,根據(jù)MRIB確定到源RP地址(SA消息中攜帶了RP地址)

最佳路徑的對(duì)等體,該對(duì)等體也被稱(chēng)為“RPF對(duì)等體”,如果確定SA消息時(shí)RPF

對(duì)等體發(fā)出的,則接收該SA消息,并向其他對(duì)等體轉(zhuǎn)發(fā)。

?域間組播源信息傳遞

a.Sourcel發(fā)送組播數(shù)據(jù)包時(shí),源端DR將組播數(shù)據(jù)封裝在PIM注冊(cè)報(bào)文中,傳

遞給RP1;

b.RP1創(chuàng)建SA信息,包含組播源的地址S,組播組的地址G和創(chuàng)建該SA信息

的RP1地址,傳遞給對(duì)等體RP2;

c.RP2接收到SA信息后,執(zhí)行RPF檢查后,RP2創(chuàng)建(S,G)組播表項(xiàng);

d.Hostl向組成員DR發(fā)送1GMPReport報(bào)文,組成員DR向RP2逐跳發(fā)送PIM

Join,生成組播表項(xiàng)(*,G):

e.RP2向組播源Sourcel逐跳發(fā)送(S,G)PIMJoin報(bào)文,至此Sourcel與Hostl

之間組播分發(fā)樹(shù)建立完畢。

圖3-15域間組播源信息傳遞

IPv4Overlay組播方案選擇

4.1頭端復(fù)制or組播復(fù)制

4.2跨越公網(wǎng)方式和不跨越公網(wǎng)方式

4.3PIMSMorPIMSSM

4.1頭端復(fù)制or組播復(fù)制

頭端復(fù)制

頭端復(fù)制是指,當(dāng)BUM報(bào)文進(jìn)入VXLAN隧道時(shí),接入端VTEP根據(jù)頭端復(fù)制列表對(duì)

報(bào)文進(jìn)行VXLAN封裝,并將報(bào)文發(fā)送給頭端復(fù)制列表中的所有VTEP。如果網(wǎng)絡(luò)中

BUM流量過(guò)多,會(huì)增加頭端VTEP設(shè)備網(wǎng)絡(luò)負(fù)載和浪費(fèi)中間設(shè)備轉(zhuǎn)發(fā)帶寬。

圖4-1VXLAN頭端復(fù)制不意圖

詳細(xì)轉(zhuǎn)發(fā)流程:

1.VTEP1收到BUM報(bào)文,查找VNI對(duì)應(yīng)的頭端復(fù)制列表,將報(bào)文復(fù)制兩份,封裝

VxLAN報(bào)文,外層目的IP地址分別為VTEP2-NVE地址和VTEP3-NVE地址。

2.VTEP2/VTEP3從公網(wǎng)收到數(shù)據(jù)報(bào)文,發(fā)現(xiàn)外層IP為自身NVE接口地址,對(duì)

VxLAN數(shù)據(jù)報(bào)文解封裝,通過(guò)VxLAN報(bào)文頭找到VNL通過(guò)VNI找至l」BD,通

過(guò)BD找到對(duì)應(yīng)出接口,將原始BUM報(bào)文從出接口廣播。

組播復(fù)制

為了避免頭端復(fù)制的弊端,引入了組播復(fù)制。同一個(gè)VNI的所有VTEP都加入同一個(gè)

組播組,公網(wǎng)利用組播路由協(xié)議為組播組建立組播分發(fā)樹(shù)。當(dāng)VTEP1接收到BUM報(bào)

文時(shí),為該BUM報(bào)文封裝VxLAN報(bào)文,且外層目的IP報(bào)文為組播組地址,封裝后

的報(bào)文會(huì)根據(jù)組播路由表項(xiàng)轉(zhuǎn)發(fā)到遠(yuǎn)端VTEP。從而減少頭端報(bào)文復(fù)制次數(shù)和節(jié)省中間

設(shè)備轉(zhuǎn)發(fā)帶寬。

圖4-2VXLAN組播復(fù)制示意圖

詳細(xì)轉(zhuǎn)發(fā)流程:

1.VTEPI收到BUM報(bào)文,查找VN1對(duì)應(yīng)的組播組地址,通過(guò)組播組地址和NVE

源地址查找轉(zhuǎn)發(fā)表,將原始BUM報(bào)文增加VxLAN封裝,外層目的IP地址為組

播復(fù)制組播組地址。

2.Spine公網(wǎng)收到數(shù)據(jù)報(bào)文,匹配組播轉(zhuǎn)發(fā)表,組播下游出接口為Spine與

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論