數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書_第1頁
數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書_第2頁
數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書_第3頁
數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書_第4頁
數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書1.前言 52.數(shù)字基礎(chǔ)設(shè)施技術(shù)發(fā)展的需求和挑戰(zhàn) 72.1.未來業(yè)務(wù)發(fā)展對于數(shù)字基礎(chǔ)設(shè)施技術(shù)的需求和約束 72.2.傳統(tǒng)的技術(shù)發(fā)展路徑面臨的挑戰(zhàn) 102.3.未來技術(shù)發(fā)展路徑概述 133.更寬的連接 143.1.綜述 143.2.物理層(無線):5G-A&6G需要更大力度的空分復(fù)用及擴(kuò)展頻段 163.3.物理層(光傳輸):單波提速、波段擴(kuò)展和空分復(fù)用 203.4.分組層:兼顧容量和靈活性的分組轉(zhuǎn)發(fā)芯片架構(gòu) 223.5.應(yīng)用層:基于深度學(xué)習(xí)視頻編碼進(jìn)一步提升視頻壓縮效率 233.6.設(shè)備互聯(lián):光互聯(lián)將逐步滲透到設(shè)備間及設(shè)備內(nèi)互聯(lián) 254.更強(qiáng)的算力 284.1.綜述 284.2.芯片架構(gòu):DSA&3D堆疊&Chiplet 294.3.計算架構(gòu):存算一體使得計算和存儲從分離走向聯(lián)合優(yōu)化 314.4.計算架構(gòu):基于對等系統(tǒng)的分布式計算架構(gòu) 334.5.網(wǎng)絡(luò)架構(gòu):支撐算網(wǎng)融合的IP網(wǎng)絡(luò)技術(shù)實現(xiàn)算力資源高效調(diào)度 345.更高的智能 375.1.綜述 375.2.智能芯片:提高算力/能耗比的技術(shù)方向 385.3.智能算法:多樣化分離小模型向通用大模型演進(jìn) 405.4.智能網(wǎng)絡(luò):網(wǎng)絡(luò)自智向L4/L5等級邁進(jìn) 426.結(jié)語 457.參考文獻(xiàn) 471.前言技術(shù)創(chuàng)新是生產(chǎn)力進(jìn)步、產(chǎn)業(yè)發(fā)展的核心驅(qū)動力。世界經(jīng)濟(jì)論壇創(chuàng)始人克勞斯·施瓦布 (KlausSchwab)在其所著的“第四次工業(yè)革命”中指出,近代以來,人類經(jīng)歷了四次由技術(shù)創(chuàng)新引領(lǐng)的工業(yè)革命。第一次起始于1760年左右,以蒸氣機(jī)、鐵路的發(fā)明和廣泛應(yīng)用為主要標(biāo)志,使人類從手工工藝時期躍進(jìn)到機(jī)械化生產(chǎn)階段;第二次始于19世紀(jì)末,以電的發(fā)明和廣泛應(yīng)用為標(biāo)志,電力工業(yè)、化學(xué)工業(yè)以及電報、電話等的迅速發(fā)展,使人類進(jìn)入大規(guī)模工業(yè)化生產(chǎn)時代;第三次工業(yè)革命始于20世紀(jì)中期,以通信技術(shù)、計算機(jī)技術(shù)、互聯(lián)網(wǎng)技術(shù)(簡稱信息通信技術(shù),或ICT技術(shù))為主要標(biāo)志,人類進(jìn)入自動化生產(chǎn)階段;第四次工業(yè)革命目前正在發(fā)生,是第三次工業(yè)革命的延續(xù),但技術(shù)創(chuàng)新的速度、廣度和影響力以指數(shù)級別上升。第四次工業(yè)革命以數(shù)字化和智能化為主要特征,標(biāo)志性技術(shù)有物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等,尤其是以深度學(xué)習(xí)為代表的人工智能技術(shù)的突破,使人類逐漸從數(shù)字社會邁向智能社會。高效的數(shù)字基礎(chǔ)設(shè)施是數(shù)字社會、智能社會的關(guān)鍵支撐。面向2030,產(chǎn)業(yè)互聯(lián)、全息通信、元宇宙、自動駕駛等新型應(yīng)用對信息通信技術(shù)提出了更高的需求。但應(yīng)該看到,信息通信技術(shù)的發(fā)展是以19世紀(jì)末到20世紀(jì)中葉人類在電磁學(xué)、量子力學(xué)、信息論等數(shù)學(xué)、物理學(xué)的突破為基礎(chǔ)的,而近幾十年來,基礎(chǔ)科學(xué)的突破有放緩的跡象,這使得信息通信領(lǐng)域的未來技術(shù)發(fā)展面臨越來越嚴(yán)峻的挑戰(zhàn)。傳統(tǒng)的技術(shù)演進(jìn)路線面臨摩爾定律、香農(nóng)定理的限制以及節(jié)能減排的約束,亟需在基礎(chǔ)理論、核心算法和系統(tǒng)架構(gòu)方面有根本性的創(chuàng)新。國際形勢的風(fēng)云變幻,也對技術(shù)自主創(chuàng)新提出了很高的要求。本白皮書是對數(shù)字基礎(chǔ)設(shè)施的未來技術(shù)發(fā)展趨勢的解讀,由中興通訊技術(shù)專家委員會集體編寫完成。與業(yè)界常見的以商業(yè)模式、應(yīng)用愿景、技術(shù)需求為主的白皮書不同,本技術(shù)白皮書更多地把重點(diǎn)放在技術(shù)發(fā)展面臨的挑戰(zhàn),以及解決這些挑戰(zhàn)的技術(shù)實現(xiàn)路徑上。白皮書第二章介紹了未來的業(yè)務(wù)場景對于數(shù)字基礎(chǔ)技術(shù)的需求,提出了數(shù)字基礎(chǔ)設(shè)施最關(guān)鍵的三個技術(shù)要素是連接、算力和智能。但是這三個技術(shù)要素的發(fā)展,面臨著香農(nóng)定理極限、摩爾定律放緩和智能本質(zhì)認(rèn)知不足的問題,使得未來的技術(shù)進(jìn)步面臨很大的挑戰(zhàn)。第三~五章分別針對更寬的連接、更強(qiáng)的算力、更高的智能三個方向進(jìn)行了具體技術(shù)趨數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書勢的描述。每個技術(shù)方向均描述了未來的技術(shù)需求和面臨的技術(shù)挑戰(zhàn),以及解決問題和挑戰(zhàn)的技術(shù)發(fā)展路徑。既有對業(yè)界發(fā)展現(xiàn)狀和主流觀點(diǎn)的描述,也有中興通訊的技術(shù)創(chuàng)新和對未來發(fā)展的預(yù)判。第六章是整個白皮書的總結(jié),同時也針對數(shù)字基礎(chǔ)設(shè)施能力如何更好服務(wù)于各行各業(yè)提出了我們的一些思考。中興通訊的技術(shù)創(chuàng)新瞄準(zhǔn)技術(shù)發(fā)展趨勢、行業(yè)發(fā)展方向和國家重大需求,依托于政、產(chǎn)、學(xué)、研、用各方的協(xié)同與支持,目前已經(jīng)取得了豐碩的成果。我們將繼續(xù)與產(chǎn)業(yè)伙伴一起,共同推動信息通信領(lǐng)域的技術(shù)創(chuàng)新工作,為人類邁向數(shù)字社會和智能社會作出貢獻(xiàn)。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書2.數(shù)字基礎(chǔ)設(shè)施技術(shù)發(fā)展的需求和挑戰(zhàn)2.1.未來業(yè)務(wù)發(fā)展對于數(shù)字基礎(chǔ)設(shè)施技術(shù)的需求和約束自從1837年美國人摩爾斯發(fā)明摩爾斯電碼和電報以來,信息通信技術(shù)迅速發(fā)展,極大地改變了人類生活、生產(chǎn)的方式。通信業(yè)務(wù)從最初單一的電報、電話到現(xiàn)在涉及人類經(jīng)濟(jì)、社會、生活的方方面面。全球數(shù)字經(jīng)濟(jì)規(guī)模持續(xù)上漲。2021年,全球主要的47個國家數(shù)字經(jīng)濟(jì)增加值規(guī)模為38.1萬億美元,同比名義增長15.6%,占GDP比重為45.0%[01]。2022年,我國數(shù)字經(jīng)濟(jì)規(guī)模達(dá)到50.2萬億元,同比名義增長10.3%,已連續(xù)11年顯著高于同期GDP名義增速[02]。九層之臺,起于累土。高效的數(shù)字基礎(chǔ)設(shè)施是數(shù)字經(jīng)濟(jì)的核心基礎(chǔ)能力。在ToC和ToH領(lǐng)域,新冠疫情帶來的工作和生活方式的變化、短視頻及直播等應(yīng)用的爆發(fā)、在線教育和遠(yuǎn)程辦公的普及,對于網(wǎng)絡(luò)帶寬和覆蓋提出了更高的要求;在ToB領(lǐng)域,從ICT向OT(生產(chǎn)域)的縱深拓展和貫通融合,也對網(wǎng)絡(luò)性能、經(jīng)濟(jì)便捷和安全可靠等提出更高的期望。2023年2月,中共中央、國務(wù)院印發(fā)了《數(shù)字中國建設(shè)整體布局規(guī)劃》[03](以下簡稱《規(guī)劃》)?!兑?guī)劃》明確指出,數(shù)字中國建設(shè)按照“2522”的整體框架進(jìn)行布局,即夯實數(shù)字基礎(chǔ)設(shè)施和數(shù)據(jù)資源體系“兩大基礎(chǔ)”,推進(jìn)數(shù)字技術(shù)與經(jīng)濟(jì)、政治、文化、社會、生態(tài)文明建設(shè)“五位一體”深度融合,強(qiáng)化數(shù)字技術(shù)創(chuàng)新體系和數(shù)字安全屏障“兩大能力”,優(yōu)化數(shù)字化發(fā)展國內(nèi)國際“兩個環(huán)境”?!兑?guī)劃》指出,打通數(shù)字基礎(chǔ)設(shè)施大動脈,有如下具體要求:加快5G網(wǎng)絡(luò)與千兆光網(wǎng)協(xié)同建設(shè),深入推進(jìn)IPv6規(guī)模部署和應(yīng)用,推進(jìn)移動物聯(lián)網(wǎng)全面發(fā)展,大力推進(jìn)北斗規(guī)模應(yīng)用;系統(tǒng)優(yōu)化算力基礎(chǔ)設(shè)施布局,促進(jìn)東西部算力高效互補(bǔ)和協(xié)同聯(lián)動,引導(dǎo)通用數(shù)據(jù)中心、超算中心、智能計算中心、邊緣數(shù)據(jù)中心等合理梯次布局;整體提升應(yīng)用基礎(chǔ)設(shè)施水平,加強(qiáng)傳統(tǒng)基礎(chǔ)設(shè)施數(shù)字化、智能化改造。根據(jù)《規(guī)劃》的要求和中興通訊對于行業(yè)的理解,數(shù)字基礎(chǔ)設(shè)施有三個基本要素:連接、算力、智能。數(shù)字基礎(chǔ)設(shè)施的目標(biāo)就是,網(wǎng)絡(luò)無所不達(dá)、算力無所不在、智能無所不及。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書“連接”是互聯(lián)網(wǎng)最核心的特征,連接速率從最初電報的每秒約1個字符,到現(xiàn)在的“雙千兆”接入(即無線接入和光纖接入均達(dá)到千兆)和骨干網(wǎng)單光纖幾十Tbps的速率。無線通信網(wǎng)絡(luò)基本每十年進(jìn)行一次更新迭代,速率提升約10倍。面向2030(6G),隨著全息通信、元宇宙等新業(yè)務(wù)的發(fā)展,預(yù)計業(yè)務(wù)對于連接的需求相比目前(5G)仍將增長1~2個數(shù)量級[04]。其中,帶寬峰值速率將達(dá)到1Tbit/s(50倍),用戶體驗速率達(dá)20Gbit/s(200倍),時延可低至0.5ms(8倍),連接密度達(dá)到100個/m2(100倍)?!八懔Α痹跀?shù)字社會已成為像水電煤一樣的基本設(shè)施。據(jù)IDC&浪潮信息&清華全球產(chǎn)高1個點(diǎn),數(shù)字經(jīng)濟(jì)和GDP將分別增長3.5‰和1.8‰[05];據(jù)中國信通院統(tǒng)計,2021年全球計算設(shè)備算力總規(guī)模達(dá)到615EFlops,預(yù)計2030年達(dá)到56ZFlops,平均年增速達(dá)到65%[06]。算力是實現(xiàn)其他技術(shù)需求的關(guān)鍵要素。比如通信容量的提升需要有各種編解碼計算;視頻領(lǐng)域的AR/VR、全息等業(yè)務(wù),需要視頻編解碼、圖像渲染、動畫生成等高計算量的技術(shù);近十多年來廣泛應(yīng)用的人工智能技術(shù)對于算力的需求是前所未有的。隨著近十多年深度神經(jīng)網(wǎng)絡(luò)算法的突破,人工智能技術(shù)不斷拓展應(yīng)用的深度和廣度,已經(jīng)成為人類社會從數(shù)字化向智能化邁進(jìn)的強(qiáng)大引擎。數(shù)字化的前提是用數(shù)學(xué)模型表示物理世界,數(shù)學(xué)建模是算法和軟件的基礎(chǔ)。而AI技術(shù)突破之前,現(xiàn)實世界有大量的復(fù)雜系統(tǒng)無法用數(shù)學(xué)模型表示。深度神經(jīng)網(wǎng)絡(luò)技術(shù)的本質(zhì),是用簡單神經(jīng)元節(jié)點(diǎn)的大規(guī)?;ヂ?lián)來逼近各類復(fù)雜系統(tǒng)的數(shù)學(xué)模型(比如人類認(rèn)知系統(tǒng)或者高度非線性的物理系統(tǒng)),極大拓展了數(shù)字化的應(yīng)用廣度和深度。從物理層鏈路的非線性補(bǔ)償,到網(wǎng)絡(luò)層資源的智能化調(diào)度,再到應(yīng)用層的視頻處理、人機(jī)交互、安全態(tài)勢感知、自動駕駛等等。智能成為最為關(guān)鍵的數(shù)字化基礎(chǔ)技術(shù)之一。由此可見,連接、算力、智能是未來數(shù)字化應(yīng)用的基本技術(shù)需求。未來數(shù)字社會的根基是融合的算網(wǎng)基礎(chǔ)設(shè)施及智能化服務(wù)體系。在數(shù)據(jù)洪流對端、邊、云的沖擊之下,連接、算力、智能這三者相輔相成,體現(xiàn)出更加緊密的關(guān)系和更加模糊的邊界,以實現(xiàn)海量數(shù)據(jù)的存儲、交換和處理的全局效益最優(yōu)。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書連接、算力、智能也是實現(xiàn)其他技術(shù)需求的關(guān)鍵要素。比如,安全技術(shù)需求,最基本的技術(shù)就是各種加密解密算法和計算部件;可靠性需求的技術(shù)基礎(chǔ)是器件、組件、系統(tǒng)的失效期計算,以及各種系統(tǒng)冗余、網(wǎng)絡(luò)冗余的算法。目前5G的URLLC場景已經(jīng)可以提供4個9 (99.99%)的可用性,未來要滿足工業(yè)場景5個9(99.999%)的可用性需求,可能的辦法是引入AI算法實現(xiàn)信道預(yù)測、故障預(yù)測、干擾跟蹤等技術(shù)手段。圖2.1給出了未來各種應(yīng)用場景與三大技術(shù)要素的對應(yīng)關(guān)系。這些場景取自于國際電信聯(lián)盟(ITU)網(wǎng)絡(luò)2030焦點(diǎn)組于2020年6月提出的未來網(wǎng)絡(luò)12個應(yīng)用場景[07][08]。圖2.1:未來業(yè)務(wù)場景與三大技術(shù)要素的對應(yīng)關(guān)系與此同時,人類可持續(xù)發(fā)展的目標(biāo)對于節(jié)能環(huán)保提出了越來越高的要求。各個國家都提出了雙碳目標(biāo)(碳達(dá)峰、碳中和)。盡管信息高效交互和處理可以提升物流和能量流的效率,從而降低整個人類活動的碳排放水平。例如GeSI(GlobalEnablingSustainabilityInitiative)發(fā)布的報告《SMARTer2030》指出,ICT技術(shù)有可能在2030年前幫助全球減少碳排放20%[09]。但信息通信行業(yè)自身的碳排放仍然是不可忽視的一個方面。據(jù)上述GeSI報告的估算,預(yù)計到2030年信息通信產(chǎn)業(yè)的碳排放占全球總碳排的1.97%。未來的技術(shù)發(fā)展,數(shù)字基礎(chǔ)設(shè)施的建設(shè),除了業(yè)務(wù)驅(qū)動外,還必須把節(jié)能減排作為一個主要的約束條件。另一個重要的約束條件是國際政治形勢對于全球技術(shù)融通和共享的影響。未來的技術(shù)供應(yīng)鏈、全球的技術(shù)協(xié)作都很可能面臨越來越多的困難。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書2.2.傳統(tǒng)的技術(shù)發(fā)展路徑面臨的挑戰(zhàn)從19世紀(jì)后期到20世紀(jì)中葉,人類在電磁學(xué)、量子力學(xué)、信息論等數(shù)理理論的突破,是現(xiàn)代信息通信技術(shù)的基礎(chǔ)。信息通信技術(shù)三大要素,連接、算力、智能,既有各自的發(fā)展路徑,又呈現(xiàn)相互支撐、協(xié)同并進(jìn)的態(tài)勢。香農(nóng)信息論從理論上證明了,帶寬恒定的信道在有噪聲情況下存在傳輸容量上界,即香農(nóng)極限。通信帶寬的提升,一方面是研發(fā)更優(yōu)的傳輸信道(無線、電纜、光纖等),另一方面是用不斷演進(jìn)的算法(調(diào)制解調(diào)、整形補(bǔ)償、前向糾錯等)逼近香農(nóng)極限。先進(jìn)的算法帶來了計算復(fù)雜度的增加,必須依賴微電子技術(shù)的進(jìn)步,以更強(qiáng)的數(shù)字信號處理能力滿足通信算法的需求。計算機(jī)出現(xiàn)之后,對算力的需求成為微電子技術(shù)進(jìn)步的最大驅(qū)動力。著名的摩爾定律最初就是對微處理器發(fā)展的預(yù)測,即,每隔18或24個月,單位面積的芯片上所集成的晶體管數(shù)量翻一番,微處理器性能提升一倍,價格減半。按摩爾定律發(fā)展的微處理器在過去50年來性能提升了10億倍以上,其帶來的半導(dǎo)體工藝技術(shù)的進(jìn)步也同時帶動了其他芯片的發(fā)展,包括用于通信的數(shù)字信號處理器(DSP)、網(wǎng)絡(luò)處理器、交換芯片等。芯片技術(shù)的進(jìn)步使得更加復(fù)雜的通信算法得以實現(xiàn)。人工智能算法對于算力的需求前所未有,除了研發(fā)性能越來越強(qiáng)大的AI算力芯片之外,分布式計算也是解決大算力需求的必由之路。分布式AI計算對于連接帶寬、時延提出了很高的要求,連接技術(shù)的進(jìn)步使得跨地域的云-邊高效協(xié)同的分布式AI計算成為可能。反過來,連接帶寬的提升也需要人工智能技術(shù)的支撐。目前AI算法已經(jīng)在網(wǎng)絡(luò)物理層優(yōu)化、無損網(wǎng)絡(luò)參數(shù)優(yōu)化、神經(jīng)網(wǎng)絡(luò)視頻編碼等各層面發(fā)揮作用。由此看出,連接、算力、智能這三大技術(shù)要素,每個要素的發(fā)展都依賴其他要素的支撐,反之,任一個技術(shù)方向的受阻,都會影響其他技術(shù)方向的演進(jìn)。目前看,這三個技術(shù)要素的未來發(fā)展路徑均面臨各自的困難。(一)通信算法已經(jīng)逼近香農(nóng)極限香農(nóng)定理,即C/W=log2(1+S/N),揭示了譜效(單位頻譜寬度能傳送的最大信息速率)與信噪比的關(guān)系。在通信實踐中,經(jīng)常根據(jù)信息速率(不含冗余信息)、通道寬度,來數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書確定最小信噪比容限。這個信噪比容限代表可實現(xiàn)無誤碼傳輸時所需信號質(zhì)量的極限值。早在2001年就有研究論文指出[10],目前無線通信中使用的LDPC編碼算法,在白噪聲信道中達(dá)到10-6誤碼率的信噪比容限,是0.31dB,而此場景下的香農(nóng)理論極限是0.18dB,兩者只差0.13dB,也就是實際信噪比容限比香農(nóng)限只多了3%(100.013≈1.03)。另外,據(jù)中興通訊實測數(shù)據(jù),目前光傳輸算法在4~16QAM調(diào)制達(dá)到的信噪比容限,距離香農(nóng)限約為1dB左右,只能等效提高25%的傳輸距離,或提高0.33bps/Hz的譜效。越接近極限,提升算法復(fù)雜度所帶來的性能收益越低,往往用數(shù)倍的計算量,才能帶來幾個百分點(diǎn)的性能提升。因此未來的算法即使能夠繼續(xù)逼近香農(nóng)極限,其對于算力效能的需求(單位功耗的算力)也大大超過了摩爾定律能達(dá)到的水平。(二)微電子技術(shù)逐漸逼近物理學(xué)設(shè)定的邊界代表微電子技術(shù)進(jìn)步的摩爾定律也逐漸遇到越來越大的困難。在28nm工藝之前,業(yè)界通過縮小晶體管尺寸(如柵長)來增加單位面積的晶體管數(shù)量。但晶體管尺寸小到一定程度就會因為量子隧穿效應(yīng)、寄生電容等問題而難以為繼(一個硅原子的直徑為0.2nm,20nm的柵極長度大約只有100個硅原子)。因此從22nm開始,主要靠晶體管結(jié)構(gòu)創(chuàng)新來增加單位面積的晶體管數(shù)量,從鰭式結(jié)構(gòu)FinFET(預(yù)計可以支撐到3nm)到全環(huán)結(jié)構(gòu)GAA(預(yù)計可再支撐2~3代)。但是復(fù)雜的結(jié)構(gòu)創(chuàng)新所需要的成本和功耗很高,因此繼續(xù)提升工藝節(jié)點(diǎn)的經(jīng)濟(jì)性越來越成為限制因素。目前看來,人類在微觀世界的基礎(chǔ)理論進(jìn)展(量子力學(xué))所帶來的技術(shù)紅利已經(jīng)接近用盡。從二十世紀(jì)五十年代開始,以量子力學(xué)為基礎(chǔ)的現(xiàn)代光學(xué)、電子學(xué)和凝聚態(tài)物理迅速發(fā)展,誕生了激光器、半導(dǎo)體和原子能等重大科技突破。但這次技術(shù)革命還只是從宏觀統(tǒng)計的角度認(rèn)識和利用量子現(xiàn)象,例如能級躍遷、受激輻射和鏈?zhǔn)椒磻?yīng),對于物理介質(zhì)的觀測和操控依然是宏觀的手段和方法,例如電流、電壓、光強(qiáng)等。微電子技術(shù)的物理學(xué)基礎(chǔ)是基于電荷數(shù)量的電平檢測,隨著電荷團(tuán)持續(xù)縮微,帶來了靜態(tài)泄漏電流增大等難以解決的問題。業(yè)內(nèi)在研究將“電荷團(tuán)遷移”改為“材料的阻變”、或“量子自旋”等新物理機(jī)制來降低功耗,但操控的仍然是宏觀物理量,仍將面臨尺寸縮微的極限。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書要全面展示量子態(tài)的特性,充分釋放量子的潛力,就必須通過對光子、電子和冷原子等微觀粒子系統(tǒng)及其量子態(tài)進(jìn)行精確的人工調(diào)控和觀測??茖W(xué)界在這方面的研究尚處于起步階段,未來的發(fā)展路線、方式、目標(biāo)都存在很大的不確定性。(三)智能的發(fā)展,缺少認(rèn)知科學(xué)理論的指導(dǎo)人工智能是對人類思維過程和智能行為的模擬。對人工智能的研究從計算機(jī)誕生不久的20世紀(jì)50年代就已經(jīng)開始,真正在應(yīng)用上取得突破是在2006年深度神經(jīng)網(wǎng)絡(luò)取得成功之后。但基于神經(jīng)網(wǎng)絡(luò)的人工智能算法是對人腦生理結(jié)構(gòu)的淺層模擬,對于其深層工作機(jī)理的研究屬于認(rèn)知科學(xué)的范疇,目前尚未取得突破。目前人工智能算法已經(jīng)在多個難以用數(shù)學(xué)模型描述的復(fù)雜問題域取得應(yīng)用,包括人類智能相關(guān)領(lǐng)域,和非人類智能相關(guān)領(lǐng)域。在人類智能相關(guān)領(lǐng)域,比如機(jī)器視覺、自然語言處理、自動駕駛等,雖然在某些場景下已經(jīng)非常逼近甚至超過人類的水平,但在通用性方面離人類智能仍然有差距。業(yè)界逐漸認(rèn)識到,人工智能算法要真正達(dá)到人類智能的水平,需要在認(rèn)知科學(xué)基礎(chǔ)理論有突破性的進(jìn)展。在非人類智能相關(guān)領(lǐng)域,比如通信物理層的神經(jīng)網(wǎng)絡(luò)建模和補(bǔ)償算法,雖然取得了一些學(xué)術(shù)研究成果,但由于缺少對其內(nèi)在物理機(jī)理的了解,使得業(yè)界對于這種模型的適應(yīng)性和可靠性存疑,阻礙了其真正在工程上的大規(guī)模應(yīng)用。目前的深度學(xué)習(xí)技術(shù)路線是靠算力和數(shù)據(jù)的大規(guī)模堆積來實現(xiàn)的,但在摩爾定律放緩,節(jié)能減排約束的背景下,這種技術(shù)路線從長期看是難以持續(xù)的。目前人工智能算法對算力需求增速遠(yuǎn)大于摩爾定律增速,特別是進(jìn)入Transformer大模型時代后,訓(xùn)練模型所需的算力增速提升到平均每兩年增長275倍,大幅超越摩爾定律每兩年增長2倍的增速[11]。這種增速背離帶來的直接結(jié)果,就是AI計算成本和對環(huán)境的壓力快速上升。目前,全世界1%的發(fā)電量被用于AI計算。全球AI計算能耗年增長率為37%。據(jù)此估算,下一個10年,AI計算將消耗全世界發(fā)電量的15%左右,將為環(huán)境帶來沉重的負(fù)擔(dān)??偟膩碚f,信息通信技術(shù)的發(fā)展已經(jīng)逼近數(shù)學(xué)(香農(nóng)定理)、物理(量子力學(xué))、認(rèn)知科學(xué)三大基礎(chǔ)理論所設(shè)定的邊界。往前每走一步都要付出比以往更大的代價。而節(jié)能降耗的要求、技術(shù)效用的邊際遞減又給技術(shù)演進(jìn)的經(jīng)濟(jì)可行性設(shè)置了更高的障礙。淺層的礦藏已經(jīng)挖完,深層的礦藏是否具有技術(shù)經(jīng)濟(jì)性尚屬疑問。這是目前的技術(shù)演進(jìn)路線面臨的主要問題。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書2.3.未來技術(shù)發(fā)展路徑概述上一節(jié)提到,連接、算力、智能這三大技術(shù)要素的演進(jìn)都碰到了瓶頸,技術(shù)提升所需要的成本、功耗與帶來的收益越來越不成比例。而未來業(yè)務(wù)需求對于帶寬、時延、算力的需求仍然是數(shù)量級的上升。如何突破技術(shù)瓶頸,打造“連接+計算+數(shù)智能力”的數(shù)字底座,是當(dāng)前面臨的重大課題。本白皮書第3章~第5章分別從“更寬的連接”、“更強(qiáng)的算力”、“更高的智能”三個方面描述未來技術(shù)發(fā)展的可能路徑。美國思想家布萊恩·阿瑟在《技術(shù)的本質(zhì)》一書中提出,技術(shù)的本質(zhì)是被捕獲并加以利用的現(xiàn)象的集合;技術(shù)的進(jìn)化類似于生物進(jìn)化,是一種組合進(jìn)化的過程,新技術(shù)是已有技術(shù)的新組合。我們認(rèn)為,未來的技術(shù)發(fā)展,除了繼續(xù)單點(diǎn)突破,挖掘現(xiàn)有技術(shù)路徑的潛力外,另一方面也將更多聚焦到多種技術(shù)的協(xié)同、系統(tǒng)架構(gòu)的優(yōu)化。信息通信系統(tǒng)的架構(gòu),不管是計算架構(gòu)還是網(wǎng)絡(luò)架構(gòu),都是以模塊化、分層、解耦為特征,比如馮·諾依曼計算架構(gòu)的特征是計算和存儲分離;網(wǎng)絡(luò)架構(gòu)采用協(xié)議分層和層間解耦的設(shè)計。分離和解耦的好處是各個模塊獨(dú)立發(fā)展,便于創(chuàng)新和維護(hù)。但模塊間簡單化、通用化的協(xié)作與接口,對于某些特定業(yè)務(wù)來說并不能達(dá)到性能最優(yōu)。在單個模塊的性能提升遇到瓶頸的時候,往往需要模塊間的協(xié)同和融合去帶來性能和功耗的收益。在后面章節(jié)描述的技術(shù)路徑中,既有現(xiàn)有技術(shù)路徑的挖潛,比如無線、有線通信中開發(fā)新的頻譜和信道;也有多種技術(shù)的協(xié)同和耦合,比如光電集成、存算一體、算網(wǎng)融合等等。表格2-1是對于連接、算力、智能三個方向的技術(shù)發(fā)展路徑的概述。表2-1未來技術(shù)發(fā)展路徑的概述單點(diǎn)縱深突破立體協(xié)同耦合更寬的連接提高頻譜效率繼續(xù)逼近香農(nóng)極限;擴(kuò)展頻譜帶寬;空分復(fù)用光電集成;分組轉(zhuǎn)發(fā)芯片架構(gòu)創(chuàng)新更強(qiáng)的算力MoreMoore:半導(dǎo)體工藝?yán)^續(xù)縮微路線算、存、網(wǎng)從分離到融合:存算一體、對等系統(tǒng)、算網(wǎng)融合更高的智能AI芯片架構(gòu)創(chuàng)新,實現(xiàn)更高算力/能耗比;AI算法從多樣化的分離小模型向通用大模型演進(jìn);智能化能力向數(shù)字基礎(chǔ)設(shè)施自身、行業(yè)、企業(yè)賦能;數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書3.更寬的連接萬物互聯(lián)是數(shù)字化時代的主要特征。提升連接帶寬是信息通信技術(shù)的主要追求目標(biāo)。目前,無線接入(5G)和有線接入(10GPON)已經(jīng)具備向用戶提供“雙千兆”接入帶寬的能力。骨干光纖網(wǎng)開始部署長途400G單波傳輸技術(shù)。如第二章所述,未來5~10年,業(yè)務(wù)對于帶寬的需求仍將有1~2個數(shù)量級的增長。網(wǎng)絡(luò)帶寬提升不僅是物理層傳輸帶寬的提升,還涉及分組層、應(yīng)用層等數(shù)據(jù)處理能力的提高。同時,機(jī)架及設(shè)備內(nèi)部互聯(lián)的帶寬也需要相應(yīng)提升。(一)物理層通信物理層以電磁波理論為基礎(chǔ),電磁場表達(dá)式如以下公式所示:根據(jù)電磁場表達(dá)式,通信可復(fù)用的維度有偏振、空間分布、幅度、相位、波長和符號周期(波特率),一般把幅度和相位合稱為QAM調(diào)制(QuadratureAmplitudeModulation,正交幅度調(diào)制),因此一共是5個維度。其中偏振、QAM、波特率與單波速率有關(guān)。因此總傳輸速率可以寫成:注:此公式是一個簡化表示,無線領(lǐng)域涉及多個空分通道的計算公式較復(fù)雜由公式可知,提升傳輸容量可通過提升單波速率、波段擴(kuò)展和空分復(fù)用,合計3個技術(shù)途徑。其中單波速率受限于香農(nóng)定理,提升單波速率一方面通過高階調(diào)制、偏振復(fù)用等技術(shù)提升譜效,逼近香農(nóng)限,另一方面通過提高波特率,從而提升單波帶寬;波段擴(kuò)展是指增加通信可用的頻段;空分復(fù)用通過多天線或者光纖的多個纖芯、模式,增加通道數(shù)量,實現(xiàn)容量數(shù)倍提升。表3-1是無線通信、光通信對于上述5個維度、3個技術(shù)途徑的發(fā)展現(xiàn)狀和未來技術(shù)路數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書徑的簡要總結(jié)。詳細(xì)的描述分別見第3.2節(jié)和3.3節(jié)。表3-1:無線通信、光通信的技術(shù)發(fā)展現(xiàn)狀和未來技術(shù)路徑三個技術(shù)途徑無線光傳輸(長距)幅度和相位(QAM)單波提速(單自由度提速)現(xiàn)狀:1024QAM已經(jīng)標(biāo)準(zhǔn)化,但還沒有商用;調(diào)制階數(shù)越高,距離香農(nóng)限距離越遠(yuǎn)趨勢:更高調(diào)制階數(shù),提高星座成形增益,編碼調(diào)制聯(lián)合優(yōu)化現(xiàn)狀:相干4~16QAM調(diào)制編碼已逼近香農(nóng)極限;波特率64~128GBd趨勢:繼續(xù)提升單波帶寬(波特率)、新型光纖/放大器與DSP均衡算法提升SNR(支持更偏振/極化波特率波長波段擴(kuò)展/頻譜使用效率提升現(xiàn)狀:已有200MHz載波聚合;子帶全雙工正在標(biāo)準(zhǔn)化趨勢:載波聚合,全雙工技術(shù)、毫米波/太赫茲、多址/復(fù)用現(xiàn)狀:C+L波段12THz譜寬支400G/800G空間空分復(fù)用現(xiàn)狀:業(yè)界公認(rèn)提升容量的最主要方法之一;64TR/16流已商用;NCR正在標(biāo)準(zhǔn)化趨勢:eMIMO/Beam、分布式RIS、NCR等未商用趨勢:多芯少模;多芯弱耦合或率先商用(二)分組層互聯(lián)網(wǎng)誕生以來,以IP、以太網(wǎng)為代表的分組技術(shù)就是網(wǎng)絡(luò)技術(shù)的核心。網(wǎng)絡(luò)設(shè)備的分組處理能力往往成為提升網(wǎng)絡(luò)容量和性能的瓶頸。分組處理需要兼顧容量和靈活性,其整體性能的提升,不僅依賴芯片工藝的進(jìn)步,也跟分組處理芯片架構(gòu)的改進(jìn)密切相關(guān)。隨著帶寬增長,分組芯片容量每2~3年增長一倍,僅靠工藝進(jìn)步難以滿足芯片容量、成本、功耗的要求,需要芯片架構(gòu)優(yōu)化和算法優(yōu)化,以兼顧容量、靈活性和低時延需求。本白皮書第3.4節(jié)描述了未來分組轉(zhuǎn)發(fā)芯片架構(gòu)的演進(jìn)方向。(三)應(yīng)用層數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書在應(yīng)用層提高信源壓縮率的努力也與通信容量緊密相關(guān)。香農(nóng)定理除了證明了信道編碼的上限,也證明了無損信源編碼的壓縮率上限(與信息熵有關(guān)),但對于有損的信源編碼,并沒有壓縮率的極限。隨著XR、全息等應(yīng)用的發(fā)展,到2030年,視頻流量預(yù)計將占到互聯(lián)網(wǎng)總流量的90%以上。因此如何通過視頻編碼技術(shù)進(jìn)一步提高壓縮率,是降低整個網(wǎng)絡(luò)帶寬壓力的重要研究方向。本白皮書第3.5節(jié)描述了基于深度學(xué)習(xí)的視頻編碼提升視頻壓縮率。率(四)設(shè)備互連隨著外部鏈路帶寬和端口密度的提升,通信和計算設(shè)備內(nèi)外部互連總線也將成為瓶頸。光互聯(lián)相對電互聯(lián)在性能和功耗的優(yōu)勢凸顯,隨著光電共封裝(CPO,Co-PackagedOptics)技術(shù)的日漸成熟,設(shè)備內(nèi)部也將出現(xiàn)“光進(jìn)銅退”,同時,光互連在空間距離上的損耗非常小,將推進(jìn)信息通信設(shè)備的形態(tài)向分布式和大容量的方向演進(jìn)。具體見3.6節(jié)。3.2.物理層(無線):5G-A&6G需要更大力度的空分復(fù)用及擴(kuò)展頻段自上世紀(jì)80年代以來,移動通信基本上以十年為周期出現(xiàn)新一代變革性技術(shù),從1G逐步發(fā)展至現(xiàn)在的5G,目前5G已經(jīng)在全球范圍內(nèi)開始大規(guī)模部署,各國更是已將6G列入未來幾年的國家計劃。如3.1節(jié)所述,無線提升通信容量的方法有:提升單個自由度的頻譜效率、增加帶寬或帶寬利用提效、增加空域復(fù)用階數(shù)等。4G采用高階調(diào)制提升編碼效率,引入MIMO多天線技術(shù)提高信道容量,引入載波聚合獲得更大的頻譜帶寬。5G為了實現(xiàn)更高網(wǎng)絡(luò)容量,主要采用兩種方法,其一是繼續(xù)增加天線數(shù)量,采用大規(guī)模天線陣列(Massive-MIMO)和超密集組網(wǎng)(UDN)。其二是拓展5G使用頻譜的范圍,如第二章所述,面對未來的業(yè)務(wù)需求,6G在幾個核心的指標(biāo),比如帶寬、時延、可靠數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書性等,相比5G都有1~2個數(shù)量級的提升。3GPP第一個6G版本預(yù)計會在2030年左右出現(xiàn),在這之前還有3到4個版本的演進(jìn)聚焦于5G增強(qiáng)技術(shù)“5G-Advanced”。從頻譜效率看,雖然5G技術(shù)低譜效到中等譜效下已逼近單鏈路的香農(nóng)限,但在高譜效區(qū)距離香農(nóng)限還有一定距離。另外,6G需要在增加帶寬或提升帶寬利用率、增加空域復(fù)用階數(shù)上更大力度地下功夫。包括載波聚合、全雙工、更高頻譜(Beyond6G和太赫茲)、非正交/OFDM及其變形/高頻波形/感知波形、超大規(guī)模天線和極致MIMO、RIS(智能超表面)技術(shù)、網(wǎng)絡(luò)控制Relay(NCR)等。在上述技術(shù)中包含基礎(chǔ)性的技術(shù)趨勢,即:用越來越強(qiáng)的計算能力,尤其是底層的計算能力,去換取資源利用效率的提升。下面針對幾項典型技術(shù)分別進(jìn)行闡述。(一)高階調(diào)制/星座整形/編碼調(diào)制聯(lián)合方案當(dāng)前調(diào)制方式可以到1024QAM,每個符號可以攜帶10比特。6G為了進(jìn)一步提升譜效,可能會將調(diào)制階數(shù)提升到4096QAM甚至更高。在高階調(diào)制方式下,傳統(tǒng)的方形QAM星座圖的效率不是最優(yōu)的,可能會導(dǎo)致譜效越高,距離香農(nóng)限越遠(yuǎn)的情況。基于幾何整形/概率整形的高階調(diào)制、編碼調(diào)制聯(lián)合方案有望更加逼近香農(nóng)限,尤其在高SNR區(qū)域。(二)提升頻譜使用效率:全雙工及子帶全雙工全雙工是提高網(wǎng)絡(luò)數(shù)據(jù)速率以及頻譜使用效率的新技術(shù)。對于未來大帶寬低時延的業(yè)務(wù),全雙工使用非成對頻譜,通過釋放DL/UL資源使用上互斥的限制,能夠增強(qiáng)頻譜使用效率和減少傳輸延時。但實現(xiàn)全雙工需要基站或終端能夠處理自干擾(SI)以支持同時進(jìn)行的收發(fā)信功能,實現(xiàn)復(fù)雜度以及硬件代價還是相當(dāng)大的,尤其是對于多天線MassiveMIMO機(jī)型。因此實際上多天線技術(shù)與全雙工有一定互斥性。目前的研究大多是從天線數(shù)較少的機(jī)型和子帶全雙工開始,即在帶內(nèi)不同頻率上分別配置上行和下行資源。這種方法能夠靈活地配置更多上行資源,有助于降低上下行時延、提升上行覆蓋和容量。雖然子帶全雙工降低了基站內(nèi)部干擾消除能力要求,但是UE間的互干擾還是很嚴(yán)重,需要業(yè)界共同努力。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書(三)擴(kuò)展更多頻譜:太赫茲技術(shù)作為6G潛在的基礎(chǔ)技術(shù),太赫茲是指100GHz~10THz的頻段資源,具有連續(xù)可用的大帶寬,將有助于構(gòu)建6G短距離、高速率的傳輸系統(tǒng),支持超高速率的數(shù)據(jù)傳輸,滿足超密集設(shè)備的連接需求,增強(qiáng)網(wǎng)絡(luò)連接的可靠性,并支撐高能效的終端網(wǎng)絡(luò)。但太赫茲的缺點(diǎn)也比較明顯。相比于毫米波,太赫茲頻率的提高使傳播路徑損耗明顯增大,室外通信在受到雨霧天氣影響時也會帶來額外損耗。此外,發(fā)射機(jī)功放功率低、低噪聲放大器噪聲系數(shù)高、高增益天線設(shè)計加工難度大等都極大地限制了太赫茲波的傳輸范圍。通過與多天線技術(shù)結(jié)合,太赫茲可借助極窄波束來克服路徑衰落問題和擴(kuò)展傳播距離。此外,將RIS(智能超表面,見第五條)應(yīng)用于太赫茲頻段是未來的技術(shù)發(fā)展趨勢。將RIS密集地分布在室內(nèi)和室外空間中會對太赫茲覆蓋空洞產(chǎn)生積極作用。(四)更大力度的空分復(fù)用:超大規(guī)模天線和分布式MIMO超大規(guī)模天線能有效增強(qiáng)上行容量和提高新頻段的覆蓋性能。一些新興的工業(yè)互聯(lián)網(wǎng)應(yīng)用,例如現(xiàn)代工廠中的機(jī)器視覺類應(yīng)用,對上行帶寬的要求遠(yuǎn)高于下行帶寬,極端情況下需要滿足Gbps或10Gbps數(shù)量級的吞吐量。解決方案之一是NR(5G空口)的上行支持更多的天線或MIMO層數(shù)、支持更多用戶的MU-MIMO,以及更靈活的載波分配和聚合等。5G-Advanced能支持最多24正交的解調(diào)參考信號DMRS (DeModulationReferenceSignal)端口,如果每個用戶支持單流上行傳輸,在共同的時頻資源可以支持最多24個用戶的上行傳輸;此外,5G-Advanced支持上行能力更強(qiáng)大的終端,單用戶可以支持到8流,能大大提高峰值速率,在密集網(wǎng)絡(luò)部署的情況下,有效提高上行吞吐量。新增頻段也對天線數(shù)目有要求。2023年世界無線電通信大會(WRC-23)將對6Ghz-10Ghz做分配,這些頻段具有波長短,傳播損耗大特點(diǎn)。為了提升這些頻段的覆蓋性能,系統(tǒng)設(shè)計時需要考慮增加天面,以增強(qiáng)天線增益,降低功耗和網(wǎng)絡(luò)成本。我們認(rèn)為由于芯片集成度提升,設(shè)備成本將快速下降,未來趨勢是通過利用更多數(shù)字通道,改善賦形或者讓接收波束更窄,以大幅提升無線性能。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書另一方面,更大力度的空分復(fù)用未來發(fā)展趨勢是分布式程度越來越高,等效孔徑越來越大。從包含少量接入點(diǎn)(AP)的MTP/eCoMP,發(fā)展成為更大規(guī)模的異質(zhì)分布式MIMO,進(jìn)而發(fā)展為超大AP規(guī)模的Cell-free網(wǎng)絡(luò)。大規(guī)模的分布式MIMO需要解決時頻同步、前傳帶寬和AP供電等問題。(五)提升信道覆蓋質(zhì)量:智能超表面技術(shù)RIS智能超表面(ReconfigurableIntelligentSurfaces,RIS)是一種無線環(huán)境優(yōu)化技術(shù),具有低成本、低能耗、高可靠、大容量的特點(diǎn)。RIS主要通過以下幾種方式提升小區(qū)邊緣用戶的覆蓋、吞吐量和能量效率:(1)在直射傳播路徑受阻時提供有效的反射傳播路徑,避免覆蓋空洞;(2)為目標(biāo)用戶進(jìn)行波束賦型,充分利用空間分集和復(fù)用增益;(3)對干擾用戶進(jìn)行零點(diǎn)波束賦型,實現(xiàn)小區(qū)間干擾抑制。RIS本質(zhì)上是一種分布式空分復(fù)用技術(shù),通過多天線技術(shù)更好地、更精細(xì)地利用空間電磁場特征,從而提升無線性能。相比之下,MassiveMIMO是一種集中式空分復(fù)用技術(shù);RIS由于成本低,容易做到更大規(guī)模,容易進(jìn)行多點(diǎn)部署。目前業(yè)界對RIS的優(yōu)點(diǎn)已認(rèn)識比較充分,對其所帶來的問題,尤其是規(guī)模組網(wǎng)時的部署和性能問題認(rèn)識得并不充分。最近隨著研究的深入,越來越多的問題被認(rèn)識,例如目前RIS器件調(diào)控精度低,導(dǎo)致RIS口徑效率低,存在柵瓣,會引起用戶間和網(wǎng)絡(luò)間的干擾;另外,目前還缺乏基站與RIS間的標(biāo)準(zhǔn)控制接口,仍以靜態(tài)/半靜態(tài)調(diào)控居多,只能改善固定用戶的覆蓋性能,后續(xù)需要實現(xiàn)基站與RIS動態(tài)協(xié)同技術(shù),以提升更廣域場景用戶的覆蓋性能和移動性能,等等。這些問題有的造成應(yīng)用上的限制,有的導(dǎo)致成本上升或性能下降,上述問題需要產(chǎn)業(yè)界和學(xué)界共同攻克,需要客觀估計RIS的適用場景和產(chǎn)業(yè)化進(jìn)程。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書3.3.物理層(光傳輸):單波提速、波段擴(kuò)展和空分復(fù)用高速、大容量和超長距是光傳輸?shù)淖钪匾枨?。隨著業(yè)務(wù)流量的增長,導(dǎo)致光傳輸系統(tǒng)單纖容量增長的壓力越來越大。同時,在干線應(yīng)用時,傳輸能力要求超過1000km以上。目前采用superC(超寬C波段)的200GPM-QPSK(偏振復(fù)用四相相移鍵控)系統(tǒng)已經(jīng)廣泛商用,400GPM-QPSK預(yù)計2023年開始商用。如3.1節(jié)所述,提升通信容量可通過提升單波速率、波段擴(kuò)展和空分復(fù)用3個技術(shù)途徑。單波提速同時降低單比特成本,是容量擴(kuò)展最直接/經(jīng)濟(jì)方式,而新波段擴(kuò)展(比如L波段與S波段)使得頻譜成倍提升,可適配單波帶寬與波道數(shù)的同步增長。隨單纖波段繼續(xù)擴(kuò)展的性能/成本優(yōu)勢降低,空分復(fù)用或成為單纖容量持續(xù)提升的可選路徑。接下來就單波提速、波段擴(kuò)展、空分復(fù)用就未來的演進(jìn)趨勢分別展開介紹:(一)單波提速根據(jù)香農(nóng)定理,單波提速的途徑一方面是譜效提升,另一方面是單波帶寬/波特率提升。譜效的提升意味著對接收信號處的SNR(信噪比)需求提升,而光路依托新型光纖(如G.654光纖、空芯光纖)降損耗/非線性,結(jié)合放大器降低噪聲系數(shù)可顯著提升信道SNR,支持單信道容量成倍提升;先進(jìn)相干DSP芯片采用高性能調(diào)制解調(diào)結(jié)合高編碼增益FEC(前向糾錯編碼),使得SNR容限繼續(xù)趨近理論值,傳輸速率逼近信道容量上限;單波帶寬提升方面,96GBd/128GBd,并將持續(xù)往180GBd+演進(jìn)。(二)波段擴(kuò)展隨單波帶寬提升與系統(tǒng)波道數(shù)要求,波段擴(kuò)展是提升單模光纖容量主流方向。本著單波提速不減波數(shù),容量翻倍的原則,長距模式100G、200G、400G分別應(yīng)用了C4T、C6T、結(jié)合S+C+L波段擴(kuò)展將成為下一步容量提升方向。同時還需要推動規(guī)范G.654E光纖的截數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書止波長到1460nm以下,以及規(guī)范U波段的宏彎損耗和E波段低水峰光纖規(guī)格。波段擴(kuò)展依賴新波段光器件的材料工藝發(fā)展,以支持更寬波長范圍。如放大器的Tm/Bi離子或基質(zhì)摻雜工藝、光模塊的128GBd以上TFLN(薄膜鈮酸鋰)相干調(diào)制器、ITLA(可調(diào)諧激光器)多波段外腔技術(shù)、WSS(光波長交換)器件多波段增透鍍膜設(shè)計等。表3-2光纖通信的波段擴(kuò)展年度201020172023★2026干線單波速率bps0G200G400G800G工作波段CSuperCSuperC+LU/S+C+L工作波段帶寬4THz6THz12THz24THz/18THz光纖G.652DG.652DG.654EG.654E干線單纖容量8Tbps16Tbps32Tbps64Tbps波特率32GBd64GBd128GBd256GBd/192GBd通道間隔50GHz75GHz150GHz300GHz/225GHz(三)空分復(fù)用通過空分復(fù)用技術(shù),即光纖芯數(shù)和傳輸模式的增加,可以實現(xiàn)單纖容量的大幅提升。從技術(shù)路線上可分為多芯弱耦、多芯強(qiáng)耦、少模弱耦、少模強(qiáng)耦。其中多芯弱耦合光纖/器件相對成熟,具備長距傳輸能力。受限光纖維護(hù)問題與多芯光放性能,多芯弱耦相比多纖芯光纜的陸纜商用價值或不顯著,但因多芯放大器的能耗與多芯光纜的尺寸/密度優(yōu)勢,更受海纜應(yīng)用關(guān)注。少模弱耦合光纖/器件能力具備,受限光纖與連接器的模式間串?dāng)_,傳輸距離不足,在DCI短距互聯(lián)或具有應(yīng)用潛力;多芯強(qiáng)耦合光纖/器件能力具備,主要受限于多路復(fù)用OTU(MiMoDSP與相干光器件集成),短期無法實用;少模強(qiáng)耦合器件能力具備,主要受限光纖耦合度低與多路復(fù)用OTU,尚不具備實用性。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書3.4.分組層:兼顧容量和靈活性的分組轉(zhuǎn)發(fā)芯片架構(gòu)在分組層(IP層和以太網(wǎng)層),對于帶寬影響最大的技術(shù),是分組轉(zhuǎn)發(fā)設(shè)備的處理能力,也就是通常說的吞吐量。分組芯片轉(zhuǎn)發(fā)能力是提升網(wǎng)絡(luò)帶寬的關(guān)鍵。目前,業(yè)界已經(jīng)發(fā)布51.2Tbps處理能力的芯片,按照2~3年芯片能力增長一倍的趨勢,預(yù)計2025~2026年,單芯片處理能力將達(dá)到102.4Tbps。2030年,單芯片最大處理能力將有可能達(dá)到204.8Tbps。同時,未來十年,傳統(tǒng)網(wǎng)絡(luò)向算網(wǎng)融合的新型數(shù)字基礎(chǔ)設(shè)施演進(jìn),分組芯片還需要提升業(yè)務(wù)靈活處理能力。一方面加強(qiáng)芯片可編程能力滿足新業(yè)務(wù)創(chuàng)新;另一方面降低芯片轉(zhuǎn)發(fā)時延,滿足數(shù)字孿生、元宇宙等新場景對于低時延的需求。要同時滿足芯片容量、靈活性和低時延要求,未來芯片不僅依賴工藝技術(shù)的進(jìn)步,更需要在架構(gòu)設(shè)計和算法上進(jìn)行創(chuàng)新。當(dāng)前主流可編程轉(zhuǎn)發(fā)架構(gòu)有兩種:(1)并行RTC(RunToComplete)架構(gòu);(2)串行流水線架構(gòu)。并行RTC架構(gòu)采用多個包處理引擎并行進(jìn)行報文處理,每個微引擎完成完整的報文處理;串行流水線架構(gòu)將報文處理分成多個階段,由多個串行的包處理引擎接力完成完整的報文處理。并行RTC架構(gòu)具有大容量表項,超大指令空間,能夠處理復(fù)雜業(yè)務(wù),但該架構(gòu)轉(zhuǎn)發(fā)延時大,且在重載時,引擎間調(diào)度沖突加劇,網(wǎng)絡(luò)抖動較大,無法滿足低時延業(yè)務(wù)需求。串行流水線架構(gòu)具有較小的延時和確定的抖動,但轉(zhuǎn)發(fā)表容量較小,編程能力有限,無法處理復(fù)雜業(yè)務(wù)。當(dāng)業(yè)務(wù)復(fù)雜度超過流水線容量時,只能通過環(huán)回處理,導(dǎo)致性能折半下降。圖3.1分組轉(zhuǎn)發(fā)芯片的并行RTC架構(gòu)和串行流水線架構(gòu)我們提出一種新型轉(zhuǎn)發(fā)芯片架構(gòu):并行+串行的混合架構(gòu)。該架構(gòu)最主要的特點(diǎn)是:通數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書過編排將不同特點(diǎn)的業(yè)務(wù)分配到適合的轉(zhuǎn)發(fā)架構(gòu)上,同時滿足未來網(wǎng)絡(luò)性能、延時和業(yè)務(wù)擴(kuò)展性的要求。低延時場景中,低延時業(yè)務(wù)全部由串行流水線處理,少量復(fù)雜業(yè)務(wù)(比如大容量轉(zhuǎn)發(fā)表查找等),交由RTC并行架構(gòu)處理。該場景下,由于RTC處理的業(yè)務(wù)較為簡單,占用指令少,該架構(gòu)依然能夠保證較低的處理時延。對于其他場景(比如通用路由器),芯片要處理的業(yè)務(wù)非常復(fù)雜,涉及多級大容量表項的查找,并且不同表項之間有明確的前后級依賴關(guān)系。該場景下,需要將路由器業(yè)務(wù)進(jìn)行適度分解,通過串行流水線和并行RTC混合路徑處理,將復(fù)雜業(yè)務(wù)處理集中編排到并行RTC架構(gòu)執(zhí)行,由RTC集中完成大容量轉(zhuǎn)發(fā)表的查找和復(fù)雜邏輯處理,從而有效解決單純串行流水線編程能力不足的問題。圖3.2分組轉(zhuǎn)發(fā)芯片的并行+串行混合架構(gòu)基于我們的技術(shù)評估,在選擇合適業(yè)務(wù)排布模型的前提下,混合架構(gòu)的轉(zhuǎn)發(fā)時延與串行流水線架構(gòu)基本相當(dāng),比RTC并行架構(gòu)減少約40%。混合架構(gòu)的芯片面積比RTC并行架構(gòu)和串行流水線架構(gòu)少15%-20%左右,功耗少12%-20%左右。我們認(rèn)為:未來的分組芯片引入串并混合架構(gòu),使芯片成為不同產(chǎn)品的通用平臺,實現(xiàn)“一款芯片、多種產(chǎn)品”,滿足多種業(yè)務(wù)場景需求必然逐漸被業(yè)界接受并推廣。這不僅有利于降低芯片研制成本,而且在后繼產(chǎn)品開發(fā)中,能顯著縮短新功能開發(fā)和部署周期,快速適配用戶持續(xù)變化的業(yè)務(wù)需求。3.5.應(yīng)用層:基于深度學(xué)習(xí)視頻編碼進(jìn)一步提升視頻壓縮效率視頻是信息重要載體,據(jù)統(tǒng)計,2020年視頻流量已經(jīng)占到整個互聯(lián)網(wǎng)流量的70%以上。對于視頻內(nèi)容編碼質(zhì)量以及相同視覺質(zhì)量下壓縮效率的追求,是視頻技術(shù)發(fā)展的最主要驅(qū)動因素。視頻編碼目標(biāo)是在可以接受的信息損失范圍內(nèi)盡量提高視頻壓縮效率,從而降低視頻數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書傳輸帶寬的需求,這是應(yīng)對香農(nóng)極限的另一個努力方向。ISO/IECJTC1SC29與ITU-TSG16VCEG聯(lián)合成立的視頻專家組(JointVideoExpertsCoding)[14]。H.266/VVC沿用傳統(tǒng)混合編碼框架中的預(yù)測編碼、變換編碼和熵編碼技術(shù)來降低視頻空域、時域、頻域、分量間以及視覺冗余,并引入了大量新的編碼參數(shù),更加準(zhǔn)確地描述視頻內(nèi)容。相比上一代視頻編碼標(biāo)準(zhǔn)H.265/HEVC,在相同視覺質(zhì)量下可實現(xiàn)約50%的編碼碼率節(jié)省。然而隨著更多樣塊劃分方法與編碼模式不斷出現(xiàn),更復(fù)雜預(yù)測與變換技術(shù)的不斷引入,傳統(tǒng)視頻編碼算法復(fù)雜度日益增長,完全基于傳統(tǒng)編碼框架技術(shù)來提升視頻編碼壓縮效率也愈發(fā)困難。深度學(xué)習(xí)技術(shù)在圖像分類、目標(biāo)檢測等計算機(jī)視覺任務(wù)上已取得了巨大的成功,近幾年,深度學(xué)習(xí)技術(shù)為圖像/視頻編碼框架定義了新的結(jié)構(gòu)范式,實現(xiàn)了圖像和視頻編碼器性能的顯著提升,這賦予了圖像/視頻編碼領(lǐng)域新的研究契機(jī)?;谏疃葘W(xué)習(xí)的視頻編碼技術(shù)主要包括:傳統(tǒng)視頻編碼與基于神經(jīng)網(wǎng)絡(luò)編碼相結(jié)合的混合視頻編碼技術(shù),以及完全端到端的神經(jīng)網(wǎng)絡(luò)視頻編碼兩大技術(shù)方向。(一)傳統(tǒng)編碼與神經(jīng)網(wǎng)絡(luò)編碼相結(jié)合的混合視頻編碼混合視頻編碼旨在傳統(tǒng)編碼框架中引入深度神經(jīng)網(wǎng)絡(luò)來進(jìn)一步提升壓縮性能。其中一類技術(shù)與傳統(tǒng)編碼標(biāo)準(zhǔn)相兼容,利用深度學(xué)習(xí)策略實現(xiàn)對H.266/VVC和AV1等傳統(tǒng)編碼標(biāo)準(zhǔn)中的塊劃分、預(yù)測模式等大量待搜索對象快速判決,從而緩解編碼端搜索壓力、降低計算復(fù)雜度。另一類技術(shù)則屬于僅實現(xiàn)壓縮效率提升的非標(biāo)準(zhǔn)方案,其典型工具包括:超分辨率和后處理濾波。前者是在解碼端對解碼圖像執(zhí)行超分辨率操作,實現(xiàn)編碼端低分辨率圖像/視頻輸入,仍可獲得高分辨率、高質(zhì)量重建值,從而有效提升編碼效率。后者則試圖直接建立重建像素到原始像素之間的映射關(guān)系,通過濾波器策略實現(xiàn)對重建編碼圖像質(zhì)量的提升。(二)完全端到端的神經(jīng)網(wǎng)絡(luò)視頻編碼端到端神經(jīng)網(wǎng)絡(luò)視頻編碼技術(shù)打破傳統(tǒng)編碼框架,完全使用深度學(xué)習(xí)方法實現(xiàn)編解碼流程。基于神經(jīng)網(wǎng)絡(luò)視頻編碼利用海量數(shù)據(jù)集進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,學(xué)習(xí)去除視頻壓縮失真任務(wù)中的先驗知識。強(qiáng)大的非線性變換和映射能力是端到端神經(jīng)網(wǎng)絡(luò)編碼可獲得更好壓縮性能的一個主要原因。此外,端到端神經(jīng)網(wǎng)絡(luò)編碼器針對整個編碼環(huán)路進(jìn)行端到端優(yōu)化,可以避免數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書傳統(tǒng)編碼器中手工設(shè)計或獨(dú)立優(yōu)化所存在的局部最優(yōu)問題,實現(xiàn)編碼系統(tǒng)整體編碼性能的提。基于深度學(xué)習(xí)的視頻編碼雖然相比傳統(tǒng)視頻編碼可獲得較大壓縮效率提升,但其所帶來的解碼端復(fù)雜度大幅提升使得此類技術(shù)在短期內(nèi)落地面臨一定挑戰(zhàn)。目前,業(yè)界廠商正在積極研究傳統(tǒng)視頻編碼技術(shù)與基于深度學(xué)習(xí)視頻編碼技術(shù)聯(lián)合優(yōu)化。例如,JVET開展的神經(jīng)網(wǎng)絡(luò)視頻編碼(NNVC)探索實驗[15]和增強(qiáng)壓縮視頻編碼(ECM)探索實驗[16],兼顧傳統(tǒng)預(yù)測變換編碼工具的壓縮優(yōu)勢,以及深度神經(jīng)網(wǎng)絡(luò)智能編碼工具的質(zhì)量提升優(yōu)勢,測試結(jié)果和{-11.06%,-22.62%,-24.13%},具備演進(jìn)成為下一代視頻編碼標(biāo)準(zhǔn)的技術(shù)潛力。3.6.設(shè)備互聯(lián):光互聯(lián)將逐步滲透到設(shè)備間及設(shè)備內(nèi)互聯(lián)更寬的連接,對于通信設(shè)備來說,意味著更大的單板容量、更高的通道速率和更高的帶寬密度。同時,需要有更低的bit功耗和bit成本。目前,信息通信設(shè)備內(nèi)部以電互連為主。比如,框式設(shè)備內(nèi)部通過PCB電背板進(jìn)行互連;盒式設(shè)備的主芯片和光模塊之間也是電互連。隨著速率的上升,電互連的高頻信號插損(IL)變得很大。同時,由于回?fù)p(RL)、連接器的阻抗不連續(xù)和串?dāng)_(Crosstalk)等因素的影響,需要使用更加復(fù)雜的均衡算法和FEC(前向糾錯編碼)來補(bǔ)償信號損失,這就使得電互連的Serdes(串行/解串行)部分功耗增加。光互連在容量和距離方面具有電互連無可比擬的優(yōu)勢,因此,隨著數(shù)據(jù)速率的增加和連接密度的上升,設(shè)備內(nèi)部的互連也出現(xiàn)光進(jìn)銅退的趨勢。相比于電互連,光互連還有一個優(yōu)點(diǎn)就是極大的拓展了設(shè)備的空間互連距離,在設(shè)備結(jié)構(gòu)層面的表現(xiàn)就是解耦目前電互連機(jī)架中板卡之間的空間緊耦合關(guān)系,降低了散熱和SI(Signalintegrity,信號完整性)的設(shè)計難度;在設(shè)備內(nèi)部網(wǎng)絡(luò)連接拓?fù)涞膶用嫔?,表現(xiàn)為三級CLOS網(wǎng)絡(luò)的基數(shù)(radix)可以增加很多,即,可以在一個三級CLOS架構(gòu)下,讓更多的交換板和更多的線卡進(jìn)行互連,從而實現(xiàn)了超大容量(提高一個數(shù)量級)信息通信設(shè)備的數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書低成本、低時延和低功耗的連接方案[17]。CPO(Co-packagedOptics)技術(shù)是減小光引擎(實現(xiàn)光收發(fā)功能的單元)的體積,將光引擎和主芯片共封裝的技術(shù),也是將光互連下沉到單板間互連及芯片間互連的關(guān)鍵技術(shù)。CPO將帶來功耗的減少、信號完整性的優(yōu)化、成本的降低以及其它方面的收益。與面板可插拔光模塊(FPP)相比,CPO大幅縮短了主芯片和光器件(optics)之間的距離,顯LR),縮短到50mm(CEI-112G-XSR)的時候,奈奎斯特頻率處的插損從28dB變成了10dB。相對應(yīng)的Serdes功耗從650mW下降到150mW,功耗大約節(jié)約了75%[18]。對于linear鏈路的CPO來說,由于取消了內(nèi)部的DSP,可以更大幅度地降低整體成本和功耗[19]。圖3.3可插拔光模塊向CPO演進(jìn)示意圖共裝低功耗、高密度和大容量的CPO是交換芯片的未來發(fā)展趨勢。從2010~2022年,數(shù)據(jù)中心交換機(jī)帶寬提升了80倍,功耗提升了22倍,其中光模塊的功耗增長了26倍,交換芯片Serdes的功耗增長了25倍,兩者的總功耗占到了交換機(jī)功耗的70%[20]。面對功耗、SI和成本方面的壓力,行業(yè)各方都在大力推進(jìn)CPO的標(biāo)準(zhǔn)化和產(chǎn)業(yè)化,預(yù)計102.4T容量階段的交換機(jī)將是CPO規(guī)模部署的切入點(diǎn)。當(dāng)然,面板可插拔光模塊(FPP)也在不斷隨著各種新技術(shù)的發(fā)展而改進(jìn)優(yōu)化,尤其是近期LPO(Linear-drivePluggableOptics)受到比較多的關(guān)注,其在功耗和成本上,相比于非線性直驅(qū)的的可插拔光模塊有比較大的優(yōu)勢,但是,要完全覆蓋目前的非相干光模塊場景還是比較困難的。由于技術(shù)之間的融合,LPO也可以視為CPO技術(shù)的鋪墊[21]??傊?,在相當(dāng)長的一段時間內(nèi),CPO和可插拔光模塊將會共存。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書在HPC(HighPerformanceComputing高性能計算)/AI的網(wǎng)絡(luò)和設(shè)備中,同樣面臨著功耗、成本和時延方面的巨大壓力。OpticalI/O作為CPO的特定形態(tài),在計算芯片CPU、GPU以及XPU等之間的互連(chiptochipinterconnect)方面,具有低功耗、高帶寬、低延遲的優(yōu)勢。從Nvidia評估的數(shù)據(jù)來看,GPU在板內(nèi)的電互連(PCIe總線),功耗約為6pJ/bit@0.3m,升級為全光互連后,功耗降低為4pJ/bit,連接距離可以增加到100m[22]。預(yù)計未來在200G的通道帶寬下可以實現(xiàn)0.1pJ/bit的更低功耗[23]。由于近期ChatGPT的熱度持續(xù),預(yù)計OpticalI/O形態(tài)的CPO,將會首先進(jìn)入規(guī)模商用,在HPC/AI的網(wǎng)絡(luò)和設(shè)備中進(jìn)行部署。從目前產(chǎn)業(yè)鏈發(fā)展情況來看,Ⅲ-Ⅴ材料和硅基的異質(zhì)集成和以Chiplet為重點(diǎn)的異構(gòu)集成,將是CPO發(fā)展的有效途徑。同時,CPO和主芯片的2.5D集成甚至3D集成也將是重要的研究方向。CPO發(fā)展的最終目標(biāo)將是光電的單片集成,即在wafer級上,實現(xiàn)光功能模塊和電功能模塊的集成,這是光電集成的圣杯,也意味著巨大的挑戰(zhàn)。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書4.更強(qiáng)的算力隨著人工智能、隱私計算、AR/VR以及基因測試/生物制藥等新型高性能計算應(yīng)用的不斷普及,對算力的需求也不斷持續(xù)增加。比如,以ChatGPT為代表的大模型需要巨大算力支撐。大模型對算力的需求增速遠(yuǎn)大于摩爾定律增速。圖4.1AI大模型對于算力需求的增速遠(yuǎn)大于摩爾定律增速[11]自微處理器誕生以來,算力的增長按摩爾定律發(fā)展,即通過增加單位芯片面積的門電路數(shù)量來增加處理器算力,降低處理器成本和功耗。但近年來這條路已經(jīng)遇到越來越大的困難,通過持續(xù)縮微來提升性能已經(jīng)無法滿足應(yīng)用的需求。在后摩爾定律時代,一方面可以通過持續(xù)在工藝和材料上的創(chuàng)新來提升芯片算力:MoreMoore:繼續(xù)追求更高的晶體管單位密度。比如晶體管工藝結(jié)構(gòu)從鰭式結(jié)構(gòu)FinFET到環(huán)形結(jié)構(gòu)GAA,以及納米片、納米線等技術(shù)手段有望將晶體管密度繼續(xù)提升5倍以上。但這條路在成本、功耗方面的挑戰(zhàn)非常大。BeyondCMOS:放棄CMOS工藝,尋求新材料和新工藝。比如使用碳納米管、二硫化鉬等二維材料的新型制備工藝,和利用量子隧穿效應(yīng)的新型機(jī)制晶體管。但這條路徑的不確定性較大,離成熟還需要很長時間。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書另一方面利用架構(gòu)的創(chuàng)新來提升算力密度,優(yōu)化算力資源,從而延續(xù)摩爾定律。這也是本章要重點(diǎn)闡述的內(nèi)容:在芯片層面堅持領(lǐng)域定制的技術(shù)路線,進(jìn)行軟硬件協(xié)同協(xié)同設(shè)計,同時利用3D堆疊和Chiplet技術(shù)來降低芯片的設(shè)計和制造成本。(見4.2節(jié))引入新的計算架構(gòu)和計算范式,如存算一體設(shè)計,在系統(tǒng)、體系和微架構(gòu)層面進(jìn)行計算、存儲協(xié)同設(shè)計,從而實現(xiàn)高能效計算。(見4.3節(jié))采用“對等系統(tǒng)”等體系結(jié)構(gòu)創(chuàng)新,優(yōu)化計算、控制和數(shù)據(jù)路徑,用全局最優(yōu)替代局部最強(qiáng),減少計算性能提升對先進(jìn)工藝的依賴。(見4.4節(jié))在網(wǎng)絡(luò)架構(gòu)層面進(jìn)行創(chuàng)新,通過算網(wǎng)融合提升算力資源調(diào)度效率。(見4.5節(jié))4.2.芯片架構(gòu):DSA&3D堆疊&Chiplet圖靈獎獲得者JohnHennessy和DavidPatterson在2019年共同發(fā)表的《計算機(jī)架構(gòu)的新黃金時代》中提出:當(dāng)摩爾定律不再適用,一種軟硬件協(xié)同設(shè)計的DSA(領(lǐng)域定制架構(gòu)DomainSpecificArchitecture)架構(gòu)會成為主導(dǎo),這種設(shè)計的核心在于針對特定問題或特定領(lǐng)域來定義計算架構(gòu)。近幾年火熱的人工智能AI芯片和方興未艾的DPU都是DSA領(lǐng)域的典型代表。DSA針對特定領(lǐng)域的應(yīng)用采用高效的架構(gòu),比如使用專用內(nèi)存最小化數(shù)據(jù)搬移、根據(jù)應(yīng)用特點(diǎn)把芯片資源更多側(cè)重于計算或存儲、簡化數(shù)據(jù)類型、使用特定編程語言和指令等等。與ASIC芯片(ApplicationSpecificIntegratedCircuit,專用集成電路)相比,DSA芯片在同等晶體管資源下具有相近的性能和能效,并且最大程度的保留了靈活性和領(lǐng)域的通用性。例如中興通訊提出的計算和控制分離的人工智能領(lǐng)域定制芯片架構(gòu)“夸克”,針對深度神經(jīng)網(wǎng)絡(luò)的計算特點(diǎn),將算力抽象成張量、向量和標(biāo)量引擎,通過獨(dú)立的控制引擎(CE)對各種PE引擎進(jìn)行靈活編排和調(diào)度,從而可以高效實現(xiàn)各種深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)計算,完成自然數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書語言處理、AI檢測、識別和分類等各種人工智能應(yīng)用。由于采用軟硬件協(xié)同設(shè)計的定制化方案,DSA芯片在相同功耗下可以取得比傳統(tǒng)CPU高數(shù)十倍甚至幾百倍的性能。圖4.2中興“夸克”領(lǐng)域定制架構(gòu)摩爾定律本身是在2D空間進(jìn)行評估的,隨著芯片微縮愈加困難,3D堆疊技術(shù)被認(rèn)為是提升集成度的一個重要技術(shù)手段。3D堆疊就是不改變原本封裝面積情況下,在垂直方向進(jìn)行的芯片疊放。這種芯片設(shè)計架構(gòu)有助于解決密集計算的內(nèi)存墻問題,具有更好的擴(kuò)展性和能效比。Chiplet技術(shù)被認(rèn)為是延續(xù)摩爾定律的關(guān)鍵技術(shù)。首先Chiplet技術(shù)將芯片設(shè)計模塊化,將大型芯片小型化,可以有效提升芯片良率,降低芯片設(shè)計的復(fù)雜程度。其次,Chiplet技術(shù)可以把不同芯粒根據(jù)需要來選擇合適的工藝制程分開制造(比如核心算力邏輯使用新工藝提升性能,外圍接口仍采用成熟工藝降低成本),再通過先進(jìn)封裝技術(shù)進(jìn)行組裝,可以有效降低制造成本。與傳統(tǒng)芯片方案相比,Chiplet模式具有設(shè)計靈活性、成本低、上市周期短三方面優(yōu)勢。Chiplet技術(shù)面臨的最大挑戰(zhàn)是互聯(lián)技術(shù),2022年3月2日,“UCIe產(chǎn)業(yè)聯(lián)盟”成立,致力于滿足客戶對可定制封裝互聯(lián)互通要求。Chiplet產(chǎn)業(yè)會逐漸成熟,并將形成包括互聯(lián)接口、架構(gòu)設(shè)計、制造和先進(jìn)封裝的完整產(chǎn)業(yè)鏈。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書4.3.計算架構(gòu):存算一體使得計算和存儲從分離走向聯(lián)合優(yōu)化經(jīng)典馮·諾依曼計算架構(gòu)采用計算和存儲分離架構(gòu),如果訪存的速度跟不上CPU的性能,就會導(dǎo)致計算能力受到限制,即“內(nèi)存墻”出現(xiàn)。谷歌針對自家產(chǎn)品的耗能情況做了一項研究,發(fā)現(xiàn)整個系統(tǒng)耗能的60%以上花費(fèi)在CPU和內(nèi)存的讀寫傳輸上[24]。而讀寫一次內(nèi)存耗費(fèi)的能量比計算一次數(shù)據(jù)耗費(fèi)的能量多幾百倍。由于“功耗墻”的存在,大量的數(shù)據(jù)訪問也會嚴(yán)重限制計算性能。隨著大數(shù)據(jù)和人工智能應(yīng)用的發(fā)展,傳統(tǒng)計算架構(gòu)在內(nèi)存墻和功耗墻的雙重限定下,對新興數(shù)據(jù)密集型應(yīng)用的影響變得越來越突出,亟需新的計算架構(gòu)解決這一問題。存算一體技術(shù)就是從應(yīng)用需求出發(fā),進(jìn)行計算和存儲的最優(yōu)化聯(lián)合設(shè)計,減少數(shù)據(jù)的無效搬移、增加數(shù)據(jù)的讀寫帶寬、提升計算的能效比,從而突破現(xiàn)有內(nèi)存墻和功耗墻的限制。圖4.3存算一體的三種架構(gòu)存算一體包含系統(tǒng)架構(gòu)、體系結(jié)構(gòu)和微架構(gòu)多個層面。系統(tǒng)架構(gòu)層面,在傳統(tǒng)計算和存儲單元中間增加數(shù)據(jù)邏輯層,實現(xiàn)近存計算,減少數(shù)據(jù)中心內(nèi)、外數(shù)據(jù)低效率搬移,從系統(tǒng)層面提升計算能效比;體系架構(gòu)層面,利用3D堆疊、異構(gòu)集成等先進(jìn)技術(shù),將計算邏輯和存儲單元合封,實現(xiàn)在存計算,從而增加數(shù)據(jù)帶寬、優(yōu)化數(shù)據(jù)搬移路徑、降低系統(tǒng)延時;微架構(gòu)層面,進(jìn)行存儲和計算的一體化設(shè)計,實現(xiàn)存內(nèi)計算,基于傳統(tǒng)存儲材料和新型非易失存儲材料,在存儲功能的電路內(nèi)同時實現(xiàn)計算功能,取得最佳的能效比。(一)系統(tǒng)架構(gòu)層面的近存計算(ProcessingNearMemory)數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書近存計算在數(shù)據(jù)緩存位置引入算力,在本地產(chǎn)生處理結(jié)果并直接返回,可以減少數(shù)據(jù)移動,加快處理速度,并提升安全性。如圖4.3所示,通過對Data-Centric類應(yīng)用增加一層數(shù)據(jù)邏輯層,整合原系統(tǒng)架構(gòu)中的數(shù)據(jù)邏輯布局功能和應(yīng)用服務(wù)數(shù)據(jù)智能功能,并引入緩存計算,從而減少數(shù)據(jù)搬移。在“東數(shù)西算”工程中,可以通過設(shè)置近存計算層,解決數(shù)據(jù)無序流動的低能效問題。(二)體系架構(gòu)層面的在存計算(ProcessingInMemory)在存計算主要在存儲器內(nèi)部集成計算引擎,這個存儲器通常是DRAM。其目標(biāo)是直接在數(shù)據(jù)讀寫的同時完成簡單處理,而無需將數(shù)據(jù)拷貝到處理器中進(jìn)行計算。例如攝氏和華氏溫度的轉(zhuǎn)換。在存計算本質(zhì)上還是計算、存儲分離架構(gòu),只是將存儲和計算靠近設(shè)計,從而減少數(shù)據(jù)搬移帶來的開銷。目前主要是存儲器廠商在推動其產(chǎn)業(yè)化。(三)微架構(gòu)層面的存內(nèi)計算(ProcessingWithinMemory)存內(nèi)計算是把計算單位嵌入到存儲器中,特別適合執(zhí)行高度并行的矩陣向量乘積,在機(jī)器學(xué)習(xí)、密碼學(xué)、微分方程求解等方面有較好的應(yīng)用前景。圖4.4存內(nèi)計算架構(gòu)示意存內(nèi)計算采用計算、存儲統(tǒng)一設(shè)計的架構(gòu)。以深度神經(jīng)網(wǎng)絡(luò)的矩陣向量乘加操作為例,一般采用圖4.4所示架構(gòu),由輸入端的DAC、單元陣列、輸出端的ADC以及其他輔助電路組成。存儲單元中存放權(quán)重數(shù)據(jù),輸入經(jīng)過DAC轉(zhuǎn)換后變成對存儲數(shù)據(jù)的讀寫操作,利用歐姆定律和基爾霍夫定律,不同的存儲單元輸出電流自動累加后輸出到ADC單元進(jìn)行采樣,數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書轉(zhuǎn)換成輸出的數(shù)字信號,這樣就完成了矩陣向量乘加操作。存內(nèi)計算按照存儲介質(zhì)不同可以分為易失材料(DRAM/SRAM)和非易失材料(RRAM/PRAM/MRAM/FLASH等)2類。在計算電路的具體實現(xiàn)上包括模擬計算、數(shù)模混合計算和全數(shù)字計算?;赟RAM的全數(shù)字存內(nèi)計算芯片,由于工藝成熟,同時能夠?qū)崿F(xiàn)比較高的計算精度(≧8bit),目前已經(jīng)逐步進(jìn)入商用階段。而基于非易失材料的模擬存內(nèi)計算,還需要解決器件穩(wěn)定性和功耗問題。4.4.計算架構(gòu):基于對等系統(tǒng)的分布式計算架構(gòu)傳統(tǒng)的計算系統(tǒng)以CPU為中心進(jìn)行搭建,業(yè)務(wù)的激增對于系統(tǒng)處理能力要求越來越高,摩爾定律放緩,CPU的處理能力增長越來越困難,出現(xiàn)了算力墻。通過領(lǐng)域定制(DSA)和異構(gòu)計算架構(gòu)可以提升系統(tǒng)的性能,但是改變不了以CPU為中心的架構(gòu)體系,加速器之間的數(shù)據(jù)交互通常還是需要通過CPU來進(jìn)行中轉(zhuǎn),CPU容易成為瓶頸,效率不高。基于xPU(以數(shù)據(jù)為中心的處理單元)為中心的對等系統(tǒng)可以構(gòu)建一個新型的分布式計算架構(gòu)。如圖4.5所示,對等系統(tǒng)由多個結(jié)構(gòu)相似的節(jié)點(diǎn)互聯(lián)而成,每個節(jié)點(diǎn)以xPU為核心,包含多種異構(gòu)的算力資源,如CPU、GPU及其它算力芯片。xPU主要功能是完成節(jié)點(diǎn)內(nèi)異構(gòu)算力的接入、互聯(lián)以及節(jié)點(diǎn)間的互聯(lián),xPU內(nèi)部的通用處理器核可以對節(jié)點(diǎn)內(nèi)的算力資源進(jìn)行管理和二級調(diào)度。節(jié)點(diǎn)內(nèi)不再以CPU為中心,CPU、GPU及其它算力芯片作為節(jié)點(diǎn)內(nèi)的算力資源處于完全對等的地位,xPU根據(jù)各算力芯片的特點(diǎn)及能力進(jìn)行任務(wù)分配。對等系統(tǒng)的節(jié)點(diǎn)內(nèi)部和節(jié)點(diǎn)之間采用基于內(nèi)存語義的新型傳輸協(xié)議,即,采用read/write等對內(nèi)存操作的語義,實現(xiàn)對等、無連接、授權(quán)空間訪問的通信模式,通過多路徑傳輸、選擇性重傳、集合通信等技術(shù)提高通信效率。與TCP、RoCE等現(xiàn)有傳輸協(xié)議相比,基于內(nèi)存語義的傳輸協(xié)議基于低延時、高擴(kuò)展性的優(yōu)勢。節(jié)點(diǎn)內(nèi)xPU、CPU、GPU及其他數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書算力芯片之間通過基于內(nèi)存語義的低延時總線直接進(jìn)行數(shù)據(jù)交互。節(jié)點(diǎn)間通過xPU內(nèi)部的高性能轉(zhuǎn)發(fā)面實現(xiàn)基于內(nèi)存語義的低延時Fabric,從而構(gòu)建以節(jié)點(diǎn)為單位的分布式算力系統(tǒng)。同時xPU內(nèi)置安全、網(wǎng)絡(luò)、存儲加速模塊,降低了算力資源的消耗,提高了節(jié)點(diǎn)的性圖4.5對等系統(tǒng)示意圖基于對等系統(tǒng)架構(gòu)的服務(wù)器可以看成一個“分布式計算系統(tǒng)”,有利于產(chǎn)業(yè)鏈上各節(jié)點(diǎn)獨(dú)立規(guī)劃開發(fā),發(fā)揮各自優(yōu)勢。比如xPU卸載+庫/外OS演進(jìn)+APPdirect模式解決公共能力(存儲、網(wǎng)絡(luò)),整體性能的提升不再依賴于先進(jìn)工藝;基于對等內(nèi)存語義互聯(lián)實現(xiàn)系統(tǒng)平滑擴(kuò)展,將龐大分布式算力視為一臺單一的“計算機(jī)”。4.5.網(wǎng)絡(luò)架構(gòu):支撐算網(wǎng)融合的IP網(wǎng)絡(luò)技術(shù)實現(xiàn)算力資源高效調(diào)度隨著邊緣計算的發(fā)展、東數(shù)西算的推進(jìn),算力資源呈現(xiàn)分布式部署的模式。如前所述,網(wǎng)絡(luò)帶寬的提速受到香農(nóng)定理的限制,算力能力的提升受到摩爾定律的約束,兩者又都受到節(jié)能降耗的影響,預(yù)計網(wǎng)絡(luò)和算力資源的高效調(diào)度、精細(xì)化運(yùn)營成為必須選擇的方向。算網(wǎng)絡(luò)融合的目標(biāo)借助高速、靈活、智能的網(wǎng)絡(luò),將跨地域的算力節(jié)點(diǎn)組織起來,協(xié)同提供開放的算力服務(wù),并提高算網(wǎng)資源的有效利用率。算網(wǎng)深度融合有兩大驅(qū)動力,一是需求側(cè),實現(xiàn)算力和網(wǎng)絡(luò)的協(xié)同調(diào)度,滿足業(yè)務(wù)對算力資源和網(wǎng)絡(luò)連接的一體化需求。比如,高分辨率的VR云游戲,既需要專用圖形處理器 (GPU)計算資源完成渲染,又需要確定性的網(wǎng)絡(luò)連接來滿足10ms以內(nèi)的端到端時延要數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書求。二是供給側(cè),借助于網(wǎng)絡(luò)設(shè)施天生的無處不在的分布式特點(diǎn),算網(wǎng)深度融合可以助力算力資源也實現(xiàn)分布化部署,滿足各類應(yīng)用對于時延、能耗、安全的多樣化需求。算網(wǎng)融合給IP網(wǎng)絡(luò)技術(shù)提出了挑戰(zhàn)。在互聯(lián)網(wǎng)整個技術(shù)架構(gòu)中,通常來說算對應(yīng)著上層的應(yīng)用,網(wǎng)對應(yīng)著底層的連接,IP技術(shù)作為中間層,起到承上啟下的樞紐作用。傳統(tǒng)的IP網(wǎng)絡(luò)遵循的端到端和分層解耦的架構(gòu)設(shè)計,使得業(yè)務(wù)可以脫離網(wǎng)絡(luò)而獨(dú)立發(fā)展,極大降低了互聯(lián)網(wǎng)業(yè)務(wù)的創(chuàng)新門檻,增加了業(yè)務(wù)部署的便利。但是在這樣的設(shè)計架構(gòu)之下,業(yè)務(wù)和網(wǎng)絡(luò)處于“去耦合“的狀態(tài),最終絕大多數(shù)業(yè)務(wù)只能按照“盡力而為”的模式運(yùn)行。如何建立業(yè)務(wù)和網(wǎng)絡(luò)之間的橋梁,實現(xiàn)算力資源、網(wǎng)絡(luò)資源的協(xié)同和精細(xì)化管理,是未來IP網(wǎng)絡(luò)面臨的一大挑戰(zhàn)。中興通訊提出的“服務(wù)感知網(wǎng)絡(luò)(SAN,ServiceAwarenessNetwork)”是在這個方面的創(chuàng)新嘗試[25]。圖4.6服務(wù)感知網(wǎng)絡(luò)(SAN)架構(gòu)示意服務(wù)感知網(wǎng)絡(luò)的架構(gòu)如圖4.6所示。其核心思想是把服務(wù)提供商對外提供的算力資源和網(wǎng)絡(luò)資源封裝為“服務(wù)”,以服務(wù)標(biāo)識來表示;服務(wù)按需在網(wǎng)絡(luò)各處部署;在IP網(wǎng)絡(luò)層引入“服務(wù)子層”,實現(xiàn)對服務(wù)的感知、路由和調(diào)度。因此服務(wù)感知網(wǎng)絡(luò)具有三個核心設(shè)計要(一)橫向貫穿端網(wǎng)云、縱向打通應(yīng)用和網(wǎng)絡(luò)的服務(wù)標(biāo)識服務(wù)標(biāo)識是端、網(wǎng)、云統(tǒng)一的服務(wù)治理對象,包括連接類服務(wù)和算力服務(wù)。應(yīng)用層直接數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書用服務(wù)標(biāo)識發(fā)起位置無關(guān)傳輸層連接,無需DNS域名解析過程,大大縮短了服務(wù)響應(yīng)時間,并且內(nèi)含了對移動性的支持。(二)在IP網(wǎng)絡(luò)層引入服務(wù)子層(3.5層),以網(wǎng)絡(luò)為中心實現(xiàn)服務(wù)互聯(lián)在保留傳統(tǒng)IP主機(jī)路由的基礎(chǔ)上引入以服務(wù)標(biāo)識為中心的服務(wù)子層,使能網(wǎng)絡(luò)對服務(wù)使用方的算力需求的感知,和服務(wù)提供方的算力資源狀態(tài)的感知,從而通過服務(wù)路由,實現(xiàn)服務(wù)需求到服務(wù)資源的高效連接,實現(xiàn)了網(wǎng)絡(luò)從傳統(tǒng)模式下的主機(jī)互聯(lián)到服務(wù)互聯(lián)的演進(jìn),(三)能力增強(qiáng)的連接子層連接子層對網(wǎng)絡(luò)的基礎(chǔ)能力進(jìn)行增強(qiáng),比如確定性服務(wù)能力和內(nèi)生安全能力。服務(wù)的網(wǎng)絡(luò)連接級服務(wù)質(zhì)量需求由連接子層滿足。服務(wù)感知網(wǎng)絡(luò)實現(xiàn)了算力服務(wù)和網(wǎng)絡(luò)服務(wù)的一體化供給,實現(xiàn)算網(wǎng)資源的高效調(diào)度,既保障了服務(wù)質(zhì)量,又能將節(jié)能減排的要求落到實處。數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書5.更高的智能智能技術(shù)是推動人類進(jìn)入智能時代的決定性力量。全球發(fā)達(dá)經(jīng)濟(jì)體充分認(rèn)識到人工智能技術(shù)引領(lǐng)新一輪產(chǎn)業(yè)變革的重大意義,紛紛推進(jìn)智能基礎(chǔ)設(shè)施建設(shè)和各領(lǐng)域應(yīng)用研究。人工智能技術(shù)的基本要素是“三算”:算力、算法和數(shù)據(jù)(算料)。其中數(shù)據(jù)跟具體業(yè)務(wù)領(lǐng)域相關(guān),開放、共享、可流通的數(shù)據(jù)資源體系建設(shè)是《數(shù)字中國建設(shè)整體布局規(guī)劃》[03]關(guān)注的兩大基礎(chǔ)之一;而算力和算法是數(shù)字基礎(chǔ)設(shè)施應(yīng)具備的基本能力。從2016年以來的新一輪人工智能技術(shù)在“三算”方面已取得重要突破,正從之前“不能用”到現(xiàn)在“可以用”,但距離“很好用”仍有諸多瓶頸。如強(qiáng)大的智能能力依賴于復(fù)雜的算法疊加龐大的算力而獲得,成本功耗均很高,對于環(huán)境的壓力很大;面向特定領(lǐng)域的專用人工智能因建模相對簡單、算料標(biāo)注充沛,已經(jīng)取得不少優(yōu)于人類能力的成果,但是通用智能仍處于起步階段,處于“有智能無智慧、有智商無情商、有專才無通才”狀態(tài)。正如第二章所述,人類尚未在人工智能的基礎(chǔ)理論(認(rèn)知科學(xué))

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論