版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
證券研究報(bào)告|行業(yè)深度GPU到ASIC的迭代,從算力發(fā)展角一卡難求。經(jīng)過一年發(fā)展,大家對于Transf品逐漸摸索出了以堆料矩陣乘法核構(gòu)建“流水線”式處理流程的設(shè)計(jì)思路,在舍棄需求、算法的確定性,是ASIC放量的關(guān)效的連接“流水線”中的計(jì)算單元與存儲,如何在無小核輔助的情況下整理進(jìn)入計(jì)算核的數(shù)據(jù),編譯器的難度陡然提升。同時(shí),如何在CUDA生態(tài)對第三方“兼容”本使得需求得以釋放,繁榮的生態(tài)吸引更多用戶與參與者,最終培育出新的、更強(qiáng)晶圓廠:臺積電(TSMC)、英特爾(INTC););服務(wù)器龍頭:工業(yè)富聯(lián)、高新發(fā)展、中科曙光、紫行業(yè)走勢32%16% 0%-16%-32%2023-032023-072023-11作者分析師黃瀚相關(guān)研究請仔細(xì)閱讀本報(bào)告末頁聲明P.2請仔細(xì)閱讀本報(bào)告末頁聲明1、投資要件 32、ASIC芯片概述 42.1什么是ASIC芯片 4 53、大模型ASIC的發(fā)展路線 63.1初步專用化:GPU亦是ASIC 6 83.3極致專用化:以Groq為例 3.4主要技術(shù)趨勢總結(jié):Wafer-Scaling+近存計(jì)算構(gòu)建數(shù)據(jù)流水線 4、以礦機(jī)為鑒,英偉達(dá)與ASIC之爭將走向何方? 4.1比特幣礦機(jī)發(fā)展史,用何種速度取代CPU 4.2以太坊礦機(jī)發(fā)展史,為何一波三折? 4.3以史為鑒,“算法確定性”和“用戶需求”決定ASIC滲透速度 5、軟件將成為算力第三極 5.1推理時(shí)代,更加考驗(yàn)編譯器的“流水線”構(gòu)筑能力 5.2兩年硬件,四年軟件,編譯器和生態(tài)將成為進(jìn)入者最大門檻 6、我們的理解:需求決定一切,AISC與GPU螺旋上升 7、投資建議 8、風(fēng)險(xiǎn)提示 圖表1:CPU、GPU、FPGA、ASIC對比 4圖表2:GPU與CPU對比 6圖表3:英偉達(dá)GPU架構(gòu)迭代歷程 7圖表4:NVIDIAH100TensorCoreFP8 7圖表5:英偉達(dá)A100架構(gòu)圖 8圖表6:矩陣乘法公式 9圖表7:TPUV1 圖表8:TPUV1-V2 圖表9:TPUV4 圖表10:Groq推理效果對比圖 圖表11:Groq芯片工作流 圖表12:TSPSuperlane流水線架構(gòu) 圖表13:嘉楠阿瓦隆1366I 圖表14:NVIDIACmpHx專業(yè)挖礦專用GPU 圖表15:CUDA擴(kuò)大支持多種算法 圖表16:TSPSuperlane位寬 圖表17:Groq的研發(fā)歷程 圖表18:功能單元支持指令 圖表19:ASIC與通用芯片帶動AI螺旋上升 圖表20:相關(guān)標(biāo)的 P.3請仔細(xì)閱讀本報(bào)告末頁聲明我們復(fù)盤礦機(jī)發(fā)展歷史,算法較為簡單且完全固定的比特幣,在全網(wǎng)算力(礦工需求)的通用性芯片(顯卡)一直保持了較高的市占率。因此,客戶需求、算法穩(wěn)定是ASIC放量的兩大條件。起量的第一波需求。如今,經(jīng)過兩年發(fā)展,全球用芯片中的不必要部分去除,保留單純用于處理矩陣乘法的計(jì)算核,同時(shí)再利用但與此同時(shí),由于需要多個(gè)矩陣乘法核、存儲之間的相互配合,同時(shí)少了對數(shù)據(jù)預(yù)處理的“小核”的幫助,該技術(shù)路線對于控制算核運(yùn)算的“編譯器”設(shè)計(jì)難度極高。從大火服務(wù)器龍頭:工業(yè)富聯(lián)、高新發(fā)展、中科曙光、紫光股份。P.4請仔細(xì)閱讀本報(bào)告末頁聲明史上的第一大類“ASIC”芯片,通過大量部署并行計(jì)算核圖表1:CPU、GPU、FPGA、ASIC對比CPUGPUFPGAASIC性能和效率可在各種任務(wù)中提供平衡的性能,串行處理架構(gòu)限制了它們在可并行化的任務(wù)中的效率能夠高效地執(zhí)行可以分解為更小的并發(fā)操作的任務(wù)針對特定任務(wù)進(jìn)行優(yōu)化,與CPU和GPU相比,它可能為某些應(yīng)用提供卓越的效率在特定應(yīng)用中表現(xiàn)出色,性能明顯優(yōu)于其他靈活性和定制性靈活性較高,能夠運(yùn)行各種應(yīng)用程序靈活性較高,能夠運(yùn)行各種應(yīng)用程序可以在制造后重新編程,以執(zhí)行不同的任務(wù)或適應(yīng)新的要求需要定制設(shè)計(jì),缺乏靈活性成本成本較低成本較低初始成本高于CPU和GPU初始開發(fā)和生產(chǎn)成本高,適用于大批量或高利潤應(yīng)用應(yīng)用場景從運(yùn)行操作系統(tǒng)到復(fù)雜數(shù)據(jù)處理的各種計(jì)算任務(wù)圖形渲染、科學(xué)模擬和某些形式的數(shù)據(jù)分析信號處理和新技術(shù)原型設(shè)計(jì)高端消費(fèi)電子產(chǎn)品和比特幣挖礦資料來源:D-central官網(wǎng),國盛證券研究所P.5請仔細(xì)閱讀本報(bào)告末頁聲明片中的特定功能被分割出來,形成了新的芯片但天下芯片,通久必專,專久必通,當(dāng)矩陣乘法這一固定運(yùn)算占據(jù)了大部分的大模型運(yùn)設(shè)計(jì)思路與演化方向。P.6請仔細(xì)閱讀本報(bào)告末頁聲明圖表2:GPU與CPU對比資料來源:英偉達(dá)官網(wǎng),國盛證券研究所生出圖像識別、光線追蹤、機(jī)器視覺等等新功能和與之對應(yīng)的以“卷積計(jì)算”為代表的P.7請仔細(xì)閱讀本報(bào)告末頁聲明圖表3:英偉達(dá)GPU架構(gòu)迭代歷程圖表4:NVIDIAH100TensorCoreFP8資料來源:英偉達(dá)官網(wǎng),國盛證券研究所P.8請仔細(xì)閱讀本報(bào)告末頁聲明相對固定的算法,則是ASIC發(fā)展的最好土壤。而谷歌TPU,則是率先嶄露頭角的第一能力的基石。圖表5:英偉達(dá)A100架構(gòu)圖資料來源:英偉達(dá)官網(wǎng),國盛證券研究所P.9請仔細(xì)閱讀本報(bào)告末頁聲明圖表6:矩陣乘法公式但由于脈動陣列的一些特性,其在擁有優(yōu)異的“取數(shù)能力”時(shí),也不可避免的會出現(xiàn)一些劣勢。第一,GPU遇到的數(shù)據(jù)往往不是連續(xù)P.10請仔細(xì)閱讀本報(bào)告末頁聲明但隨著谷歌對于TPU的不斷更新,最新版本已經(jīng)迭代到了TPUV5e,同時(shí)持續(xù)的軟件投HBM,第二則是增加了多卡互聯(lián)的模塊,這一層級的架構(gòu),對應(yīng)上述的原理,主要為了圖表7:TPUV1資料來源:Jouppi,NormanP.,etal."In-datacenterperformanceanalysisofatensorprocessingunit.",國盛證券研究所P.11請仔細(xì)閱讀本報(bào)告末頁聲明圖表8:TPUV1-V2資料來源:ThomasNorrie,NishantPatil,DoeHyunYoon,etal."ThedesignprocessforGoogle'strainingchips:TPUv2andTPUv3.",國盛證券研究所TPUV2基本定型了后續(xù)的架構(gòu),V3、V4圖表9:TPUV4資料來源:googlecloud,國盛證券研究所P.12請仔細(xì)閱讀本報(bào)告末頁聲明圖表10:Groq推理效果對比圖資料來源:Groq,國盛證券研究所ASIC化的必然結(jié)果。我們從Groq芯片的架P.13請仔細(xì)閱讀本報(bào)告末頁聲明圖表11:Groq芯片工作流資料來源:Groq,國盛證券研究所圖表12:TSPSuperlane流水線架構(gòu)資料來源:Groq,國盛證券研究所訪問一次先前的Token,降低了數(shù)據(jù)交互密度,使得無論是訪存IO,亦或是網(wǎng)P.14請仔細(xì)閱讀本報(bào)告末頁聲明也即是矩陣計(jì)算核心。這樣單次運(yùn)算能夠處理的數(shù)據(jù)量就更大,是最簡單和直接的升級P.15請仔細(xì)閱讀本報(bào)告末頁聲明ASIC”戰(zhàn)場——礦機(jī)市場進(jìn)行復(fù)盤,來探尋當(dāng)下和未來,在大模型向何方。供更加強(qiáng)大的算力。同時(shí),由于幣價(jià)的不斷上漲,礦工開始第一次追求專用芯片挖礦,目前全球比特幣計(jì)算幾乎全部由ASIC提圖表13:嘉楠阿瓦隆1366IP.16請仔細(xì)閱讀本報(bào)告末頁聲明第一,以太坊雖然一開始采用了使用挖礦算力來維持網(wǎng)絡(luò)穩(wěn)定的P第三則是以太坊的挖礦算法設(shè)計(jì)之初,就已經(jīng)有意識顯存讀取速度加速提升,英偉達(dá)看到了這一點(diǎn)后加速介入了以太坊挖礦市場,這也造就圖表14:NVIDIACmpHx專業(yè)挖礦專用GPU資料來源:英偉達(dá)官網(wǎng),國盛證券研究所升級始終如一把利劍懸掛在以太坊礦工之上,礦工擔(dān)心自己的礦機(jī)會完全失效,而顯卡P.17請仔細(xì)閱讀本報(bào)告末頁聲明成對于通用芯片的滲透和替換,主要取決于兩點(diǎn),第一,也是最核心的一點(diǎn),用戶的需我們先來看第一點(diǎn),比特幣起步較早,幣價(jià)漲幅較快,因此涌現(xiàn)海量的用戶算力需求,上文提到,客戶需求是芯片廠商的第一目標(biāo),因此比特幣快速完成了對于通用芯片的淘我們再來看第二點(diǎn),算法的確定性,這里要特別強(qiáng)調(diào),算法的確定性,不是算法的難易度。因?yàn)橐粋€(gè)算法即使再復(fù)雜再艱難,只要保持不變,就一定可以開發(fā)出專用的ASIC從而導(dǎo)致開發(fā)者、使用者承受極大的損失。是不是業(yè)界會更加激進(jìn)的尋找下一代算法,亦或是老舊的卷積算法重出江湖?這一不確P.18請仔細(xì)閱讀本報(bào)告末頁聲明個(gè)是決定了用戶需求,一個(gè)是決定了開發(fā)成本。實(shí)現(xiàn)顯卡運(yùn)算單元和指令的契合是一件更加專業(yè)的事,以英偉達(dá)為例,英偉達(dá)的CUDA圖表15:CUDA擴(kuò)大支持多種算法資料來源:英偉達(dá)官網(wǎng),國盛證券研究所5.1推理時(shí)代,更加考驗(yàn)編譯器的“流水線”構(gòu)筑能力構(gòu),跳過了小核心,直接將數(shù)據(jù)存入乘法器中進(jìn)行運(yùn)算,因此對于編譯器的指令調(diào)度能算核和存儲的配合,如何保證這些元器件同時(shí)穩(wěn)定運(yùn)行,保證計(jì)算的確定性,這就需要P.19請仔細(xì)閱讀本報(bào)告末頁聲明圖表16:TSPSuperlane位寬資料來源:Groq,國盛證券研究所圖表17:Groq的研發(fā)歷程年份事件2016年GoogleTPU架構(gòu)師JonathanRoss和TPU團(tuán)隊(duì)的其他成員創(chuàng)立了Groq2020年1月發(fā)布《GROQROCKSNEURALNETWORKS》2020年7月發(fā)布《ThinkFast:ATensorStreamingProcessor(TSP)forAcceleratingDeepLearningWorkloads》2022年6月發(fā)布《ASoftware-definedTensorStreamingMultiprocessorforLarge-scaleMachineLearning》2023年8月發(fā)布《TheGroqSoftware-de?nedScale-outTensorStreamingMultiprocessor》2024年2月因?yàn)镸istral-MOE7*8B500tokens/s真正火起來資料來源:Groq,國盛證券研究所P.20請仔細(xì)閱讀本報(bào)告末頁聲明圖表18:功能單元支持指令資料來源:Groq,國盛證券研究所件底層通過轉(zhuǎn)譯軟件將用戶的“CUDA指令”轉(zhuǎn)化為自身產(chǎn)品能理解的指令,幫助用戶P.21請仔細(xì)閱讀本報(bào)告末頁聲明算第三極。閱讀至此,相信大家對于ASIC在大模型美滿電子在近期的FY24Q4電話會議上表示,預(yù)計(jì)來自云優(yōu)化芯片(cloudoptimized經(jīng)開始投身ASIC芯片的星辰大海。同時(shí)海擁護(hù)這一穩(wěn)定的格局,換取較為輕松的編程壓力,從他們的主觀感受上,日常使用的CUDA和英偉達(dá)帝國似乎是不可戰(zhàn)勝。但是我們也應(yīng)該看到,也有眾多優(yōu)秀的硬P.22請仔細(xì)閱讀本報(bào)告末頁聲明圖表19:ASIC與通用芯片帶動AI螺旋上升資料來源:國盛證券研究所整理P.23請仔細(xì)閱讀本報(bào)告末頁聲明本。晶圓廠的分配地位有望上升。機(jī)芯片的散熱性能直接決定了礦機(jī)的性價(jià)比。礦機(jī)使用者目前是全球大規(guī)模液冷機(jī)房的推薦標(biāo)的:英維克、中航光電、高瀾股份。時(shí),國內(nèi)芯片有望通過ASIC公司加速形成可用大模型算力,從而帶動國內(nèi)推薦標(biāo)的:工業(yè)富聯(lián)、高新發(fā)展、中科曙光、紫光股份。P.24請仔細(xì)閱讀本報(bào)告末頁聲明圖表20:相關(guān)標(biāo)的代碼名稱美元)2024年凈利潤預(yù)測(億元或億美元)ASIC設(shè)計(jì)龍頭MRVL美滿電子646.012.1353.3全球以太網(wǎng)交換機(jī)芯片、ASIC設(shè)計(jì)領(lǐng)先企業(yè)AVGO博通5,726.0228.3425.1全球半導(dǎo)體設(shè)計(jì)龍頭企業(yè)晶圓廠TSM7,104.0313.7522.4全球半導(dǎo)體Fab龍頭INTC英特爾全球最大PC零件及半導(dǎo)體芯片制造商688981中芯國際3,812.167.0256.0國內(nèi)最大的集成電路制造企業(yè)散熱廠商002837英維克201.25.2438.4散熱系統(tǒng)集成商龍頭002179中航光電769.242.32領(lǐng)先的散熱系統(tǒng)商300499高瀾股份43.724.8領(lǐng)先的散熱系統(tǒng)商ASIC芯片公司CAN嘉楠科技3.10.873.6挖礦芯片設(shè)計(jì)商688256寒武紀(jì)812.5//國內(nèi)算力芯片早期參與者688521芯原股份214.00.53403.8國產(chǎn)通用服務(wù)器、協(xié)處理器服務(wù)器龍頭601138工業(yè)富聯(lián)4,968.0259.42服務(wù)器代工龍頭000628高新發(fā)展306.5//子公司華鯤振宇是華為鯤鵬生態(tài)合作伙伴603019中科曙光780.124.3932.0領(lǐng)先的服務(wù)器代工廠資料來源:Wind,彭博,美滿電子官網(wǎng),福布斯中國,BBCNEWS,昆山發(fā)布,中芯國際官網(wǎng),英維克官網(wǎng),深圳市電子商會,高瀾股份官網(wǎng),嘉楠科技官網(wǎng),寒武紀(jì)官網(wǎng),芯原股份官網(wǎng),中證網(wǎng),華鯤振宇官方公眾號,中科曙光公眾號,界面新聞,國盛證券研究所,數(shù)據(jù)截至2024年3月18日,注:美股市值、凈利潤單位均為億美元,其余均為億人民幣;除英維克、嘉楠科技外,美股凈利潤預(yù)測(non-GAAP)均取自彭博一致預(yù)期,A股凈利潤預(yù)測均取自Wind歸母凈利潤一致預(yù)期P.25請仔細(xì)閱讀本報(bào)告末頁聲明(1)AI發(fā)展不及預(yù)期。相關(guān)公司業(yè)績成長空間集中于AI相關(guān)的算力芯片,若AI發(fā)展不及預(yù)期,ASICP.26請仔細(xì)閱讀本報(bào)告末頁聲明免責(zé)聲明國盛證券有限責(zé)任公司(以下簡稱“本公司”)具有中國證監(jiān)會許可的證券投資咨詢業(yè)務(wù)資格。本報(bào)告僅供本公司的客戶使用。本公司不會因接收人收到本報(bào)告而視其為客戶。在任何情況下,本公司不對任何人因使用本報(bào)告中的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。本報(bào)告的信息均來源于本公司認(rèn)為可信的公開資料,但本公司及其研究人員對該等信息的準(zhǔn)確性及完整性不作任何保證。本報(bào)告中的資料、意見及預(yù)測僅反映本公司于發(fā)布本報(bào)告當(dāng)日的判斷,可能會隨時(shí)調(diào)整。在不同時(shí)期,本公司可發(fā)出與本報(bào)告所載資料、意見及推測不一致的報(bào)告。本公司不保證本報(bào)告所含信息及資料保持在最新狀態(tài),對本報(bào)告所含信息可在不發(fā)出通知的情形下做出修改,投資者應(yīng)當(dāng)自行關(guān)注相應(yīng)的更新或修改。本公司力求報(bào)告內(nèi)容客觀、公正,但本報(bào)告所載的資料、工具、意見、信息及推測只提供給客戶作參考之用,不構(gòu)成任何投資、法律、會計(jì)或稅務(wù)的最終操作建議,本公司不就報(bào)告中的內(nèi)容對最終操作建議做出任何擔(dān)保。本報(bào)告中所指的投資及服務(wù)可能不適合個(gè)別客戶,不構(gòu)成客戶私人咨詢建議。投資者應(yīng)當(dāng)充分考慮自身特定狀況,并完整理解和使用本報(bào)告內(nèi)容,不應(yīng)視本報(bào)告為做出投資決策的唯一因素。投資者應(yīng)注意,在法律許可的情況下,本公司及其本公司的關(guān)聯(lián)機(jī)構(gòu)可能會持有本報(bào)告中涉及的公司所發(fā)行的證券并進(jìn)行交易,也可能為這些公司正在提供或爭取提供投資銀行、財(cái)務(wù)顧問
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025個(gè)人住房按揭貸款合同范本
- 2025貨品售賣合同協(xié)議
- 2025年度新能源實(shí)驗(yàn)室氫能技術(shù)研究與應(yīng)用合同3篇
- 2025年度水泥行業(yè)節(jié)能減排合作協(xié)議3篇
- 2025年度數(shù)據(jù)中心基礎(chǔ)設(shè)施安裝合同安裝協(xié)議3篇
- 2025年度養(yǎng)生館特色療法加盟合同協(xié)議書3篇
- 二零二五年度農(nóng)村房屋拆除安全協(xié)議及歷史建筑保護(hù)責(zé)任書
- 二零二五年度生態(tài)農(nóng)業(yè)配套農(nóng)村房屋買賣合作框架協(xié)議3篇
- 2025年度環(huán)保建筑材料合作成立公司合同3篇
- 2025年度建筑材料供貨與古建筑修復(fù)合同3篇
- 體外診斷試劑-C反應(yīng)蛋白(CRP)測定試劑盒(膠乳增強(qiáng)免疫比濁法)臨床評價(jià)報(bào)告-血清
- 八年級物理上冊(滬粵版2024)新教材解讀課件
- 人教版數(shù)學(xué)四上《大數(shù)的認(rèn)識》說課稿
- 氣胸講課課件
- 2024年典型事故案例警示教育手冊15例
- 《植物營養(yǎng)學(xué)》課件
- 河南省鄭州市鄭東新區(qū)2023-2024學(xué)年五年級上學(xué)期期末語文試卷
- 貨源保障協(xié)議書
- JBT 14685-2023 無油渦旋空氣壓縮機(jī) (正式版)
- 2024會計(jì)事務(wù)所保密協(xié)議范本
- TD/T 1031.6-2011 土地復(fù)墾方案編制規(guī)程 第6部分:建設(shè)項(xiàng)目(正式版)
評論
0/150
提交評論