計算機行業(yè)2024年投資策略分析報告:AI商業(yè)化進展聚焦結(jié)構(gòu)亮點_第1頁
計算機行業(yè)2024年投資策略分析報告:AI商業(yè)化進展聚焦結(jié)構(gòu)亮點_第2頁
計算機行業(yè)2024年投資策略分析報告:AI商業(yè)化進展聚焦結(jié)構(gòu)亮點_第3頁
計算機行業(yè)2024年投資策略分析報告:AI商業(yè)化進展聚焦結(jié)構(gòu)亮點_第4頁
計算機行業(yè)2024年投資策略分析報告:AI商業(yè)化進展聚焦結(jié)構(gòu)亮點_第5頁
已閱讀5頁,還剩99頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

計算機行業(yè)2024年中期投資策略把握AI商業(yè)化進展,聚焦結(jié)構(gòu)亮點2024年7月核心觀點

底部特征顯現(xiàn),有望在H2迎來邊際緩和??傮w來看,當(dāng)前計算機公司的估值水平、機構(gòu)持倉水平皆回落至低位區(qū)間;疊加海外流動性中期放松預(yù)期,AI技術(shù)周期與科技政策周期共振,行業(yè)估值具備向上拔升的潛力。

利潤修復(fù)的基礎(chǔ)條件已經(jīng)具備。1)供給端已逐步出清:計算機公司企業(yè)2023年紛紛開始重視內(nèi)部改革和提質(zhì)增效,對人員招聘實施嚴格措施,整體人員和薪酬已得到有效控制;2)需求端部分領(lǐng)域曙光初現(xiàn):計算機具備典型后周期屬性,結(jié)構(gòu)性機會下半年可以重點關(guān)注。部分領(lǐng)域在政策支持、資金配套下,景氣度已開始回暖,“收入-成本”的正向剪刀差或?qū)U大,利潤彈性逐步得到釋放。

從方向選擇看,1)AI仍是明顯的產(chǎn)業(yè)趨勢,算力是兌現(xiàn)度較高的一環(huán),端側(cè)A

I(PC、手機、智駕)可以持續(xù)關(guān)注落地和商業(yè)化進展。2)關(guān)注有明確政策牽引、且已帶動招投標落地的領(lǐng)域,包括能源IT、大交通(低空+車路云)等。3)關(guān)注預(yù)期有政策變革的方向,包括財稅IT、信創(chuàng)、數(shù)據(jù)要素、醫(yī)療IT等。4)關(guān)注中長期景氣度,收并購浪潮或?qū)拥墓I(yè)軟件。

即將進入半年報披露密集期,短期圍繞基本面和業(yè)績兌現(xiàn)進行布局勝率更高,建議輔以自下而上的角度布局績優(yōu)股。

相關(guān)標的:1)算力:海光信息、中科曙光、寒武紀、神州數(shù)碼、工業(yè)富聯(lián)、浪潮信息等;2)能源IT:科遠智慧、國能日新、朗新集團等;3)“大交通”:萊斯信息、千方科技等;4)稅改:稅友股份、博思軟件、中科江南等;5)信創(chuàng):納思達、金山辦公、頂點軟件等;6)數(shù)據(jù)要素:國新健康、拓爾思等;7)工業(yè)軟件:華大九天、寶信軟件、索辰科技等;8)績優(yōu)股:道通科技、銳明技術(shù)、新國都等。

風(fēng)險提示:國際博弈加??;下游需求不及預(yù)期;原材料價格上漲;板塊政策發(fā)生重大變化;研發(fā)進度不及預(yù)期;行業(yè)競爭加劇等。1目

錄一、24H1行情回顧及24H2整體策略1.1

行情復(fù)盤:業(yè)績承壓拖累指數(shù)下行,估值、機構(gòu)持倉回至低位1.2

24Q1業(yè)績回顧:新舊動能轉(zhuǎn)換承壓,季節(jié)性因素被放大1.3

24H2展望:局部曙光初現(xiàn),基本面擇優(yōu)布局二、緊抓創(chuàng)新紅利,關(guān)注AI算力、端側(cè)變化三、圍繞政策牽引,關(guān)注細分賽道結(jié)構(gòu)性機會四、重點公司五、風(fēng)險提示21.1

行情復(fù)盤:業(yè)績承壓拖累板塊下行

2024年春節(jié)后,受益于Sora文生視頻大模型的計算機指數(shù)相對滬深300走勢發(fā)布及政府工作報告首提“低空經(jīng)濟”等催化,計算機行業(yè)跟隨市場開啟一輪反彈;從3月下旬開始,指數(shù)受板塊內(nèi)公司一季度業(yè)績表現(xiàn)不佳拖累,開啟震蕩下行。計算機(申萬)滬深30010%5%0%

截至6月30日,申萬計算機指數(shù)年初至今下跌24.9%,跑輸滬深300指數(shù)約25.8個百分點,居于全行業(yè)30/31。-5%-10%-15%-20%-25%-30%-35%

板塊內(nèi)漲幅前三分別為萊斯信息(+72.4%)、榮科科技(+49.9%)、淳中科技(+43.8%);跌幅前三分別為*ST銀江(-79.6%)、ST英飛拓(-77.8%

)、*ST左江(

-75.9%

)。24/124/224/324/424/524/6年初至今申萬一級指數(shù)漲跌幅計算機行業(yè)漲跌幅前十個股20%10%100%80%60%40%0%20%-10%-20%0%-20%-40%-60%-80%-100%-30%-40%-24.9%銀

電行

子基

農(nóng)

環(huán)

醫(yī)

綜礎(chǔ)

貿(mào)

合萊斯信息榮科科技淳中科技理工能科萬集科技德明利思維列控銳明技術(shù)納思達紫光股份同輝信息安恒信息古鰲科技事

金業(yè)

屬運輸裝

金飾

融化

設(shè)工

備護

設(shè)

產(chǎn)

生理

物服

機務(wù)

售匯金證通易聯(lián)眾峽創(chuàng)英飛拓龍宇左江銀江數(shù)據(jù):Wind,西南證券整理31.1

行情復(fù)盤:估值低于中樞水平,持倉比例回到低位

橫向看:截至2024年6月30日,計算機行業(yè)PE(TTM,整體法,剔除負值)為34倍,在申萬一級行業(yè)中處于較高水平,市場仍持續(xù)認可其成長性。申萬一級行業(yè)市盈率(TTM整體法)504540353025201510534

縱向看:計算機指數(shù)PE過去十年中位數(shù)水平49倍,經(jīng)過近幾個月回調(diào),當(dāng)前計算機PE大幅低于過去十年中位數(shù),具備一定的配置價值。

從公募基金持倉看,2024Q1計算機行業(yè)基金重倉股合計市值為725.0億元,環(huán)比下滑30.3%;占行業(yè)總市值比例為2.78%,環(huán)比下滑0.78pp,配置比例回至低位。0電

環(huán)

醫(yī)

農(nóng)

機子

礎(chǔ)

貿(mào)

械通

銀信

行機生

牧物

漁材

服料

務(wù)護理金

產(chǎn)

設(shè)

設(shè)屬

業(yè)

備制

電造

器裝飾申萬計算機市盈率(TTM整體法)計算機行業(yè)基金持倉市值情況2000180016001400120010008005.5%5.0%4.5%4.0%3.5%3.0%2.5%2.0%1.5%1.0%5.0%5.0%16014012010080計

算機

(申萬

)50中位數(shù)4.0%3.9%3.6%3.1%3.0%2.8%

2.9%2.7%2.8%2.6%2.6%60600400402002000計

算機行

業(yè)基金

持倉市

值情況

(億元

)占

行業(yè)總

市值比

重(右

軸)數(shù)據(jù):Wind,西南證券整理41.2

24Q1收入回顧:板塊復(fù)蘇分化,龍頭公司收入韌性更強

2024Q1營收端小幅增長,主要系龍頭公司帶動2024Q1,計算機板塊整體實現(xiàn)營收2428.5億元,同比增長5.3%,增速相較23Q1(同比-1.2%)顯著改善。從中位數(shù)角度看,2024Q1營收增速的中位數(shù)為2.5%,低于整體法,表明一季度龍頭公司收入端增長韌性更強。從增速的分布看,2024Q1營收增速大于50%的有26家,小于0%的有141家,增速區(qū)間同環(huán)比均有下移,板塊復(fù)蘇分化較大。計算機板塊2020Q1-2024Q1營收及增速板塊2024Q1收入增速情況300040%20Q121Q136.0%25.7%22Q116.8%8.9%23Q1-1.2%6.8%24Q15.3%2.5%36.0%2428.5營收增速(整體法)30%-18.4%25002000150010005002334.32306.71997.820%營收增速(中位數(shù)法)

-5.0%16.8%10%1469.05.3%大于50%

30%-50%

10%-30%

0%-10%

小于0%0%-1.2%-10%-20%-30%2023Q1營收yoy2023Q4營收yoy2024Q1營收yoy393726332820716967695478120144141-18.4%02020Q12021Q12022Q12023Q12024Q1營業(yè)收入(左軸,億元)同比增速(右軸)數(shù)據(jù):Wind,西南證券整理51.2

24Q1成本費用回顧:毛利端有所承壓,研發(fā)繼續(xù)加碼

行業(yè)內(nèi)卷導(dǎo)致毛利率承壓,企業(yè)繼續(xù)加碼研發(fā)搶占AI時代高地2024Q1,行業(yè)整體毛利率為34.3%,同比下滑2.0pp,中位數(shù)法和平均值法下的毛利率與整體法差距較大,均呈下降趨勢,我們認為主要系近兩年下游客戶IT開支收緊,信息系統(tǒng)建設(shè)項目內(nèi)卷嚴重所致。2024Q1,計算機板塊整體研發(fā)費用達266.4億元,同比增長3.1%;研發(fā)費用率(整體法)/(中位數(shù)法)/(平均值法)分別為11.0%、16.1%、27.4%,其中平均值法和中位數(shù)法下研發(fā)費用率提升明顯,表明中小企業(yè)在收入承壓的情況下繼續(xù)加碼研發(fā)投入,力求借助本輪技術(shù)變革搶占新一輪戰(zhàn)略高地。計算機板塊2020Q1-2024Q1毛利率情況計算機板塊2020Q1-2024Q1研發(fā)費用率情況42%40%38%36%34%32%30%30%40.6%40.5%38.6%39.8%37.1%27.4%38.9%38.3%25%20%15%10%5%24.7%24.6%38.2%36.3%37.4%37.0%20.6%19.9%35.1%16.1%11.0%14.8%10.1%15.0%11.2%34.4%33.8%34.3%12.8%9.7%11.8%10.1%2

020Q

12

021Q

12

022Q

12

023Q

12

024Q

12020Q12021Q12022Q12023Q12024Q1研

發(fā)費用

率(整

體法)研

發(fā)費用

率(中

位數(shù)法

)研

發(fā)費用

率(平

均值法

)毛

利率(

整體法

)毛

利率(

中位數(shù)

法)毛

利率(

平均值

法)數(shù)據(jù):Wind,西南證券整理61.3

美聯(lián)儲降息預(yù)期升溫,宏觀壓制要素逐步清退

行業(yè)走勢與流動性環(huán)境強相關(guān)。成長股的久期更長,對內(nèi)外流動性環(huán)境更加敏感,計算機公司作為成長賽道主力軍,呈現(xiàn)明顯的利率敏感型資產(chǎn)特征。

歐元區(qū)已開始降息。6月6日,歐洲央行降息25個基點,將三大利率分別降至4.25%、3.75%、4.50%,為歷時接近兩年的加息周期劃上句號,也為2019年以來首次降息,是G7成員國中第二個降息的央行。

美國部分數(shù)據(jù)轉(zhuǎn)弱。當(dāng)前美國仍處于歷史最長的加息周期當(dāng)中,但近期公布的ISM制造業(yè)指數(shù)、ADP就業(yè)人數(shù)等均不及市場預(yù)期,顯示下半年美國經(jīng)濟或?qū)⒂兴D(zhuǎn)弱。根據(jù)芝加哥商品交易所的“美聯(lián)儲觀察工具”數(shù)據(jù),美國到9月累計降息25基點的概率為70.8%。1990年來美國聯(lián)邦基金目標利率走勢9.08.07.06.05.04.03.02.01.00.0美

國:聯(lián)邦基

金目標

利率(%)數(shù)據(jù):Wind,西南證券整理71.3

科技支持政策加碼,科創(chuàng)資金活水注入

新“國九條”出臺強調(diào)分紅與公司質(zhì)地,計算機行業(yè)中小市值公司占比較高,短期市場情緒受影響較大;但隨之出臺的“科企16條”、“科八條”等,對科技企業(yè)的融資、收并購等提出支持性舉措;同時大基金三期、科技再貸款等為企業(yè)提供關(guān)鍵資金支持。

4月19日,證監(jiān)會制定了《資本市場服務(wù)科技企業(yè)高水平發(fā)展的十六項措施》,從上市融資、并購重組、債券發(fā)行、私募投資等全方位提出支持性舉措,進一步健全資本市場功能,優(yōu)化資源配置,更大力度支持科技企業(yè)高水平發(fā)展,促進新質(zhì)生產(chǎn)力發(fā)展。

5月31日,求是網(wǎng)發(fā)布發(fā)言稿《發(fā)展新質(zhì)生產(chǎn)力是推動高質(zhì)量發(fā)展的內(nèi)在要求和重要著力點》,提出大力推進科技創(chuàng)新,以科技創(chuàng)新推動產(chǎn)業(yè)創(chuàng)新等五大關(guān)鍵點。

6月19日,證監(jiān)會發(fā)布《關(guān)于深化改革服務(wù)科技創(chuàng)新和新質(zhì)生產(chǎn)力發(fā)展的八條措施》(以下簡稱《八條措施》),特別強調(diào)優(yōu)先支持新產(chǎn)業(yè)新業(yè)態(tài)新技術(shù)領(lǐng)域突破關(guān)鍵核心技術(shù)的“硬科技”企業(yè)在上市,更大力度支持并購重組。

6月25日,中共中央政治局丁薛祥首次作為中央科技委員會主任出席全國科技大會并發(fā)言,強調(diào)“要以新型舉國體制推進科技創(chuàng)新,找準重大攻關(guān)任務(wù),凝聚力量協(xié)同攻堅,夯實基礎(chǔ)研究根基,加快關(guān)鍵核心技術(shù)攻關(guān)”。近期科技領(lǐng)域加大資金投入時間事件主要內(nèi)容為系統(tǒng)解決強國建設(shè)、民族復(fù)興進程中一些重大項目建設(shè)的資金問題,從今年開始擬連續(xù)幾年發(fā)行超長期特別國債,專項用于國家重大戰(zhàn)略實施和重點領(lǐng)域安全能力建設(shè),今年先發(fā)行1萬億元。5月13日萬億超長期特別國債發(fā)行5月24日6月14日大基金三期成立注冊資本達3440億元,超過第一期的987.2億元和第二期的2041.5億元首筆科技創(chuàng)新貸款已發(fā)放,首批有近7000家符合條件的企業(yè);央行和科技部正在組織開展第二批32萬余家科技型企業(yè)的創(chuàng)新積分評價,后續(xù)其他貸款將陸續(xù)投放科技再貸款加速落地數(shù)據(jù):Wind,西南證券整理81.3

從宏觀維度認識新質(zhì)生產(chǎn)力——AI與大數(shù)據(jù)

當(dāng)前階段,新質(zhì)生產(chǎn)力成為推動高質(zhì)量發(fā)展的內(nèi)在要求和重要著力點。

數(shù)據(jù)作為新型生產(chǎn)要素,不僅能夠直接參與生產(chǎn),還能夠促進其他生產(chǎn)要素的投入并賦能其他要素,產(chǎn)生乘數(shù)效應(yīng)。

本輪AIGC大模型的突破,是第三次工業(yè)革命以來新一輪的通用技術(shù)創(chuàng)新,有望解放勞動力,實現(xiàn)對千行百業(yè)的賦能。1201008060402002020sAI與大數(shù)據(jù)2000s移動互聯(lián)網(wǎng)1980sPC與互聯(lián)網(wǎng)1970s信息技術(shù)全球GDP(現(xiàn)價,萬億美元)數(shù)據(jù):

Worldbank,西南證券整理91.3

行業(yè)內(nèi)生經(jīng)營提質(zhì),關(guān)注需求復(fù)蘇帶來的業(yè)績彈性

計算機行業(yè)后周期屬性明顯,但伴隨企業(yè)進行人員及費用管控,利潤修復(fù)的基礎(chǔ)條件已經(jīng)具備。

行業(yè)供給正出清,人效拐點或?qū)⒌絹怼?023年板塊內(nèi)公司員工人數(shù)逐步調(diào)整,后續(xù)期間費用率有望得到有效控制。經(jīng)營現(xiàn)金流凈額大幅增長,經(jīng)營質(zhì)量有所改善。2023年板塊內(nèi)公司經(jīng)營現(xiàn)金流凈額為662.9億元,同比增長33.9%,回款情況逐步好轉(zhuǎn)。

部分領(lǐng)域訂單有所恢復(fù),Q3起有望逐季報表兌現(xiàn)。分板塊看,年初至今部分領(lǐng)域訂單已初現(xiàn)修復(fù)跡象,例如電力IT、醫(yī)療IT、工業(yè)軟件等,考慮項目周期,預(yù)期將于Q3/Q4逐季開始兌現(xiàn)進報表。計算機板塊員工總數(shù)情況計算機板塊經(jīng)營現(xiàn)金流凈額情況14012010080604020027.2%30%25%20%15%10%5%1000900800700600500400300200100080%119.2119.1115.412.9%60%102.19.7%93.140%84.275.112.0%20%14.7%65.510.7%51.50%3.4%-20%-40%-60%-0.1%20230%-5%20152016201720182019202020212022201520162017201820192020202120222023員工總數(shù)(左軸,萬人)同比增速(右軸)經(jīng)營現(xiàn)金流凈額(左軸,億元)同比增速(右軸)數(shù)據(jù):工信部,Wind,西南證券整理

101.3

核心觀點

底部特征顯現(xiàn)??傮w來看,當(dāng)前計算機公司的估值水平、機構(gòu)持倉水平皆回落至低位區(qū)間;疊加海外流動性中期放松預(yù)期,AI技術(shù)周期與科技政策周期共振,行業(yè)估值具備向上拔升的潛力。

利潤修復(fù)的基礎(chǔ)條件已經(jīng)具備。1)供給端已逐步出清:計算機公司企業(yè)2023年紛紛開始重視內(nèi)部改革和提質(zhì)增效,整體人員和薪酬已得到有效控制;2)需求端,部分領(lǐng)域曙光初現(xiàn):計算機具備典型后周期屬性,結(jié)構(gòu)性機會可以。部分領(lǐng)域在政策支持、資金配套下,景氣度已開始回暖,“收入-成本”的正向剪刀差或?qū)U大,利潤彈性逐步得到釋放。

從方向選擇看,1)AI仍是明顯的產(chǎn)業(yè)趨勢,算力是兌現(xiàn)度較高的一環(huán),端側(cè)AI(PC、手機、智駕)可以持續(xù)關(guān)注落地和商業(yè)化進展。2)關(guān)注有明確政策牽引、且已帶動招投標落地的領(lǐng)域,包括能源IT、大交通(低空+車路云)等。3)關(guān)注預(yù)期有政策變革的方向,包括財稅IT、信創(chuàng)、數(shù)據(jù)要素、醫(yī)療IT等。4)關(guān)注中長期景氣度,收并購浪潮或?qū)拥墓I(yè)軟件。

考慮到目前宏觀環(huán)境,疊加即將進入半年報披露密集期,短期圍繞基本面和業(yè)績兌現(xiàn)進行布局勝率更高,建議輔以自下而上的角度布局績優(yōu)股。

相關(guān)標的:1)算力:海光信息、中科曙光、寒武紀、神州數(shù)碼、工業(yè)富聯(lián)、浪潮信息等;2)能源IT:科遠智慧、國能日新、朗新集團等;3)“大交通”:萊斯信息、千方科技等;4)稅改:稅友股份、博思軟件、中科江南等;5)信創(chuàng):納思達、金山辦公、頂點軟件等;6)數(shù)據(jù)要素:國新健康、拓爾思等;7)工業(yè)軟件:華大九天、寶信軟件、索辰科技等;8)績優(yōu)股:道通科技、銳明技術(shù)、新國都等。11目

錄一、24H1行情回顧及24H2整體策略二、緊抓創(chuàng)新紅利,關(guān)注AI算力、端側(cè)變化2.1

算力景氣度持續(xù)高企,關(guān)注國產(chǎn)芯片補缺2.2

底層模型能力上限不斷提升,三大優(yōu)化方向加速迭代2.3

大模型終端硬件革新,關(guān)注端側(cè)AI變化(PC、手機、智駕)三、圍繞政策牽引,關(guān)注細分賽道結(jié)構(gòu)性機會四、重點公司五、風(fēng)險提示122.1

Scaling

Law持續(xù)有效,算力需求未至天花板

算力是大模型取得更高性能的核心:隨著參數(shù)量與數(shù)據(jù)量的同步擴大,模型效果會出現(xiàn)“涌現(xiàn)”。從目前已經(jīng)發(fā)布的大模型和頭部廠商的研發(fā)方向來看,“大力出奇跡”仍是主要優(yōu)化方向之一,Scaling

Law的上限還遠未達到。

多模態(tài)大模型對于算力的需求更高:多模態(tài)大模型需要接受文字、圖像、語音等不同類型的數(shù)據(jù)處理,涉及到的非結(jié)構(gòu)化數(shù)據(jù)較多,算法亦更為復(fù)雜,在訓(xùn)練和推理階段相較文本類的LLM,消耗的算力更多。伴隨OpenAI、谷歌、百度等紛紛投入多模態(tài)大模型的研發(fā),后續(xù)有望持續(xù)帶動算力的需求增長。大模型對于算力的需求每2個月翻倍Sora在不同算力支持下的視頻生成效果數(shù)據(jù):《Scaling

Laws

for

Neural

Language

Models》,Nature,西南證券整理

132.1

海外大廠Capex指引樂觀,算力景氣度持續(xù)驗證

Microsoft:24Q1資本開支140億美元(包含31.5億融資租賃),同比+79%,環(huán)比+22%,預(yù)期資本支出將逐季增加。

Google:24Q1資本開支120億美元,同比+91%,環(huán)比+9%,預(yù)期每季度資本開支保持在Q1水平或以上。

Amazon:24Q1資本開支139億美元,同比+6%,環(huán)比+4%,預(yù)期后續(xù)三個季度資本支出比24Q1更高。

Meta:24Q1資本開支67億美元(包含3億融資租賃),同比-6%,環(huán)比-15%,上調(diào)24年全年資本支出至350-400億美元(此前為300-370億美元)。海外互聯(lián)網(wǎng)大廠Capex情況(億美元)2023年H100客戶采購量500450400350300250200150100506779926877955555139456410469711344748441133998137

141154148

16515013134661301201403754132

112110826868986376686378557364687366565854555955546039107

112

115877460020Q1

20Q2

20Q3

20Q4

21Q1

21Q2

21Q3

21Q4

22Q1

22Q2

22Q3

22Q4

23Q1

23Q2

23Q3

23Q4

24Q1MicrosoftGoogleAmazonMeta數(shù)據(jù):各公司財報,Omidia,西南證券整理

142.1

英偉達業(yè)績超預(yù)期,架構(gòu)快速迭代

英偉達開啟“Ti

ck-Tock”一年一迭代的更新周期

2023年11月,英偉達發(fā)布人工智能芯片H200,針對超大規(guī)模的大模型訓(xùn)練和推理進行顯存升級,首次采用HBM3e,顯存容量達到141GB,顯存帶寬達到4.8TB/s。

2024年3月,英偉達發(fā)布全新Blackwell架構(gòu)的芯片系列,除了工藝迭代、HBM升級、雙die設(shè)計外,還內(nèi)置第二代Tra

nsformer引擎,采用“降精度、提性能”的方式,首度引入FP4新格式,峰值算力達到40PFLOPS。

2024年6月,英偉達表示將開啟一年一更新的迭代周期,將在25/26/27年分別推出BlackwellUltra、Rubin、Rubin

Ultra架構(gòu),其中在2026年推出的下一代AI芯片平臺Rubin,預(yù)計將采用HBM4和3nm工藝。8年間英偉達單卡性能提升1000倍B系列與H系列芯片性能對比數(shù)據(jù):

英偉達,半導(dǎo)體行業(yè)觀察,The

Next

Platform,西南證券整理

152.1

英偉達業(yè)績超預(yù)期,架構(gòu)快速迭代

英偉達Q1業(yè)績超預(yù)期,后續(xù)指引仍然樂觀

英偉達24Q1實現(xiàn)收入260億美元,同比增長262%,環(huán)比增長19%,高于市場246億美元的指引;其中數(shù)據(jù)中心業(yè)務(wù)實現(xiàn)收入226億美元,同比增長427%,環(huán)比增長23%,同樣超出市場預(yù)期的221億美元。

公司預(yù)期24Q2實現(xiàn)收入280億美元(上下浮動2%),強于市場預(yù)期的268億美元。

公司表示,當(dāng)前B系列芯片已經(jīng)全面投入生產(chǎn),預(yù)計將在Q2發(fā)貨、Q3加速、Q4投放至數(shù)據(jù)中心,消除市場對于H、B代際切換的擔(dān)憂。

根據(jù)SemiAnalysis,英偉達有望在未來幾個月交付超過100萬顆H20芯片,考慮單顆芯片售價1.2-1.3萬美元,2024年全年或可貢獻超過120億美元營收。英偉達總收入情況英偉達中國大陸地區(qū)收入情況30025020015010050300%250%200%150%100%50%4540353025201510540.327.424.920.819.516.015.911.59.50%00-50%22Q122Q222Q322Q423Q123Q223Q323Q424Q122Q122Q222Q322Q423Q123Q223Q323Q424Q1營業(yè)收入(億美元,左軸)同比增速(右軸)環(huán)比增速(右軸)中國區(qū)收入(億美元,左軸)數(shù)據(jù):

英偉達,Semianalysis,西南證券整理

162.1

算力需求結(jié)構(gòu)向推理傾斜

伴隨模型的逐步成熟和應(yīng)用的落地投產(chǎn),算力需求的重心向推理轉(zhuǎn)移。

根據(jù)英偉達,2023年大約40%的數(shù)據(jù)中心收入來自AI推理。

根據(jù)IDC、浪潮信息聯(lián)合發(fā)布的《2023-2024年中國人工智能計算力發(fā)展評估報告》,2023年國內(nèi)AI服務(wù)器工作負載中訓(xùn)練:推理的占比約為6:4;到2027年,用于推理的工作負載將達到72.6%。

幻方DeepSeek-V2發(fā)布創(chuàng)新性ML

A架構(gòu),開啟國內(nèi)大模型API降價浪潮;而推理成本的降低有望進一步吸引開發(fā)者加入促進生態(tài)的繁榮,拉動大模型推理側(cè)的需求。訓(xùn)練與推理的原理2022-2027年中國AI服務(wù)器工作負載及預(yù)測100%90%80%70%60%50%40%30%20%10%0%41.3%58.4%67.7%68.8%70.5%72.6%58.7%41.6%202232.3%2024E31.2%2025E29.5%2026E27.4%2027E2023E訓(xùn)練推理數(shù)據(jù):英偉達,幻方,IDC,浪潮信息,西南證券整理

172.1

推理場景用量提升,關(guān)注ASIC份額提升機遇

算力開支高成本,科技巨頭加速自研。近年來,海內(nèi)外各大互聯(lián)網(wǎng)廠商紛紛自研芯片,雖然綜合性能,尤其是算力和帶寬,較英偉達仍有一定差距,但更多面向特定領(lǐng)域任務(wù)進行優(yōu)化,在功耗和成本方面優(yōu)勢明顯。

伴隨推理場景的鋪開,AISC市占率有望快速提升。根據(jù)Marvell,其2023年數(shù)據(jù)中心TAM為210億美元,其中加速定制計算為66億美元;預(yù)計2028年加速定制計算TAM將達到429億美元,CAGR為45%。各大廠自研AI芯片和CPU產(chǎn)品情況AI芯片布局廠商芯片GoogleCloudTPU

v5eAmazonMetaMTIA

v1TeslaDojo

D12021年第一代MicrosoftAzure

Maia

1002023年11月16日第一代AWSInferentia2

AWSTrainium推出時間代際2023年8月29日2019年第二代2022年第一代2023年5月18日第一代第五代最多允許256個芯片互連,總7nm;內(nèi)部內(nèi)存可以從128MB擴展到128GB7nm;500

億個晶體管;工藝&制程

帶寬超過400

Tb/s,INT8性能達到100petaOps5nm5

nanometer5nm;1050億個晶體管400W

TDP專門用于云端訓(xùn)練和推理;支持MicrosoftAzure

OpenAI服務(wù)和MicrosoftCopilot(BingChat)等應(yīng)用產(chǎn)品專用于大中型訓(xùn)練與推理;支訓(xùn)練芯片;用于搭建TeslaDojo超算平臺,以支持自動駕駛和機器人業(yè)務(wù)用途持Google

cloud和聊天機器人Bard等應(yīng)用產(chǎn)品推理芯片訓(xùn)練芯片推理芯片CPU芯片布局廠商芯片名稱推出時間代際GoogleAmazonGraviton3MicrosoftCypress預(yù)計2025年部署上線第一代MapleAzure

Cobalt1002023年11月16日預(yù)計2025年部署上線第一代2021年第三代第一代工藝&制程5nm;基于Arm5nm;基于Arm5nm;550億個晶體管5nm;基于Arm;128核自研用于運營數(shù)據(jù)中心的PlanA

處理器自研用于運營數(shù)據(jù)中心的PlanB

處理器旨在用于執(zhí)行常規(guī)計算任務(wù),如為微軟Teams提供動力;暫時沒有銷售計劃,更傾向于供內(nèi)部使用用途云原生通用處理器數(shù)據(jù):The

information,Marvell,各公司官網(wǎng),西南證券整理

182.1

國產(chǎn)芯片補缺

各省市印發(fā)算力建設(shè)規(guī)劃:算力已上升為國家戰(zhàn)略資源之一,多地印發(fā)算力基礎(chǔ)設(shè)施建設(shè)規(guī)劃,提出實現(xiàn)算力調(diào)度和交易,構(gòu)建公共算力平臺。

上海:到2025年,本市數(shù)據(jù)中心算力超過18000PFLOPS(FP32),新建數(shù)據(jù)中心綠色算力占比超過10%,集聚區(qū)新建大型數(shù)據(jù)中心綜合PUE降至1.25以內(nèi),綠色低碳等極達到4A級以上。

深圳:建設(shè)城市級智能算力平臺,整合深圳市算力資源,建設(shè)城市級算力統(tǒng)籌調(diào)度平臺,實現(xiàn)“算力一網(wǎng)化、統(tǒng)籌一體化、調(diào)度一站式”

北京:按照集約高效原則,分別在海淀區(qū)、朝陽區(qū)建設(shè)北京人工智能公共算力中心、北京數(shù)字經(jīng)濟算力中心。在人工智能產(chǎn)業(yè)聚集區(qū)新建或改建升級一批人工智能商業(yè)化算力中心,加強國產(chǎn)芯片部署應(yīng)用,推動自主可控軟硬件算力生態(tài)建設(shè)。省市時間文件要求到2023年底,數(shù)據(jù)中心在營標準機柜95萬架,算力總規(guī)模20EFLOPS;到2025年,數(shù)據(jù)中心在營標準機柜165萬架,算力總規(guī)為35EFLOPS河北2023.01《加快建設(shè)數(shù)字河北行動方案》到2023年,標準機架25萬架,大型/超大型數(shù)據(jù)中心數(shù)量20個,算力總規(guī)模2EFLOPS;到2025年,標準機架80萬架,大型/超大型數(shù)據(jù)中心數(shù)量26個,算力總規(guī)模10EFLOPS;貴州上海北京2023.32023.042023.05《面向全國的算力保障基地建設(shè)規(guī)劃》到2023年底,可調(diào)度智能算力達到1000PFLOPS(FP16)以上;到2025年,數(shù)據(jù)中心算力超過18000PFLOPS(FP32)《上海市推進算力資源同意調(diào)度指導(dǎo)意見》按照集約高效原則,分別在海淀區(qū)、朝陽區(qū)建設(shè)北京人工智能公共算力中心、北京數(shù)字經(jīng)濟算力中心。在人工智能產(chǎn)業(yè)聚集區(qū)新建或改建升級一批人工智能商業(yè)化算力中心,加強國產(chǎn)芯片部署應(yīng)用《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023-2025年)》《深圳市加快推動人工智能高質(zhì)量發(fā)展高水建設(shè)城市級智能算力平臺,打造大灣區(qū)智能算力樞紐,建設(shè)企業(yè)級智能算力平臺深圳2023.05平應(yīng)用行動方案(2023-2024年)》數(shù)據(jù):各政府官網(wǎng),西南證券整理

192.1

國產(chǎn)芯片補缺

當(dāng)前國內(nèi)海光信息、寒武紀、、燧原、壁仞等一二線廠商推出的推理端AI芯片已基本達到可用狀態(tài);訓(xùn)練端芯片雖然較H100性能還有顯著差距,但已在國家智算中心得到廣泛應(yīng)用,并且已與多數(shù)互聯(lián)網(wǎng)大廠展開適配合作,生態(tài)成熟度有望進一步追趕。公司GPU工藝海光深算一號7nm寒武紀MLU370-X87nm百度昆侖芯R2007nm阿里壁仞科技BR1007nm燧原科技云燧T20&i2012nm天數(shù)智芯天垓1007nm摩爾線程春曉含光800(NPU)昇騰9107nm12nm7nm4096

core(64CUs)1.5

GHz(FP64)1.7GHz(FP32)1024TFLOPS@BF1637

TFPLOPS@FP32147TFLOPS@FP16/BF16支持INT32

INT15多精度混合訓(xùn)練32

TFLOPS@FP32128TFLOPS@TF32128TFLOPS@FP16/BF16256TOPS/INT896

TFLOPS@FP1696

TFLOPS@BF16320TFLOPS@FP16

128TFLOPS@FP1614.4算力功耗78563

IPS

支持FP32、BF16、FP16、INT8等主流數(shù)據(jù)精度640

TOPS@INT8256TOPS@INT8TFLOPS@FP32國內(nèi)唯一同時支持全精

256

TOPS

@

INT8度和半精度訓(xùn)練的加速計算芯片300W

TDP&150WTDP350W

TDP75W

TDP310W

TDP120W

TDP--550W

TDP250W

板級功耗255W

TDPPCIe4.0

×

16

lane共享64GB/s

主控雙向帶寬共享64GB/s

片間互聯(lián)帶寬PCIe4.0

×

16

lane集成HCCS、PCIe5.0

×

16

lane

PCIe4.0

×

16

lanePCIe5.0

×

16接口

xGMI×

2,

最高184

PCIe4.0

×

16

lanePCIe

4.0、RoCE

PCIe4.0

×

16

laneCXL2.0300GB/s片間互聯(lián)laneGB/sv2云端訓(xùn)練&推理,終端圖形渲染深度學(xué)習(xí)、云端通用計算用途云端訓(xùn)練&推理云端訓(xùn)練&推理云端訓(xùn)練云邊端通用云端推理云端訓(xùn)練云端訓(xùn)練數(shù)據(jù):,寒武紀,壁仞科技等公司官網(wǎng),芯東西,西南證券整理202.1

國產(chǎn)芯片補缺

昇騰處理器訓(xùn)練推理均有布局

昇騰310:2018年發(fā)布,主要用于推理,主打高能效,在典型配置下可以輸出16TOPS@INT8,8TFLOPS@FP16,功耗僅為8W。

昇騰910:2019年發(fā)布,主要用于訓(xùn)練,主打高算力,支持云邊端全棧場景應(yīng)用。在典型配置下可以輸出320TFLOPS@FP16,640

TOPS@INT8,功耗為310W。

以上兩顆芯片均采用自研的達芬奇架構(gòu),通過獨創(chuàng)的16*16*16*16的3D

Cube設(shè)計,每時鐘周期可以進行4096個16位半精度浮點MAC運算,整個AI

Core可以看成是一個相對簡化的微處理器架構(gòu),包含計算、存儲、控制單元,并含有指令流水線的設(shè)計,是構(gòu)。面向AI計算專門設(shè)計的NP

U架

關(guān)注昇騰新款芯片迭代進度。昇騰310、910關(guān)鍵參數(shù)昇騰芯片實物圖數(shù)據(jù):海思官網(wǎng),《昇騰計算產(chǎn)業(yè)發(fā)展白皮書》,新華網(wǎng),集成電路IC,西南證券整理

212.1

國產(chǎn)芯片補缺

與主流海外訓(xùn)練芯片對比:

昇騰910在INT8、FP16等算力精度下的性能表現(xiàn)超過V100,可對標A100,暫不支持FP32單精度及FP64雙精度算力格式。

在互聯(lián)方面,昇騰處理器集成了HCCS、PCIE

4.0、RoCE

v2接口,不如英偉達但應(yīng)與AM

D等相當(dāng),7月最新發(fā)布了萬卡集群測試,6月支持單機8000卡商用,計劃年底或者明年初超過16000張卡。當(dāng)前,1750億的大模型,半天就能訓(xùn)練完成。公司GPU工藝英偉達V100英偉達A1007nm英偉達H1005nmAMDMI100GoogleTPU

V47nm昇騰910昇騰3107nm12nm12nm7nm9.7

TFLOPS@FP6419.5

TFLOPS@FP3226

TFLOPS@FP6451

TFLOPS@FP3211.5

TFLOPS@FP647

TFLOPS@FP6414

TFLOPS@FP3262

TOPS@INT8320

TFLOPS@FP16

8

TFLOPS@FP1623.1

TFLOPS@FP32

275

TFLOPS@BF16算力640

TOPS@INT816

TOPS@INT8312

TFLOPS@FP16

756.5

TFLOPS@FP16

184.6

TFLOPS@FP16

275

TOPS@INT8624

TOPS

@INT81513

TOPS

@INT8184.6

TOPS

@INT8功耗310W

TDP-8W

TDP-250W

TDP300W

TDP300-350W

TDP300W

TDP300W

TDP300GB/SNV

Link

300GB/SPCIE32GB/SNV

Link600GB/SPCIE4.0

64GB/SNV

Link

600GB/SPCIE5.0

128GB/S互聯(lián)帶寬PCIE4.0

64GB/S數(shù)據(jù):海思官網(wǎng),英偉達官網(wǎng),AMD官網(wǎng),谷歌官網(wǎng),西南證券整理

222.1

國產(chǎn)芯片補缺整機伙伴應(yīng)用軟件伙伴一體機伙伴數(shù)據(jù):昇騰社區(qū)官網(wǎng),西南證券整理232.1

國產(chǎn)芯片補缺

海光DCU在落地、生態(tài)、造血等方面具備多重優(yōu)勢,深算二號性能大幅提升有望脫穎而出。

海光DCU是國內(nèi)唯一同時支持全精度和半精度訓(xùn)練的加速計算芯片。

公司深算二號在2023年9月發(fā)布,性能比起上一代產(chǎn)品翻倍提升,并且兼容“類CUDA”環(huán)境,軟硬件生態(tài)豐富,當(dāng)前已在各地智算中心落地應(yīng)用,對部分英偉達產(chǎn)品實現(xiàn)了良好替代,有望深度受益于下游AI算力的需求爆發(fā)。

深度參與“東數(shù)西算”先進計算中心、“新基建”智算中心的建設(shè),與大股東中科曙光深入?yún)f(xié)同,打造國產(chǎn)算力底座。

關(guān)注海光DCU新款芯片迭代進度,訓(xùn)練性能有望明顯提升。海光DCU提供完善軟件棧支持數(shù)據(jù):海光信息,西南證券整理242.1

國產(chǎn)芯片補缺

寒武紀云邊端業(yè)務(wù)線協(xié)同發(fā)力,競爭力不斷加強。

云端產(chǎn)品:當(dāng)前寒武紀已推出三代云端智能加速卡,包括訓(xùn)練芯片思元290和推理芯片思元100、思元270、思元370;其中思元370在數(shù)家頭部互聯(lián)網(wǎng)企業(yè)完成視覺、語音、圖文識別、自然語言處理等場景下的適配工作,已于2022年開始批量出貨實現(xiàn)收入突破,并進一步在金融、運營商等行業(yè)實現(xiàn)落地。

邊緣產(chǎn)品:思元220邊緣加速卡,自發(fā)布以來累計銷量突破百萬片。

終端產(chǎn)品:1A、1H、1M系列智能處理器IP已集成于超過1億臺智能手機及其他智能終端設(shè)備。

公司新一代智能處理器微架構(gòu)和指令集正在研發(fā)中,對大模型訓(xùn)練推理等場景進行重點優(yōu)化。寒武紀思元370核心優(yōu)勢寒武紀核心技術(shù)框架結(jié)構(gòu)25數(shù)據(jù):寒武紀,西南證券整理2.2

模型能力上限不斷突破

2024年以來,海外OpenAI、Google、Antropic等廠商引領(lǐng),模型能力上限取得進一步突破。2024年以來海外大模型廠商主要進展02.15Sora文生視頻能力全面突破OpenAIGoogle05.13GPT4-o原生多模態(tài),更低調(diào)用成本02.15/05.1502.21/05.15Gemini1.5Gemma/Gemma2Veo上下文窗口理論up

to

10M開源,角逐輕量模型SOTA對標Sora,視頻生成時長超1分鐘優(yōu)化圖像生成細節(jié)05.1505.15Imagen

3海外主要模型進展03.0406.20Claude

3對標GPT4,長文本、多模態(tài)AntropicClaude

3.5

Sonnet多項指標超越GPT4o,性價比突出閉源陣營04.19開源陣營MetaxAILlama3重回開源SOTA03.17/03.28Grok-1/Grok-1.5314B開源模型最大參數(shù),使用X數(shù)據(jù)訓(xùn)練02.2604.10Mistral

LargeMistral

8x22B閉源,性能逼近GPT4Mistral

AI開源模型第二大參數(shù)數(shù)據(jù):OpenAI,谷歌,Antropic,MistralAI,Meta,xAI等,西南證券整理

262.2

國內(nèi)模型能力亦不斷追趕

2024年以來,阿里、百度、月之暗面等廠商百花齊放,奮起直追,國內(nèi)大模型性能已經(jīng)逼近國際先進水平。2024年以來國內(nèi)大模型廠商主要進展03.22Qwen-longQwen2.5升級至1000萬Token上下文性能對標GPT4-Turbo05.0906.07阿里百度Qwen2開源開源,性能超過Llama304.1606.28文心4.0

工具版文心4.0

Turbo推理成本降至一年前的1%上下文從2K升至128K,推理性能提升30%01.3006.29星火3.5星火4.0全國產(chǎn)算力平臺訓(xùn)練,性能逼近GPT4性能對標GPT4

Turbo科大訊飛商湯科技海外主要模型進展04.2303.1803.23日日新5.0多模態(tài)能力提升,端云MOE提高推理速度月之暗面階躍星辰Moonshot-v1Step-2支持200萬字上下文萬億參數(shù)MOE04.17MiniMaxabab

6.5萬億參數(shù)MOE,支持200萬Token上下文數(shù)據(jù):OpenAI,谷歌,Antropic,MistralAI,Meta,xAI等,西南證券整理

272.2

國產(chǎn)模型發(fā)展加快,優(yōu)化方向逐步清晰

OpenAI宣布自7月9日起停止非支持國家和地區(qū)的API服務(wù),有望加速國內(nèi)模型發(fā)展。

根據(jù)UC

Berkeley發(fā)布的Chatbot

Arena大模型榜單,OpenAI、Antropic、Google系列模型的綜合能力依然名列前茅(該榜單由用戶盲測客觀評選,被Sam

Altman多次引用,相對更具權(quán)威性和客觀性),但零一萬物的Yi-Large-Preview已經(jīng)進入前十名。

開源社區(qū)上,國內(nèi)大模型已取得長足突破。根據(jù)Hugging

Face6月末最新的開源大模型表排行榜,Qwen2-72B-Instruct以43.02的綜合評分位于榜單第一,大幅領(lǐng)先排名第二的Llama-70B的35.13分。并且Qwen系列的另兩個變體也占據(jù)了第三和第十的位置,外加排名第七的零一萬物Yi-1.5-34B,中國的開源模型在整體上占主導(dǎo)地位。

在現(xiàn)有架構(gòu)體系下,當(dāng)前海內(nèi)外大模型紛紛向更強的多模態(tài)能力,更長的上下文,更低的訓(xùn)推成本三大方向進行優(yōu)化,以打開應(yīng)用使能的想象空間。LMSYS

Chatbot

Arena大模型排行榜Hugging

face開源模型排行榜數(shù)據(jù):

Hugging

Face,LMSYSChatbot

Arena,西南證券整理282.2

大模型優(yōu)化方向——原生多模態(tài)

傳統(tǒng)的多模態(tài)基礎(chǔ)模型,通常為每種模態(tài)采用特定的「編碼器」或「解碼器」,將不同的模態(tài)分離開,跨模態(tài)信息融合能力受到限制。

Google率先開啟原生多模態(tài)的探索,區(qū)別于傳統(tǒng)的多模態(tài)“后融合”的訓(xùn)練方式,Gemini在設(shè)計時原生支持多模態(tài),從一開始便同時對多模態(tài)的數(shù)據(jù)同時進行預(yù)訓(xùn)練,對于文字、圖像、視頻、音頻、代碼的理解推理效果進一步提升。

OpenAI在GPT4o上棄用了原來拼接Whisper、DALLE-E、GPT等多個模型的方式,采用了端到端多模態(tài)架構(gòu),在視覺、音頻理解方面大幅升級,并實現(xiàn)了極致流暢的用戶體驗。

Meta在5月份發(fā)布了Chameleon變色龍多模態(tài)大模型,同樣采用“前融合”(early-fusion)方法,從一開始就將所有模態(tài)投影到共享的表示空間中。傳統(tǒng)多模態(tài)架構(gòu)示意Gemini基于多模態(tài)原生思路設(shè)計數(shù)據(jù):

騰訊《MACAW-LLM:

MULTI-MODALLANGUAGE

MODELING

WITH

IMAGE,AUDIO,

VIDEO,

ANDTEXT

INTEGRATION》DeepMind,西南證券整理292.2

大模型優(yōu)化方向——長文本

2023年年末,各家大模型主流上下文窗口還在32Ktokens量級,僅有GPT4

Turbo達到128K、Claude3達到200K量級。

而截至2024年H1,主流模型基本均支持128K量級,頭部廠商卷入1M以上量級。2024年2月,谷歌Gemini1.5將上下文長度擴展至1M量級,并宣稱最高理論可達到10M(尚未公開開放);3月Kimi、阿里先后宣布支持200萬文字(對應(yīng)約1333Ktokens)、10Mtokens上下文窗口。

當(dāng)前實現(xiàn)長上下文窗口主要有“內(nèi)生”和“外掛”兩種優(yōu)化方向。“內(nèi)生”主要通過改進Tra

nsf

ormer架構(gòu)中的各個模塊:1)注意力機制優(yōu)化,如Sparse

Attention等;2)長期記憶力機制;3)外推位置編碼,如擴展RopE;4)上下文預(yù)/后處理:壓縮、聚合等;5)其他:MoE、目標函數(shù)優(yōu)化、權(quán)重壓縮等?!巴鈷臁盧AG是當(dāng)前算力和內(nèi)存限制下比較“取巧”和簡單的方法,在B端場景比較適合,有其存在的必要性。各大模型上下文窗口(千tokens)長文本問題的解決方案100001000010000900080007000600050004000300020001000050050036020001333Kimi200128128QwenGemini

1.5ClaudeGPT4Ernie注:虛線表示尚未公開開放數(shù)據(jù):

《Advancing

Transformer

Architecture

in

Long-Context

Large

Language

Models:

A

Comprehensive

Survey》,西南證券整理

302.2

大模型優(yōu)化方向——降本

5月6日,DeepSeek發(fā)布最新模型DeepSeek-V2,百萬tokens僅需1元,拉開國內(nèi)大模型降價序幕;隨后,智譜、百度、字節(jié)、騰訊、訊飛等紛紛加入降價浪潮。

大模型降價背后是訓(xùn)練&推理成本的下降,是模型工程進步的必然趨勢,此前OpenAI就伴隨新模型的推出進行過多次調(diào)價。1)頭部模型廠商紛紛從稠密架構(gòu)切換至MoE架構(gòu):2023年4月GPT4發(fā)布,外界猜測其使用16個專家的MoE架構(gòu)參數(shù)達到1.8T;2023年12月,Mistral開源8×7B的MoE模型,在多項測評逼近或超過1750億參數(shù)的GPT3.5水平,再次引發(fā)業(yè)界關(guān)注;2024年以來,Google

Gemini1.5pro開啟國內(nèi)外模型稠密到稀疏MoE的切換浪潮,幻方、xAI、阿里、Minimax、商湯、階躍星辰等紛紛在新一代模型里使用并改進MoE。2)圍繞KV

Cache壓縮進行改進:主要方向包括優(yōu)化注意力機制、減少模型層數(shù)、輸入的token數(shù)等;當(dāng)前主要聚焦注意力機制的優(yōu)化,例如DeepSeek引入MLA,在大幅降低訓(xùn)推成本的同時,保持較強性能。DeepSeek進一步引入細粒度專家和共享專家MLA與其他注意力機制的比較數(shù)據(jù):

《DeepSeek-V2:

A

Strong,

Economical,and

Efficient

Mixture-of-Experts

Language

Model》,西南證券整理

312.2

大模型優(yōu)化方向——降本

自有算力基礎(chǔ)設(shè)施的互聯(lián)網(wǎng)廠商降價幅度更大,百川、Minimax、月之暗面等初創(chuàng)廠商尚未跟進;降價幅度最大、甚至免費的,一般是輕量級模型。

降價有望加速“吸引開發(fā)者-應(yīng)用落地-數(shù)據(jù)反饋-模型能力迭代”的生態(tài)飛輪。降價前(元/百萬tokens)降價后(元/百萬tokens)廠商大模型版本備注輸入輸出輸入367321811001輸出10921843621001GPT4oGPT4-turboOpenAIGPT4深度求索智譜DeepSeek-V2GLM4/GLM4VGLM-3

TurboDoubao-pro-32KDoubao-pro-128KDoubao-lite-4K/32KDoubao-lite-128KQwen-MaxQwen-LongQwen-PlusQwen-TurboERNIE

Speed-8K/128KERNIE

Lite

8K/128KERNIE

4.0定價即低價55降價80%0.850.30.8400.54290.611202字節(jié)阿里百度定價即低價1202020120202308輸入降價67%,輸出不變輸入降價97%,輸出降價90%輸入降價80%,輸出降價40%輸入降價75%,輸出降價25%166824386免費免費-免費免費-免費輕量級版本旗艦版價格不變1204812096ERNIE

3.5--混元-Lite8101201001821-3021-308101201001821-3021-30免費4.51530免費-免費560100免費-免費輕量級版本混元-Standard混元-Standard-256K混元-pro輸入降價55%,輸出降價50%輸入降價87.5%,輸出降價50%輸入降價70%,輸出不變騰訊訊飛Spark

LiteSpark

proSpark

3.5

Max免費輕量級版本旗艦版價格不變--數(shù)據(jù):各公司官網(wǎng),西南證券整理

322.3

大模型由云到端協(xié)同演進,硬件終端革新

大參數(shù)模型受到算力資源有限、高質(zhì)量數(shù)據(jù)集有限、部署成本過高等限制,實際應(yīng)用中涉及資源如何最優(yōu)化配置的問題。伴隨模型蒸餾等壓縮技術(shù)方法的成熟,大小模型開始實現(xiàn)由云到端的協(xié)同演進。

谷歌為了發(fā)揮旗下Android生態(tài)優(yōu)勢而始終志在云邊端結(jié)合,推動輕量化模型升級。谷歌于2023年5月發(fā)布PaL

M

2大模型,率先推出四種不同大小的模型;后續(xù)發(fā)布的Gemini系列也同樣延續(xù)了PaLM的策略,分為Ultra、Pro、Nano等多個型號,其中最小的Nano提供1.8B和3.25B兩個版本,并且成功在Pixel

8

Pro和三星Galaxy

S24手機上實現(xiàn)部署。此外,Google還于2024年2月開源了輕量級模型Gemma,并在5月更新至Gemma2,在小參數(shù)的情況下實現(xiàn)大幅性能提升。

OpenAI當(dāng)前仍延續(xù)大參數(shù)路線,但微軟積極布局輕量級模型。當(dāng)前頭部廠商中,OpenAI幾乎是唯一只做大參數(shù)模型的廠商;而微軟在23年11月Ignite大會提出SLM(Small

LanguageModels)策略,表示SLM是LLM的重要補充,可以為AI應(yīng)用提供另一類的選擇,并陸續(xù)推出Phi-2、Phi-3系列模型。其中Phi-3最小提供3.8B版本,在多項測試集上評分領(lǐng)先LLaMA-8B。Gemma2-9B性能大幅超過LLaMA

3-8BPhi-3-3.8B數(shù)據(jù):

Google,《Phi-3Technical

Report:

A

Highly

Capable

Language

Model

Locallyon

Your

Phone》,西南證券整理

332.3

大模型由云到端協(xié)同演進,硬件終端革新

2023年7月Llama開源7B、13B、70B三種模型,輕量級模型的更新明顯加快。當(dāng)前輕量模型受制于參數(shù)量問題,仍有通用性、魯棒性等局限,例如Phi-3在factual

knowledge方面表現(xiàn)有嚴重短板,3.8B的版本還舍棄了多語言能力等。但多種優(yōu)化策略下,當(dāng)前小模型的性能已有質(zhì)變。

通過提升模型訓(xùn)練數(shù)據(jù)量和數(shù)據(jù)集質(zhì)量(Data-Optimal)、使用計算最優(yōu)縮放(Compute-optimal)、更新模型架構(gòu)等方法,可以使性能逼近甚至超越跨數(shù)量級的大模型。

Google強調(diào)“Compute-Optimal”策略,其在PaLM2技術(shù)報告中提出,數(shù)據(jù)集和模型大小應(yīng)該大約以1:1的比例同時縮放,以達到最佳性能;Gemma應(yīng)該延續(xù)了此項理論,7B和2B模型分別對應(yīng)6T和2T

tokens的訓(xùn)練數(shù)據(jù),其7B模型MMLU評分達到64.3,高于LLaMA-2-13B的54.8。

微軟更強調(diào)“Data-Optimal”的策略,微軟在Phi-3技術(shù)報告中提出,數(shù)據(jù)質(zhì)量是影響模型性能的首要因素,通過數(shù)據(jù)過濾、分階段訓(xùn)練、合成數(shù)據(jù)等方式,Phi-3-3.8B的MMLU評分達到68.8,超過了Llama-3-8B的66.5。“最優(yōu)數(shù)據(jù)”策略使得小模型在參數(shù)量受限條件下,性能逼近跨數(shù)量級大模型數(shù)據(jù):

《Palm2Technical

Report》,商湯日日新5.0發(fā)布會,《Phi-3Technical

Report:

A

Highly

34Capable

Language

Model

Locally

on

Your

Phone》

,西南證券整理2.3.1

AI重新定義PC處理器標準

AI定義硬件門檻,顛覆“安迪-比爾”定律

過去IT產(chǎn)業(yè)的軟硬件升級換代遵循“安迪-比爾”定律(Andy

gives,

Bill

takes

away),即英特爾不斷推出更高性能的CPU,而微軟隨之發(fā)布更占用資源的操作系統(tǒng),雙方交替迭代以催動下游終端消費者的更新需求。

而為了適應(yīng)端側(cè)模型的計算需求,本次AIPC則是由微軟來定義硬件門檻,根據(jù)Trendforce等報道,微軟計劃在Windows12為Copilot+PC設(shè)定40TOPS算力和16GB內(nèi)存DRAM最低要求,或標志著IT產(chǎn)業(yè)進入AI定義硬件終端時代。

從當(dāng)前已經(jīng)正式發(fā)布的PC芯片看,【提升算力】、【提高內(nèi)存】、【降低功耗】成為明顯趨勢,隨之或帶來【指令集架構(gòu)】、【異構(gòu)計算】、【內(nèi)存升級】等重要變化。各廠商芯片算力及功耗對比AMDPhoenixPointIntel

MeteorLakeIntel

LunarLakeAMDHawkPointAMD

StrixPoint高通

XElite蘋果M3蘋果M4發(fā)布時間NPU性能綜合性能2023.1045

TOPS75TOPS2023.1018TOPS-2024.0538TOPS-2023.1211TOPS34TOPS預(yù)計2024H248TOPS2023.0410TOPS33TOPS2023.1216TOPS39TOPS預(yù)計2024H2~50TOPS~80TOPS120TOPS是否滿足微軟定義√--×√××√注:蘋果M3或為FP16精度下數(shù)據(jù)數(shù)據(jù):微軟,英特爾,高通,AMD,蘋果,西南證券整理

352.3.1

Copilot+PC跨越式升級,端側(cè)AI智能體形態(tài)初現(xiàn)

微軟在2024年Build大會上推出全新的Copilot+PC,具備以下基礎(chǔ)功能

新增Copilot按鍵,一鍵呼出Copilot助手,可以訪問OpenAI最新的大模型GPT-4o,可內(nèi)置微軟Phi-3等端側(cè)模型,集成RAG技術(shù),提供文檔總結(jié)、文案擴寫、翻譯、問答等功能。

受益于GPT4-o的加持,Copilot完全具備上下文感知和視覺感知能力,能夠幫助用戶處理屏幕上正在進行的任何工作,發(fā)布會上展示Copilot幫助用戶進行游戲指導(dǎo)。

提供離線實時翻譯功能,可在非聯(lián)網(wǎng)狀態(tài)將電腦的任何音頻翻譯為英語字幕,并在所有應(yīng)用程序的屏幕上持續(xù)實時顯示。

內(nèi)置文生圖功能,可以使用Image

Cocreator免費生成自定義風(fēng)格的圖像并進行微調(diào),同時和Adobe官方合作,大幅優(yōu)化響應(yīng)速度。一鍵喚醒Copilot助手Copilot指導(dǎo)用戶進行游戲數(shù)據(jù):微軟,西南證券整理362.3.1

Copilot+PC跨越式升級,端側(cè)AI智能體形態(tài)初現(xiàn)

最大亮點新增Recall回想功能,對硬件性能提出更高要求

微軟創(chuàng)新發(fā)布“Recall”功能,可以幫助用戶跨越時間線,找到在PC上的任何瀏覽記錄或處理過的任務(wù),包括網(wǎng)頁、圖片、聊天記錄等。

“Recall”通過每隔幾秒鐘截取一次活動窗口的屏幕截圖來工作,默認情況下記錄用戶在Windows中的所有操作,最長可達三個月。

為滿足“Recall”功能的存儲需求,硬盤空間至少達到256GB;同時微軟在之前也對芯片算力提出40TOPS+的定義,AI正在重塑PC產(chǎn)業(yè)鏈,對硬件性能提出更高要求。Recall功能可以幫助用戶找過任何瀏覽過的內(nèi)容數(shù)據(jù):微軟,西南證券整理372.3.1

AI重新定義PC處理器標準,關(guān)注Arm架構(gòu)份額提升

搭載驍龍X性能超過蘋果,Windows

on

Arm搶占AIPC灘頭

微軟2012年發(fā)布官方電腦Surface系列,2015年推出Windows

on

Arm,但僅在2021發(fā)布的Surface

Pro

X小眾型號上搭載高通8cx

Gen

2,其他主力機型全部為Wintel。

伴隨Copilot+PC對性能、功耗提出更高要求,微軟新一代Surface設(shè)備全系搭載高通SnapdragonX

Elite/Plus處理器,CPU和GPU性能比配備M3處理器的MacBook

Air快58%,NPU算力達到45TOPS高于M3芯片的18TOPS,續(xù)航時間同樣領(lǐng)先。

除官方的Surface系列外,聯(lián)想、宏碁、華碩、戴爾、惠普、三星等PC廠商已經(jīng)與微軟簽訂了合作協(xié)議,6月18日將正式發(fā)布20+不同型號的Copilot+

PC,均搭載高通Snapdragon

X系列處理器,Windows

on

Arm在推出9年后借著AIPC的浪潮搶占灘頭。Copilot+PC與蘋果M3

Macbook

Air對比第一批集成驍龍X系列芯片的Copilot+PCCopilot+PC蘋果M3

Macbook

AirCPU和GPU性能NPU性能Copilot+PC

M3

Macbook

Air

快58%45

TOPS189218TOPS1745Cinebench

23(單核)Cinebench

231498390Wh1035270Wh(多核)電池容量續(xù)航時間16小時56分鐘15小時25分鐘數(shù)據(jù):微軟,西南證券整理382.3.1

AI重新定義PC處理器標準,關(guān)注異構(gòu)計算

AIPC引領(lǐng)桌面處理器從通用計算向異構(gòu)計算發(fā)展,CPU+GPU+NPU成為標配

異構(gòu)計算(Heterogeneous

Computing)主要指使用不同類型指令集和體系架構(gòu)的計算單元組成系統(tǒng)進行聯(lián)合計算,合理地將不同類型的計算分配到不同硬件上運算可以獲得更優(yōu)的計算性能和更低的功耗。

NPU(Neural

Process

Unit)是專門設(shè)計用于加速神經(jīng)網(wǎng)絡(luò)計算的處理器,在硬件層面針對AI計算常用的矩陣乘法、卷積等進行優(yōu)化。

為應(yīng)對散熱和能耗瓶頸,芯片廠商紛紛在原有CPU+GPU的基礎(chǔ)上引入NPU。幾類處理引擎比較英特爾、高通處理器架構(gòu)CPUGPUNPU定義中央處理單元圖形處理單元神經(jīng)網(wǎng)絡(luò)處理單元復(fù)雜任務(wù),串行指令邏輯簡單、計算密度高的并行任務(wù)神經(jīng)網(wǎng)絡(luò)加速,如矩陣乘法、卷積等適用領(lǐng)域硬件抽象通用性能效比數(shù)據(jù):CSDN,高通,英特爾,西南證券整理

392.3.1

AI重新定義PC處理器標準,關(guān)注內(nèi)存升級

新一代處理器或?qū)⒅恢С諨DR5/LPDDR5,

帶動內(nèi)存容量和速率升級

根據(jù)Trendforce和Yole,2023年單臺PC的DRAM平均容量大約在9-10GB左右;而根據(jù)微軟定義,以及當(dāng)前已經(jīng)發(fā)布的AIPC

內(nèi)存情況來看,16GB將成為AIPC內(nèi)存的最低配置。

根據(jù)Intel,16GB的內(nèi)存容量僅僅是起點,伴隨更多AI應(yīng)用本地運行,后續(xù)32GB以上的大容量內(nèi)存將成為AIPC的入門級要求。

此外,自Snapdragon

X

Elite、AMD

Ryzen

8000、Intel

Core

Ultra等芯片起,內(nèi)存僅支持DDR5/LPDDR5,內(nèi)存容量和速率升級已成確定性趨勢。當(dāng)前發(fā)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論