




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、3AI芯片行業(yè)概述1AI芯片應(yīng)用場(chǎng)景及市場(chǎng)需求分析2AI芯片行業(yè)產(chǎn)業(yè)鏈及商業(yè)模式分析3AI芯片行業(yè)發(fā)展展望4企業(yè)推薦5芯片工藝制程逼近物理極限;CPU芯片中大量晶體管用于 構(gòu)建邏輯控制和存儲(chǔ)單元,用 于構(gòu)建計(jì)算單元的晶體管占比 極??;為了保證兼容性,CPU構(gòu)架 演進(jìn)發(fā)展受限。關(guān)于人工智能芯片(AI芯片)AI芯片:基于矩陣運(yùn)算、面向AI應(yīng)用的芯片設(shè)計(jì)方案1、定義:當(dāng)前AI芯片設(shè)計(jì)方案繁多,包括但不限于GPUFPGAASICDSP等。目前市場(chǎng)上的對(duì)于AI芯片并無(wú)明確統(tǒng)一的 定義,廣義上所有面向人工智能(Artificial Intelligence,AI)應(yīng)用的芯片都可以被稱為AI芯片。2、當(dāng)前A
2、I運(yùn)算指以“深度學(xué)習(xí)” 為代表的神經(jīng)網(wǎng)絡(luò)算法,需要系統(tǒng)能夠高效處理大量非結(jié)構(gòu)化數(shù)據(jù)(文本、視頻、圖 像、語(yǔ)音等)。這需要硬件具有高效的線性代數(shù)運(yùn)算能力,計(jì)算任務(wù)具有:?jiǎn)挝挥?jì)算任務(wù)簡(jiǎn)單,邏輯控制難度要求低,但 并行運(yùn)算量大、參數(shù)多的特點(diǎn)。對(duì)于芯片的多核并行運(yùn)算、片上存儲(chǔ)、帶寬、低延時(shí)的訪存等提出了較高的需求。3、針對(duì)不同應(yīng)用場(chǎng)景,AI芯片還應(yīng)滿足:對(duì)主流AI算法框架兼容、可編程、可拓展、低功耗、體積及造價(jià)等需求。注釋:DL:Deep Learning,指深度學(xué)習(xí)。來(lái)源:Deep LearningIan Goodfellow、Yoshua Bengio、Aaron Courville;英偉達(dá)官網(wǎng)。
3、ControlALUALUALUALUCacheDRAMDRAMALU深度學(xué)習(xí)模型復(fù)雜度及規(guī)模對(duì)芯片算力需求激增42019.6 iResearch Inc.通過(guò)架構(gòu)設(shè)計(jì)AI芯片跨越工藝限制,算力效能對(duì)CPU實(shí)現(xiàn)大幅超越工藝提升緩慢,面對(duì)大規(guī)模 并行運(yùn)算需求,需要對(duì)芯片 架構(gòu)進(jìn)行重新設(shè)計(jì);GPU:開(kāi)發(fā)即面向圖像處理等大規(guī)模運(yùn)算需求;FPGA/ASIC:對(duì)緩存、計(jì)算 單元、連接進(jìn)行針對(duì)性優(yōu)化 設(shè)計(jì)。AI芯片實(shí)現(xiàn)算力提升注釋:PPA:POWER、PERFORMANCE、AREA,指芯片的算力、功耗和面積。 來(lái)源:Intel官網(wǎng);英偉達(dá)官網(wǎng);公開(kāi)網(wǎng)絡(luò)數(shù)據(jù);艾瑞研究院。Intel-XEONIntel/A
4、ltera-Stratix 10SoCNvidia-TESLA V100Google-TPUv2AI芯片滿足AI應(yīng)用所需的“暴力計(jì)算”需求早在上世紀(jì)80年代,學(xué)術(shù)界已經(jīng)提出了相當(dāng)完善的人工智能算法模型,但直到近些年,模型的內(nèi)在價(jià)值也沒(méi)有被真正的實(shí) 現(xiàn)過(guò)。這主要是受限于硬件技術(shù)發(fā)展水平,難以提供可以支撐深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練/推斷過(guò)程所需要的算力。直到近年來(lái) GPUFPGAASIC等異構(gòu)計(jì)算芯片被投入應(yīng)用到AI應(yīng)用相關(guān)領(lǐng)域,解決了算力不足的問(wèn)題。下圖以云計(jì)算場(chǎng)景為例,通過(guò)對(duì)全球幾大科技巨頭的代表性云端芯片產(chǎn)品計(jì)算性能對(duì)比,我們可以發(fā)現(xiàn)ASIC芯片相比起其 他幾種芯片,在計(jì)算效能、大小、成本等方面都有著
5、極大優(yōu)勢(shì),未來(lái)隨著通用AI指令集架構(gòu)的開(kāi)發(fā),預(yù)計(jì)會(huì)出現(xiàn)最優(yōu)配置 的AI計(jì)算芯片。典型的云端計(jì)算芯片算力表現(xiàn)比較Performance(TFLOPs)4515.70.001810CPUFPGA52019.6 iResearch Inc.GPUASIC優(yōu)點(diǎn):通用性好,串行運(yùn)算 能力強(qiáng);適用于邏輯運(yùn)算; 缺點(diǎn):開(kāi)發(fā)難度最大,大量 的晶體管用于構(gòu)建控制電路 和高速緩沖存儲(chǔ)器,運(yùn)算單 元占比少,架構(gòu)限制了算力 的進(jìn)一步提升。優(yōu)點(diǎn):相比CPU,由于其多 線程結(jié)構(gòu),擁有較強(qiáng)的并行 運(yùn)算能力,與FPGA和ASIC 相比通用性更強(qiáng);缺點(diǎn):價(jià)格、功耗等不如 FPGA和ASIC,并行運(yùn)算能 力在推理端無(wú)法完全發(fā)揮。
6、優(yōu)點(diǎn):可對(duì)芯片硬件層進(jìn)行 靈活編譯,且功耗遠(yuǎn)遠(yuǎn)小于 CPU和GPU缺點(diǎn):硬件編程語(yǔ)言難以掌 握,單個(gè)單元的計(jì)算能力比 較弱,硬件成本較高,電子 管冗余,功耗可進(jìn)一步壓縮。優(yōu)點(diǎn):針對(duì)專門的任務(wù)進(jìn)行 架構(gòu)層的優(yōu)化設(shè)計(jì),可實(shí)現(xiàn) PPA最優(yōu)化設(shè)計(jì)、量產(chǎn)后成 本最低;缺點(diǎn):初始設(shè)計(jì)投入大,可 編程架構(gòu)設(shè)計(jì)難度較大,針 對(duì)性設(shè)計(jì)會(huì)限制芯片通用 性。AI芯片產(chǎn)品定位CPUGPUXPUDSPModemCamera ISP4K VideoHifi AudioLPDDR 4XUFSSensor ProcessorSecurity Engine來(lái)源:英偉達(dá)官網(wǎng),公開(kāi)網(wǎng)絡(luò)數(shù)據(jù)。62019.6 iResearch In
7、c.AI芯片對(duì)CPU并非替代,與CPU共同滿足新時(shí)代計(jì)算需求目前來(lái)看,AI芯片并不能取代CPU的位置,正如GPU作為專用圖像處理器與CPU的共生關(guān)系,AI芯片將會(huì)作為CPU的AI運(yùn) 算協(xié)處理器,專門處理AI應(yīng)用所需要的大并行矩陣計(jì)算需求,而CPU作為核心邏輯處理器,統(tǒng)一進(jìn)行任務(wù)調(diào)度。在服務(wù)器產(chǎn)品中,AI芯片被設(shè)計(jì)成計(jì)算板卡,通過(guò)主板上的PCIE接口與CPU相連;而在終端設(shè)備中,由于面積、功耗成本 等條件限制,AI芯片需要以IP形式被整合進(jìn)SoC系統(tǒng)級(jí)芯片,主要實(shí)現(xiàn)終端對(duì)計(jì)算力要求較低的AI推斷任務(wù)。服務(wù)器級(jí)產(chǎn)品中通過(guò)PCB上PCIE接口與CPU組成通過(guò)SoC封裝與CPU組成異構(gòu)計(jì)算單元 異構(gòu)計(jì)
8、算單元SoCAI芯片應(yīng)用場(chǎng)景算法下發(fā) 計(jì)算下沉云端數(shù)據(jù)回傳模型訓(xùn)練/推理邊緣+終端終 端 SoC+IP: DSP/GPU/ASIC邊緣智能服務(wù)器: GPU/FPGA/ASIC云數(shù)據(jù)機(jī)房智能服務(wù)器: GPU/FPGA/ASIC超大數(shù)據(jù)量本地處理斷網(wǎng)下獨(dú)立本地處理工業(yè)/ 農(nóng)業(yè)等家 庭數(shù)據(jù)安全、異構(gòu)、實(shí)時(shí)響應(yīng)基于對(duì)數(shù)據(jù)傳輸帶寬壓力、數(shù)據(jù)安全等因素的考量,邊緣和終端側(cè)承載了需要本地實(shí)時(shí)響應(yīng)的推理任務(wù)。需要獨(dú)立完成任務(wù)涵 蓋:數(shù)據(jù)收集、環(huán)境感知、人機(jī)交互以及部分的推理決策控制任務(wù)。自動(dòng)駕駛智慧安防移動(dòng)互聯(lián)網(wǎng)其他物聯(lián)網(wǎng)場(chǎng)景低功耗、數(shù)據(jù)安全AI芯片為AI應(yīng)用落地提供了商業(yè)化可行的算力解決方案在人工智能發(fā)展初
9、期,算法已經(jīng)通過(guò)數(shù)據(jù)中心(云端)在大數(shù)據(jù)分析、精準(zhǔn)營(yíng)銷、商業(yè)決策等方面實(shí)現(xiàn)了成功地應(yīng)用落 地。而未來(lái),智能化將會(huì)逐漸滲透進(jìn)入能源、交通、農(nóng)業(yè)、公共事業(yè)等更多行業(yè)的商業(yè)應(yīng)用場(chǎng)景中,除了部署在云端進(jìn)行 數(shù)據(jù)分析等工作,人工智能還需要下沉到攝像頭、交通工具、移動(dòng)設(shè)備終端、工業(yè)設(shè)備終端中,與云計(jì)算中心協(xié)同實(shí)現(xiàn)本 地化的、低延時(shí)的人工智能應(yīng)用??紤]到任務(wù)算力需求,以及傳輸帶寬、數(shù)據(jù)安全、功耗、延時(shí)等客觀條件限制,現(xiàn)有云 端計(jì)算解決方案難以獨(dú)自滿足人工智能本地應(yīng)用落地計(jì)算需求,終端、邊緣場(chǎng)景同樣需要專用的AI計(jì)算單元。云端與邊緣側(cè)人工智能應(yīng)用場(chǎng)景對(duì)于AI芯片的需求云端負(fù)責(zé)承載智能數(shù)據(jù)分析、模型訓(xùn)練任務(wù)和部
10、分對(duì)傳輸帶寬要求不高的推理任務(wù)。來(lái)源:艾瑞研究院自主繪制。72019.6 iResearch Inc.20.23.439.120172022e云端訓(xùn)練AI芯片云端推斷AI芯片邊緣推斷AI芯片來(lái)源:AI芯片:應(yīng)用落地推動(dòng)產(chǎn)品多樣化中金公司研究部2019.6 iResearch Inc.8AI芯片整體市場(chǎng)規(guī)模預(yù)測(cè)AI芯片市場(chǎng)規(guī)模未來(lái)5年增長(zhǎng)有望達(dá)到10倍1、市場(chǎng)根據(jù)AI芯片功能及部署場(chǎng)景將AI芯片分為:訓(xùn)練/推斷、云端/邊緣兩個(gè)維度進(jìn)行劃分。訓(xùn)練端由于需要對(duì)大量原始 數(shù)據(jù)進(jìn)行運(yùn)算處理,因此對(duì)于硬件的算力、計(jì)算精度,以及數(shù)據(jù)存儲(chǔ)和帶寬等都有較高要求,此外在云端的訓(xùn)練芯片應(yīng)該 有較好的通用性和可編程能
11、力。推理端對(duì)于硬件性能要求沒(méi)有推斷端高,實(shí)證證明一定范圍的低精度運(yùn)算可達(dá)到同等推理 效果,但同時(shí)這要求模型訓(xùn)練精度要達(dá)到較高水平。2、根據(jù)中金公司研究部數(shù)據(jù)顯示,2017年,整體AI芯片市場(chǎng)規(guī)模達(dá)到62.7億美元,其中云端訓(xùn)練AI芯片20.2億美元,云 端推理芯片3.4億美元,邊緣計(jì)算AI芯片39.1億美元;到2022年,整體AI芯片市場(chǎng)規(guī)模將會(huì)達(dá)到596.2億美元,CAGR 57%,其中云端訓(xùn)練AI芯片172.1億美元,CAGR 53.5%,云端推斷芯片71.9億美元,CAGR 84.1%,邊緣計(jì)算AI芯片352.2億美元,CAGR 55.2%。注釋:AI芯片細(xì)分市場(chǎng)規(guī)模單位:億美元。201
12、7-2022年AI芯片細(xì)分市場(chǎng)規(guī)模預(yù)測(cè)CAGR:53.5%172.1CAGR:84.1%71.9CAGR:55.2%352.29AI芯片行業(yè)概述1AI芯片應(yīng)用場(chǎng)景及市場(chǎng)需求分析2AI芯片行業(yè)產(chǎn)業(yè)鏈及商業(yè)模式分析3AI芯片行業(yè)發(fā)展展望4企業(yè)推薦5102019.6 iResearch Inc.應(yīng)用場(chǎng)景:云計(jì)算來(lái)源:IBM。應(yīng)用 數(shù)據(jù) 運(yùn)行 中間件 O/S 虛擬化 服務(wù)器 存儲(chǔ) 網(wǎng)絡(luò) 傳統(tǒng)IT應(yīng)用 數(shù)據(jù) 運(yùn)行 中間件 O/S 虛擬化 服務(wù)器 存儲(chǔ) 網(wǎng)絡(luò) IaaS應(yīng)用 數(shù)據(jù) 運(yùn)行 中間件 O/S 虛擬化 服務(wù)器 存儲(chǔ) 網(wǎng)絡(luò) PaaS應(yīng)用 數(shù)據(jù) 運(yùn)行 中間件 O/S 虛擬化 服務(wù)器 存儲(chǔ) 網(wǎng)絡(luò) SaaS
13、云 廠 商 管 理客 戶 自 行 管 理云計(jì)算:共享規(guī)模化經(jīng)濟(jì)效益有效降低邊際成本投入云計(jì)算是一種按使用計(jì)費(fèi)的IT服務(wù)模型,實(shí)現(xiàn)對(duì)高可靠、可配置的計(jì)算資源池(服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、應(yīng)用程序和服務(wù)) 的方便快捷的訪問(wèn),資源可通過(guò)最少的管理工作快速的配置和發(fā)布。云計(jì)算具有:資源池、廣泛的網(wǎng)絡(luò)訪問(wèn)、按需自助服 務(wù)、快速?gòu)椥耘蛎?、測(cè)量服務(wù)等5個(gè)基本特征。云計(jì)算服務(wù)模式主要包括:IaaS、PaaS、SaaS:IAAS-提供基本的計(jì)算(虛擬或?qū)S糜布?、存?chǔ)、網(wǎng)絡(luò)資源,使用者在資源中部署運(yùn)行任意應(yīng)用程序和操作系統(tǒng);PAAS-提供部署在云基礎(chǔ)設(shè)施上的編程語(yǔ)言、庫(kù)、服務(wù)和支持工具,為開(kāi)發(fā)人員提供了一個(gè)自助服務(wù)門
14、戶而無(wú)需管理 底層基礎(chǔ)設(shè)施;SAAS-提供在云基礎(chǔ)設(shè)施上運(yùn)行的應(yīng)用程序,程序運(yùn)行管理皆由服務(wù)提供商負(fù)責(zé)。相比起傳統(tǒng)IT模式,云計(jì)算模式可實(shí)現(xiàn):降低用戶初始IT投資成本及IDC機(jī)房維護(hù)費(fèi)用并實(shí)現(xiàn)資本效益配置最大化、IT資源快速?gòu)椥詳U(kuò)展、數(shù)據(jù)價(jià)值的有效挖掘以及業(yè)務(wù)的快速上線部署等。云計(jì)算服務(wù)模型112019.6 iResearch Inc.2019.6 iResearch Inc.889.7952.5967.2988.7 1009.11107.9 1110.3 1145.17%2%2%2%10%0%3%201020112012201320142015201620172010-2017年全球服務(wù)器出
15、貨量及增速18%全球服務(wù)器出貨量(萬(wàn)臺(tái))同比(%)490046006700101001243168225494756-6%46%51%270%298%296%2014-2017年 Amazon&阿里巴巴云計(jì)算建設(shè)資本支出20162017阿里巴巴(百萬(wàn)美元) 阿里巴巴(%)云計(jì)算中心服務(wù)器及硬件市場(chǎng)規(guī)模云計(jì)算發(fā)展帶動(dòng)上游硬件市場(chǎng)需求近些年云廠商巨頭快速擴(kuò)張帶動(dòng)了上游數(shù)據(jù)機(jī)房建設(shè)熱潮,雖然這會(huì)抵消部分企業(yè)自建機(jī)房及采購(gòu)服務(wù)器的需求,但是這 部分需求并沒(méi)有消失而是轉(zhuǎn)移到了對(duì)云數(shù)據(jù)中心IT資源的需求上。中國(guó)云產(chǎn)業(yè)比美國(guó)發(fā)展晚24年左右,在全球云計(jì)算市 場(chǎng)中,美國(guó)占比達(dá)到54.1%,中國(guó)僅為5%。201
16、7年中國(guó)IT支出為2.4萬(wàn)億人民幣,僅占全球IT總支出金額的9.92%,對(duì)應(yīng) 中國(guó)GDP水平仍有較大的提升空間。中國(guó)雖然起步較晚但發(fā)展迅猛,對(duì)比亞馬遜及阿里巴巴云計(jì)算資本支出數(shù)據(jù),可以看 到阿里巴巴在云計(jì)算領(lǐng)域支出總金額絕對(duì)值雖然少于亞馬遜,但增速卻顯著超過(guò)了亞馬遜的資本支出增速,這顯示了近年 來(lái)國(guó)內(nèi)加大對(duì)于計(jì)算資源基礎(chǔ)設(shè)施的建設(shè)力度,將極大受益于服務(wù)器廠商及上游芯片廠商業(yè)績(jī)。20142015Amazon(百萬(wàn)美元) Amazon(%)來(lái)源:AMAZON、阿里巴巴公司年報(bào)披露數(shù)據(jù)。來(lái)源:Wind。云計(jì)算與人工智能服務(wù)注釋:AI服務(wù)器:指搭載了AI芯片、計(jì)算板卡并用于人工智能相關(guān)運(yùn)算的服務(wù)器。
17、來(lái)源:AWS官網(wǎng)。云計(jì)算為AI開(kāi)發(fā)部署提供多元化服務(wù)支持云計(jì)算服務(wù)供應(yīng)商可以向客戶提供包括計(jì)算、存儲(chǔ)、數(shù)據(jù)庫(kù)、分析、移動(dòng)、物聯(lián)網(wǎng)和企業(yè)應(yīng)用等一系列多層級(jí)服務(wù)。在人 工智能應(yīng)用方面,由于人工智能(以深度學(xué)習(xí)為代表)的開(kāi)發(fā)及應(yīng)用對(duì)于算力、數(shù)據(jù)有較大的需求,而云計(jì)算服務(wù)可以為 開(kāi)發(fā)者提供AI計(jì)算芯片以及基于其開(kāi)發(fā)的智能服務(wù)器集群等強(qiáng)大算力設(shè)施的租用,同時(shí)也可以為開(kāi)發(fā)者提供PaaS級(jí)的開(kāi)發(fā) 平臺(tái)或是直接提供已訓(xùn)練好的人工智能功能模塊等產(chǎn)品。通過(guò)多元化的服務(wù)模式,可以降低開(kāi)發(fā)者的開(kāi)發(fā)成本和產(chǎn)品開(kāi)發(fā) 周期,為客戶進(jìn)行方便快捷的AI賦能。云計(jì)算核心產(chǎn)業(yè)鏈及云端人工智能服務(wù)模式軟件零售媒體游戲制造業(yè)金融房地產(chǎn)
18、廣告物流醫(yī)療教育通訊科技公共服務(wù)器云廠商DL-aaS:以云服務(wù)的形式提供高效的深度學(xué)習(xí)開(kāi)發(fā)平臺(tái)AI-aaS:以云服務(wù)形式提供人工智能技術(shù)應(yīng)用AI InfrastructureAI FrameworksAI PlatformsAI Services122019.6 iResearch Inc.芯片客戶云計(jì)算與人工智能132019.6 iResearch Inc.任務(wù)硬件收費(fèi):$/h構(gòu)建標(biāo)準(zhǔn)實(shí) 例0.056.45GPU實(shí)例1.2634.27訓(xùn)練標(biāo)準(zhǔn)實(shí) 例0.136.45GPU實(shí)例1.2634.27模型 部署標(biāo)準(zhǔn)實(shí) 例0.076.45GPU實(shí)例1.2634.27云計(jì)算服務(wù)模式可顯著降低AI應(yīng)用開(kāi)發(fā)、
19、部署成本云計(jì)算發(fā)展自互聯(lián)網(wǎng)廠商提升服務(wù)器使用效率(考慮為應(yīng)付黑色星期五、雙11等特殊日期訪問(wèn)量激增而添置的巨量服務(wù)器 資源)而逐漸開(kāi)始的服務(wù)器Web租賃服務(wù)。在云計(jì)算產(chǎn)業(yè)鏈中,云廠商負(fù)責(zé)基礎(chǔ)設(shè)施和云組織架構(gòu)的搭建,并為客戶提供 PaaS、SaaS服務(wù),具有極高的資本和技術(shù)門檻,在產(chǎn)業(yè)鏈中享有極大的話語(yǔ)權(quán)。如前文所述,在AI開(kāi)發(fā)中,由于深度學(xué) 習(xí)模型開(kāi)發(fā)及部署需要強(qiáng)大算力支持,需要專用的芯片及服務(wù)器支持。開(kāi)發(fā)者如選擇自購(gòu)AI服務(wù)器成本過(guò)高。通過(guò)云服務(wù) 模式,采取按需租用超算中心計(jì)算資源可極大降低項(xiàng)目期初資本投入同時(shí)也省卻了項(xiàng)目開(kāi)發(fā)期間的硬件運(yùn)維費(fèi)用,實(shí)現(xiàn)資 本配置效率的最大化提升。來(lái)源:英偉達(dá)官
20、網(wǎng)、亞馬遜官網(wǎng)、公開(kāi)網(wǎng)絡(luò)數(shù)據(jù)、專家訪問(wèn)。服務(wù)器AI芯片CPU售價(jià):$DGX-216*Tesl a V1002*intel Xeon Platinum 8168$399,00 0DGX-1(Volta)8*Tesla V1002*intel Xeon E5- 2698 v4$149,00 0DGX-1(Pascal)8*Tesla P1002*intel Xeon E5- 2698 v3$129,00 0部分云端AI智能服務(wù)器售價(jià)云計(jì)算AI服務(wù)收費(fèi)(AWS)芯片功能售價(jià):¥V100(GPU)訓(xùn)練10萬(wàn)元,包含 硬件+軟件(驅(qū)動(dòng)、許可、 保修)P4(GPU)推斷2萬(wàn)元,包含 硬件+軟件FPGA推斷
21、45000元部分云端AI芯片售價(jià)云計(jì)算與AI芯片GPGPU+CUDA方案提供豐富的AI開(kāi)發(fā)SDK及廣泛適用性英偉達(dá)除了在傳統(tǒng)獨(dú)立顯卡領(lǐng)域有近7成的市場(chǎng)份額,其在云計(jì)算智能服務(wù)器領(lǐng)域市場(chǎng)份額更是一家獨(dú)大。英偉達(dá)為客戶 提供了支持AI應(yīng)用開(kāi)發(fā)的完備的TESLA GPU產(chǎn)品線,相比于傳統(tǒng)CPU服務(wù)器,在提供相同算力情況下,GPU服務(wù)器在成 本、空間占用和能耗分別為傳統(tǒng)方案的1/8、1/15和1/8。除了優(yōu)秀的硬件性能外,英偉達(dá)開(kāi)發(fā)了基于GPU的“CUDA”開(kāi) 發(fā)平臺(tái),為開(kāi)發(fā)者提供了豐富的開(kāi)發(fā)軟件站SDK,支持現(xiàn)有的大部分的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)開(kāi)發(fā)框架 ,開(kāi)發(fā)者可以在 CUDA平臺(tái)上使用自己熟悉的開(kāi)發(fā)語(yǔ)
22、言進(jìn)行應(yīng)用開(kāi)發(fā)。公司花費(fèi)大量時(shí)間培養(yǎng)自己的開(kāi)發(fā)生態(tài),包括與高校合作培訓(xùn)專業(yè) 人才、開(kāi)展專業(yè)競(jìng)賽,培養(yǎng)、發(fā)展英偉達(dá)“GPU+CUDA”的開(kāi)發(fā)者群體,形成了相當(dāng)可觀的產(chǎn)品使用人群,構(gòu)建了當(dāng)前 英偉達(dá)在人工智能領(lǐng)域的霸主地位。英偉達(dá)云端軟硬件一體解決方案CUDA英偉達(dá)-Datacenter AI purpose GPUs英偉達(dá) TESLA P4AI-INFERENCE英偉達(dá) TESLA P40AI-INFERENCE/ GRAPHICS英偉達(dá) TESLA V100AI-TRAINING/ ACCELERATERDeep LearningMath/Linear AlgebraSiganl/Imge/V
23、ideoParallel AlgorithmcuBLASCUDA MathcuRANDcuFFTcuFFTNVgraphDeep Learning Framework Support:LanguageSupport:來(lái)源:英偉達(dá)公司官網(wǎng)。142019.6 iResearch Inc.152019.6 iResearch Inc.2019.6 iResearch Inc.6.713.787.50.03.435.318.362.5 57.0105.96.314.835.766.098.80.00.85.319.737.020162020e2016-2020年全球AI服務(wù)器及AI芯片市場(chǎng)規(guī)模2017
24、2018e2019eAI訓(xùn)練服務(wù)器(萬(wàn)臺(tái)) AI推斷服務(wù)器(萬(wàn)臺(tái))AI訓(xùn)練芯片市場(chǎng)規(guī)模(億美元) AI推斷芯片市場(chǎng)規(guī)模(億美元)云計(jì)算中心AI芯片市場(chǎng)規(guī)模及份額GPU并非完美,市場(chǎng)期待替代GPU的云端AI芯片解決方案當(dāng)前全球云計(jì)算AI芯片市場(chǎng)英偉達(dá)一家獨(dú)大(尤其是訓(xùn)練端),主要原因是英偉達(dá)GPU產(chǎn)品線豐富,編程環(huán)境成熟,產(chǎn)品 支持市場(chǎng)上主要的開(kāi)發(fā)框架和語(yǔ)言,產(chǎn)品廣受AI開(kāi)發(fā)者好評(píng)。但同時(shí)其產(chǎn)品也存在著功耗偏大、價(jià)格昂貴等問(wèn)題(V100芯 片售價(jià)達(dá)10萬(wàn)元,DGX系列服務(wù)器售價(jià)過(guò)百萬(wàn)元)?;诖?,各大云廠商紛紛提出自己的AI芯片開(kāi)發(fā)計(jì)劃以擺脫上游AI芯 片供貨商一家獨(dú)大的壟斷市場(chǎng)情況。此外根據(jù)數(shù)
25、據(jù)顯示,推斷市場(chǎng)未來(lái)增速和空間將會(huì)高于訓(xùn)練端市場(chǎng),而GPU芯片并不 善于推斷任務(wù),因此,在當(dāng)前智能服務(wù)器滲透率尚低,GPU產(chǎn)品并非完美解決方案的情況下,我們認(rèn)為對(duì)于其他AI芯片廠 商云計(jì)算中心市場(chǎng)依然存在著較大的市場(chǎng)空間可以進(jìn)入。來(lái)源:IDC, Gartner。來(lái)源:IDC。90.0%90.0%80.0%75.0%70.0%65.0%60.0%60.0%50.0%40.0%35.0%30.0%30.0%2016-2022年全球云端AI芯片GPU市 場(chǎng)份額占比201620172018e2019e云端訓(xùn)練GPU占比(%)2020e2021e2022e云端推理GPU占比(%)云計(jì)算AI芯片發(fā)展趨勢(shì)來(lái)
26、源:艾瑞研究院自主繪制。XPU forCloud算力更大的存儲(chǔ)及更高的數(shù) 據(jù)訪存效率云端開(kāi)發(fā)平臺(tái)軟件開(kāi)發(fā)工具鏈芯片間實(shí)現(xiàn)高速互聯(lián), 靈活應(yīng)對(duì)訪問(wèn)計(jì)算力需 求的彈性變動(dòng)功耗通用性、可編程看好基于AI專用指令集的可編程ASIC芯片及配套開(kāi)發(fā)平臺(tái)如前文所述,當(dāng)前在云端場(chǎng)景下被最廣泛應(yīng)用的AI芯片是英偉達(dá)的GPU,主要原因是:強(qiáng)大的并行計(jì)算能力(相比 CPU)、通用性以及成熟的開(kāi)發(fā)環(huán)境。但是GPU也并非是完美無(wú)缺的解決方案,明顯的缺點(diǎn)如:高能耗以及高昂的價(jià)格。 目前包括創(chuàng)業(yè)公司、科技巨頭等都在積極尋找GPU的替代方案,希望實(shí)現(xiàn):既具有GPU通用性、又具有更好的能效和算力 表現(xiàn)的通用、可編程產(chǎn)品。當(dāng)前市
27、場(chǎng)上典型的替代方案包括Google的TPU系列以及寒武紀(jì)的MLU系列產(chǎn)品。云計(jì)算場(chǎng)景AI芯片設(shè)計(jì)思路及發(fā)展趨勢(shì)調(diào)整存儲(chǔ)單元與計(jì)算單元之間的距離,降低數(shù)據(jù)運(yùn)算功耗為開(kāi)發(fā)者提供易使用的 開(kāi)發(fā)平臺(tái)降低對(duì)片外存儲(chǔ)依賴、盡量使用片 上存儲(chǔ)(SRAM、Cache)通用性,對(duì)多數(shù)AI開(kāi) 發(fā)模型及編程框架形成 通用支持架構(gòu)設(shè)計(jì):通過(guò)對(duì)主流算法模型進(jìn)行細(xì)?;?, 抽象出基礎(chǔ)算子,總結(jié)運(yùn)算邏輯,對(duì)硬件進(jìn)行 針對(duì)性優(yōu)化設(shè)計(jì),實(shí)現(xiàn)對(duì)主流算法模型的支持指令集開(kāi)發(fā):開(kāi)發(fā)專用的MLNNs指 令集,降低開(kāi)發(fā)者編程難度采用新的存儲(chǔ)技術(shù),如片內(nèi)計(jì)算162019.6 iResearch Inc.應(yīng)用場(chǎng)景:邊緣計(jì)算來(lái)源:邊緣計(jì)算與云計(jì)
28、算協(xié)同產(chǎn)業(yè)白皮書工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟云計(jì)算層SaaS邊緣層EC-PaaSEC-IaaS設(shè)備接入 協(xié)議解析172019.6 iResearch Inc.數(shù)據(jù)回傳處理 (*部分場(chǎng)景下的數(shù)據(jù)處理需要在邊緣側(cè)完成)邊緣網(wǎng)關(guān) 邊緣控制器 邊緣云邊緣傳感器EC-SaaS預(yù)測(cè)維護(hù) 能效優(yōu)化 質(zhì)量提升 vFW vLB服務(wù)協(xié)同業(yè)務(wù)管理協(xié)同 應(yīng)用管理協(xié)同智能協(xié)同 數(shù)據(jù)協(xié)同資源協(xié)同應(yīng)用實(shí)例應(yīng)用部署軟硬件環(huán)境 分布式智能/推理 數(shù)據(jù)采集與分析鏈接數(shù)字世界現(xiàn)場(chǎng)設(shè)備物理世界業(yè)務(wù)編排PaaSIaaS應(yīng)用開(kāi)發(fā)管理數(shù)據(jù)分析/訓(xùn)練邊云協(xié)同共同實(shí)現(xiàn)萬(wàn)物互聯(lián)時(shí)代計(jì)算任務(wù)需求邊緣計(jì)算:在靠近數(shù)據(jù)源頭的網(wǎng)絡(luò)邊緣側(cè),融合網(wǎng)絡(luò)/計(jì)算/存儲(chǔ)/應(yīng)
29、用等核心能力的分布式開(kāi)放平臺(tái),就近提供邊緣智能服 務(wù),具有海量聯(lián)接、實(shí)時(shí)業(yè)務(wù)處理、數(shù)據(jù)優(yōu)化、應(yīng)用智能、安全與隱私保護(hù)等特點(diǎn)。邊緣計(jì)算對(duì)軟硬件系統(tǒng)提出了:1) 海量異構(gòu)聯(lián)接、2)計(jì)算任務(wù)在邊緣節(jié)點(diǎn)實(shí)時(shí)處理響應(yīng)、3)硬件功耗/成本/空間/抗干擾等有嚴(yán)格要求、4)分布式資源的動(dòng)態(tài)調(diào)度與統(tǒng)一管理、5)支持聯(lián)接/數(shù)據(jù)/管理/控制/應(yīng)用/安全等方面的協(xié)同等要求。邊云協(xié)同放大邊緣計(jì)算及云計(jì)算價(jià)值: 邊緣計(jì)算承擔(dān)數(shù)據(jù)采集和部分的數(shù)據(jù)處理任務(wù),支撐云端應(yīng)用,而云計(jì)算通過(guò)大數(shù)據(jù)分析,優(yōu)化輸出的業(yè)務(wù)規(guī)則或模型, 下發(fā)到邊緣側(cè),為終端提供運(yùn)行規(guī)則/模型。邊云協(xié)同組織架構(gòu)圖邊緣計(jì)算場(chǎng)景與人工智能芯片物聯(lián)網(wǎng)場(chǎng)景移動(dòng)互聯(lián)網(wǎng)
30、智能安防自動(dòng)駕駛?cè)蝿?wù)描述: 機(jī)器視覺(jué) 語(yǔ)音識(shí)別/自然語(yǔ)義處理1、圖像檢測(cè)2、視頻檢測(cè)3、語(yǔ)音識(shí)別4、語(yǔ)義理解1、照相-場(chǎng)景識(shí)別2、照相-美化3、AR應(yīng)用4、語(yǔ)音助手1、圖像檢測(cè)2、視頻檢測(cè)1、圖像語(yǔ)義分割2、數(shù)據(jù)融合 3、Slam定位 4、路徑規(guī)劃性 能 要 求算力Performance1TOPs18TOPs420TOPs204000TOPs(L3L5)能耗Power接入設(shè)備部署現(xiàn)場(chǎng)電源消費(fèi)級(jí)聚合物鋰電池 2,0005,000mAh接入設(shè)備部署現(xiàn)場(chǎng)電源動(dòng)力級(jí)硬殼鋰電池(組) 200,000500,000mAh面積Area高(SoC)極高(SoC)高低(SoC、Server)中 (PCIE co
31、ntains multiple SoC Chips)成本控制Cost高極高高低(IPC,NVR)中可靠性Reliability高(工業(yè))/中(家用)中高極高代表廠商邊緣側(cè)場(chǎng)景繁雜,綜合考量AI芯片 “PPACR”在邊緣計(jì)算場(chǎng)景,AI芯片主要承擔(dān)推斷任務(wù),通過(guò)將終端設(shè)備上的傳感器(麥克風(fēng)陣列、攝像頭等)收集的數(shù)據(jù)代入訓(xùn)練 好的模型推理得出推斷結(jié)果。由于邊緣側(cè)場(chǎng)景多種多樣、各不相同,對(duì)于計(jì)算硬件的考量也不盡相同,芯片可以是IP in SoC,也可以是邊緣服務(wù)器,對(duì)于算力和能耗等性能需求也有大有小。因此不同于云端場(chǎng)景的“高端、通用”,應(yīng)用于邊 緣側(cè)的計(jì)算芯片需要針對(duì)特殊場(chǎng)景進(jìn)行針對(duì)性設(shè)計(jì)以實(shí)現(xiàn)最優(yōu)的
32、解決方案。不同邊緣計(jì)算場(chǎng)景對(duì)AI芯片“PPACR”性能考察要求來(lái)源:網(wǎng)絡(luò)公開(kāi)數(shù)據(jù)、艾瑞研究院自主繪制。182019.6 iResearch Inc.192019.6 iResearch Inc.2019.6 iResearch Inc.28921589181136611341-25% 42% -24%172%112% 6%481%-8%1349%-82%2018年城市級(jí)安防項(xiàng)目招標(biāo)統(tǒng)計(jì)招標(biāo)金額(億元)招標(biāo)同比(%)55276684123081883458110001380017100205002660053%80%83%25%24%20%15%2360013%201720182019e2020
33、e2021e2022e2017-2022年攝像頭AI芯片市場(chǎng)空間402%148%AI攝像頭出貨(萬(wàn)個(gè))AI攝像頭同比(%)IP攝像頭出貨(萬(wàn)個(gè))IP攝像頭同比(%)應(yīng)用場(chǎng)景1:智慧安防市場(chǎng)當(dāng)前國(guó)內(nèi)基于G端需求最明確的邊緣計(jì)算AI應(yīng)用場(chǎng)景在國(guó)內(nèi),安防市場(chǎng)是最為確定的邊緣側(cè)AI應(yīng)用場(chǎng)景,主要原因是大量的監(jiān)控視頻數(shù)據(jù)分析對(duì)人力的需求與當(dāng)前基層人力缺 失、人力成本上升之間的顯著矛盾。需求端來(lái)自于包括政府、大中企業(yè)以及個(gè)人安防需求,主要市場(chǎng)需求來(lái)自于政府,包 括平安城市、智慧交通管控、智慧城市、雪亮工程等,其中公安部“雪亮工程” 提出到2020年實(shí)現(xiàn)“全域覆蓋、全網(wǎng)共 享、全時(shí)可用、全程可控” ,智能攝
34、像頭的應(yīng)用可以有效解決基層數(shù)據(jù)傳輸帶寬壓力以及基層警力人員缺失等問(wèn)題,預(yù)計(jì) “雪亮工程”等政府項(xiàng)目將會(huì)對(duì)智能安防攝像頭市場(chǎng)帶來(lái)較大的驅(qū)動(dòng)作用。來(lái)源:AI智道,不完全統(tǒng)計(jì)。來(lái)源:IDC。智慧安防與AI芯片前端:ISP核心芯片,對(duì)原始圖像信號(hào)進(jìn)行降噪、曝光調(diào) 整,決定最終成像效果的好壞;模擬監(jiān)控系統(tǒng)后端:DVR SoC將模擬音頻信號(hào)數(shù)字化、編碼壓縮與存儲(chǔ)(A/D芯片和 視頻編解碼芯片)。數(shù)字/網(wǎng)絡(luò)高清前端:IPC SoC集成CPU、ISP、高壓縮比視頻編解碼模塊、網(wǎng) 絡(luò)接口、加密模塊、內(nèi)存子系統(tǒng)等;后端:NVR SoC接收攝像機(jī)的IP碼流進(jìn)行編解碼、存儲(chǔ),適用于環(huán)境復(fù) 雜和分散的大型監(jiān)控系統(tǒng)。智能
35、化升級(jí)前端:IPC SoC+AI-IP/獨(dú)立AI芯片-在現(xiàn)有IPC上集成算法實(shí)現(xiàn)識(shí)別任務(wù);-SoC中集成協(xié)處理器或增加獨(dú)立AI芯片進(jìn)行結(jié)構(gòu) 化分析或運(yùn)行DL算法提升檢出率;公安交通智能樓宇金融能源司法文教衛(wèi)來(lái)源:艾瑞研究院自主繪制。結(jié)構(gòu)化分析攝像機(jī)智能網(wǎng)絡(luò)攝像機(jī)后端:GPU/ASIC智能服務(wù)器將智能推理功能集成在邊緣的服務(wù)器級(jí)產(chǎn)品中,實(shí)現(xiàn)更 大規(guī)模的人工智能應(yīng)用。如:GPU服務(wù)器或最新ASIC服 務(wù)器方案。深度學(xué)習(xí)攝像機(jī)202019.6 iResearch Inc.AI芯片為攝像頭提供邊緣智能解決方案降低數(shù)據(jù)回傳需求安防攝像頭發(fā)展經(jīng)歷了由模擬向數(shù)字化、數(shù)字化高清到現(xiàn)在的數(shù)字化智能方向的發(fā)展,最
36、新的智能攝像頭除了實(shí)現(xiàn)簡(jiǎn)單的 錄、存功能外,還可以實(shí)現(xiàn)結(jié)構(gòu)化圖像數(shù)據(jù)分析。安防攝像頭一天可產(chǎn)生20GB數(shù)據(jù),若將全部數(shù)據(jù)回傳到云數(shù)據(jù)中心將 會(huì)對(duì)網(wǎng)絡(luò)帶寬和數(shù)據(jù)中心資源造成極大占用。通過(guò)在攝像頭終端、網(wǎng)絡(luò)邊緣側(cè)加裝AI芯片,實(shí)現(xiàn)對(duì)攝像頭數(shù)據(jù)的本地化實(shí) 時(shí)處理,經(jīng)過(guò)結(jié)構(gòu)化處理、關(guān)鍵信息提取,僅將帶有關(guān)鍵信息的數(shù)據(jù)回傳后方,將會(huì)大大降低網(wǎng)絡(luò)傳輸帶寬壓力。當(dāng)前主 流解決方案分為:前端攝像頭設(shè)備內(nèi)集成AI芯片和在邊緣側(cè)采取智能服務(wù)器級(jí)產(chǎn)品。前端芯片在設(shè)計(jì)上需要平衡面積、功 耗、成本、可靠性等問(wèn)題,最好采取低功耗、低成本解決方案(如:DSP、ASIC);邊緣側(cè)限制更少,可以采取能夠進(jìn)行 更大規(guī)模數(shù)據(jù)處理任
37、務(wù)的服務(wù)器級(jí)產(chǎn)品(如:GPU、ASIC)。AI芯片在智能安防攝像頭中的應(yīng)用智慧安防芯片市場(chǎng)78%22%前端IPC芯片市場(chǎng)份額后端DVR/NVR市場(chǎng)份額市場(chǎng)考驗(yàn)廠商綜合服務(wù)能力,海外廠商逐步退出國(guó)內(nèi)市場(chǎng)攝像頭由于任務(wù)相對(duì)單一,行業(yè)內(nèi)產(chǎn)品同質(zhì)化程度較高,導(dǎo)致行業(yè)競(jìng)爭(zhēng)激烈。智能安防芯片領(lǐng)域參與者包括國(guó)際一線廠商 如:英偉達(dá)、華為、安霸、TI等,還有創(chuàng)業(yè)公司如:比特大陸、地平線、云天勵(lì)飛等,以及北京君正、國(guó)科微等傳統(tǒng)安防 半導(dǎo)體企業(yè),甚至下游的安防廠商如海康威視、大華股份也開(kāi)始自研AI芯片產(chǎn)品。英偉達(dá)作為AI巨頭在安防領(lǐng)域有前、后 端完整軟硬件解決方案,國(guó)內(nèi)諸多安防廠商均采購(gòu)其產(chǎn)品;華為推出了Hi35
38、59等智能芯片,雖然算力性能表現(xiàn)暫時(shí)不如英 偉達(dá),但作為在國(guó)內(nèi)傳統(tǒng)IPC市場(chǎng)有近7成市場(chǎng)份額的企業(yè),基于其深厚的市場(chǎng)積累,能夠?yàn)榭蛻籼峁┩晟频摹⒏咝詢r(jià)比的 解決方案。在面臨越來(lái)越多的企業(yè)涌入安防芯片市場(chǎng)的情況下,行業(yè)客戶傾向于采購(gòu)?fù)暾姆桨福虼顺丝疾靻我恍井a(chǎn) 品性能以外,更加考察企業(yè)的行業(yè)積累及整體解決方案設(shè)計(jì)及交付能力。來(lái)源:CPS中安網(wǎng)、IHS、公開(kāi)網(wǎng)絡(luò)數(shù)據(jù)。62%8%3%7%2016年IPC視頻編解碼芯片 市場(chǎng)份額20%海思AmbarellaTINXP其他212019.6 iResearch Inc.廠商產(chǎn)品算力前 端英偉達(dá)JETSON TX1- GPU1TOPs華為海思Hi3559
39、AV1004TOPs北京君正T01-ASIC地平線旭日1TOPs后 端英偉達(dá)TESLA P45.5TFlops比特大陸B(tài)M16823TFlops主要安防AI芯片解決方案2016年安防芯片市場(chǎng)份額應(yīng)用場(chǎng)景2:移動(dòng)互聯(lián)網(wǎng)市場(chǎng)13.014.314.714.714.915.015.20.41.54.63.06.16.810%3%0%1%15.2 1%15.2 0%0%102%1%51%33%13%201420152016全球智能手機(jī)出貨量(億部)20172018AI手機(jī)出貨量(億部)2019e2020e智能手機(jī) CAGR(%)2021e2022eAI手機(jī) CAGR(%)來(lái)源:IDC。222019.6
40、iResearch Inc.AI芯片為移動(dòng)互聯(lián)網(wǎng)消費(fèi)電子類產(chǎn)品帶來(lái)新增市場(chǎng)空間智能手機(jī)在經(jīng)歷了近10年的高速增長(zhǎng)后,市場(chǎng)已趨于飽和,出貨增速趨近于0,行業(yè)逐漸轉(zhuǎn)為存量市場(chǎng)。近年來(lái),一批國(guó) 產(chǎn)廠商在產(chǎn)品質(zhì)量上逐漸達(dá)到了第一梯隊(duì)的水平,進(jìn)一步加劇了頭部市場(chǎng)的競(jìng)爭(zhēng)。為實(shí)現(xiàn)差異化競(jìng)爭(zhēng),各廠商加大手機(jī)AI 功能的開(kāi)發(fā),通過(guò)在手機(jī)SoC芯片中植入AI芯片實(shí)現(xiàn)在低功耗情況下AI功能的高效運(yùn)行。隨著未來(lái)競(jìng)爭(zhēng)進(jìn)一步加劇,以及 產(chǎn)量上升所帶來(lái)的成本下降,預(yù)計(jì)AI芯片將會(huì)進(jìn)一步滲透進(jìn)入到中等機(jī)型市場(chǎng),市場(chǎng)空間廣闊。移動(dòng)端AI芯片市場(chǎng)不止于 智能手機(jī),潛在市場(chǎng)還包括:智能手環(huán)/手表、VR/AR眼鏡等市場(chǎng)。AI芯片在圖
41、像及語(yǔ)音方面的能力可能會(huì)帶來(lái)未來(lái)人機(jī)交 互方式的改變并進(jìn)一步提升顯示屏、攝像頭的能力,有可能在未來(lái)改變移動(dòng)端產(chǎn)品。2014-2022年全球智能手機(jī)出貨量237%移動(dòng)互聯(lián)網(wǎng)與AI芯片智能手機(jī):SoC內(nèi)嵌AI IP實(shí)現(xiàn)手機(jī)AI功能的高效執(zhí)行通過(guò)云數(shù)據(jù)中心做手機(jī)端AI推理任務(wù)面臨網(wǎng)絡(luò)帶寬延遲瓶頸的問(wèn)題,嚴(yán)重影響用戶使用體驗(yàn),而CPU適合邏輯運(yùn)算,但并 不適合AI并行運(yùn)算任務(wù),目前市場(chǎng)上流行在SoC中增加協(xié)處理器或?qū)S眉铀賳卧獊?lái)執(zhí)行AI任務(wù)。以智能手機(jī)為代表的移動(dòng) 互聯(lián)網(wǎng)終端是一個(gè)多傳感器融合的綜合數(shù)據(jù)處理平臺(tái),AI芯片需要具備通用性,能夠處理多類型任務(wù)能力。由于移動(dòng)終端 依靠電池驅(qū)動(dòng),而受制于電池倉(cāng)
42、大小和電池能量密度限制,芯片設(shè)計(jì)在追求算力的同時(shí)對(duì)功耗有著嚴(yán)格的限制,可以開(kāi)發(fā) 專用的ASIC芯片或者是使用功耗較低的DSP作為AI處理單元。照相-人臉識(shí)別照相-場(chǎng)景識(shí)別 照相-智能防抖照相-翻譯通話-降噪A/VR當(dāng)今手機(jī)電池電容量普遍在20005000mAh。有限的電量需要被被分配到AP、CP中的射頻、CPU、GPU、ISP等諸多 電子元器件,用于信號(hào)接發(fā)、編解碼、攝像頭、圖像處理/渲染等多類型任務(wù),對(duì)電子元器件功耗設(shè)計(jì)提出了極高的要 求。通過(guò)設(shè)計(jì)專用的AI加速運(yùn)算單元并植入在SoC中,在功耗可控的情況下可實(shí)現(xiàn)高效的執(zhí)行AI運(yùn)算任務(wù)。AI功能個(gè)人助理CPUGPUDSPISPAI-IPMemo
43、ry消費(fèi)級(jí)聚合物鋰電池SoC外圍設(shè)備/傳感器來(lái)源:艾瑞研究院自主繪制。232019.6 iResearch Inc.IP廠商手機(jī)/SoC廠商242019.6 iResearch Inc.2019.6 iResearch Inc.廠商SoCAI技術(shù)性能SoC 廠商高通驍龍845Hexagon 685 DSP+CPU+GPU驍龍855Hexagon 690DSP+CPU+GPU7TOPs ,比上一代提升3倍蘋果A11Neural Engine0.6TOPsA12Neural Engine5TOPsMTKP60APU0.56TOPsP90APU2.02.25TOPs華為Kirin970NPU 1A0
44、.512TOPsKirin980NPU 1H5TOPsIP廠商ARMN/AML/OD ProcessorCadenceN/AP5/P6/Q6/C5SynopsysN/AEV5x/6xCEVAN/AXM6/XM4移動(dòng)互聯(lián)網(wǎng)芯片市場(chǎng)傳統(tǒng)手機(jī)芯片廠商技術(shù)實(shí)力強(qiáng)勁,行業(yè)壁壘較高目前手機(jī)芯片市場(chǎng)存在以下情況:1)、AI應(yīng)用場(chǎng)景、功能有限;2)、AI芯片廠商一般向SoC廠提供IP并收取授權(quán)費(fèi),需 要AI-IP與整塊SoC進(jìn)行良好的匹配,而創(chuàng)業(yè)公司缺少與SoC廠商合作經(jīng)驗(yàn);3)、傳統(tǒng)手機(jī)SoC廠商和IP廠商都在開(kāi)發(fā)自 己的AI加速器,傳統(tǒng)IP巨頭可以采取IP打包銷售的方式推廣其AI-IP產(chǎn)品。相比之下新進(jìn)廠
45、商在成本、功能、產(chǎn)品線、匹配 度等都不占優(yōu)的情況下很難在該領(lǐng)域存活。新進(jìn)廠商應(yīng)加強(qiáng)其軟件方面優(yōu)勢(shì),并加深與手機(jī)廠商合作共同進(jìn)行手機(jī)AI功能開(kāi)發(fā)。來(lái)源:公開(kāi)網(wǎng)絡(luò)數(shù)據(jù),艾瑞研究院。來(lái)源:CounterPoint,中金研究部。主要手機(jī)AI芯片解決方案2017年手機(jī)SoC芯片市場(chǎng)份額41%21%18%6%8%5%1%QualcommHisiliconAppleSpreadtrumMediaTekSamsungOthers應(yīng)用場(chǎng)景3:自動(dòng)駕駛來(lái)源:IHS,,天風(fēng)證券研究所,艾瑞研究院。302194100810.0%14.040.0%39.0%30.0%12.0% 14.5% 16.0%18.0% 20.
46、0%21.0%21.0%2.8%4.4%7.0%10.0%13.0%4.0%7.2% 10.5%15.0%0.6%1.0%1.8%0.0%0.3%0.6%1.2%2.3%687347056573278755727867648320543305952363595666202001045.0%48.0%49.0% 48.0%47.0%43.0%35.0%31.0%30.0%0.2%0.4%10.0%14.0%21.0%31.0%41.0%48.0%53.0%57.0%59.0%61.0%62.0%62.0%63.0%64.0%66.0%前景廣闊,但510年內(nèi)L45進(jìn)入乘用車平臺(tái)困難較大根據(jù)美國(guó)汽車
47、工程師協(xié)會(huì)(SAE)將自動(dòng)駕駛按照車輛行駛對(duì)于系統(tǒng)依賴程度分為L(zhǎng)0L5六個(gè)級(jí)別,L0為車輛行駛完全依 賴駕駛員操縱,L3級(jí)以上系統(tǒng)即可在特定情況下實(shí)現(xiàn)駕駛員脫手操作,而L5級(jí)則是在全場(chǎng)景下車輛行駛完全實(shí)現(xiàn)對(duì)系統(tǒng)的 依賴。目前商業(yè)化乘用車車型中僅有Audi A8、Tesla、凱迪拉克等部分車型可實(shí)現(xiàn)L2、3級(jí)ADAS。預(yù)計(jì)在2020年左右,隨 著傳感器、車載處理器等產(chǎn)品的進(jìn)一步完善,將會(huì)有更多的L3級(jí)車型出現(xiàn)。而L4、5級(jí)自動(dòng)駕駛預(yù)計(jì)將會(huì)率先在封閉園區(qū) 中的商用車平臺(tái)上實(shí)現(xiàn)應(yīng)用落地,更廣泛的乘用車平臺(tái)高級(jí)別自動(dòng)駕駛,需要伴隨著技術(shù)、政策、基礎(chǔ)設(shè)施建設(shè)的進(jìn)一步 完善,預(yù)計(jì)至少在2025年2030年
48、以后才會(huì)出現(xiàn)在一般道路上。2016-2030年全球汽車市場(chǎng)自動(dòng)駕駛滲透率預(yù)測(cè)9581134662016L120172018e2019e-L5總車輛數(shù)(千輛)2020e2021e2022e2023e2024eL1/L2滲透率(%)L3滲透率(%)2025e2026eL4/L5滲透率(%2027e2028e2029e2030e)L1-L5總滲透率(%)252019.6 iResearch Inc.自動(dòng)駕駛與汽車電子發(fā)展趨勢(shì)高級(jí)ADAS/自動(dòng)駕駛需要中央“CPU+XPU”異構(gòu)處理器目前汽車電子控制系統(tǒng)是分布式ECU架構(gòu),不同的信息娛樂(lè)、車身、車輛運(yùn)動(dòng)和動(dòng)力總成系統(tǒng)及其細(xì)分功能分別由不同獨(dú) 立的ECU
49、單元進(jìn)行獨(dú)立控制,部分高檔車型上的ECU數(shù)量超過(guò)100個(gè)。未來(lái)隨著汽車進(jìn)入L3級(jí)以上的高級(jí)別自動(dòng)駕駛時(shí)代, 隨著車載傳感器數(shù)量及其所產(chǎn)生的數(shù)據(jù)量劇增,分布式電子系統(tǒng)難以滿足對(duì)大量、多元的傳感器數(shù)據(jù)進(jìn)行高效融合處理, 并綜合所有傳感器數(shù)據(jù)做出車輛控制決策等一系列操作需求。要滿足以上功能需求,汽車電子系統(tǒng)由需要向著域控制器(DCU)、多域控制器(MDC)等集中化方向發(fā)展,未來(lái),汽車電子操控系統(tǒng)將會(huì)進(jìn)一步向著集中化、軟硬件解耦及平 臺(tái)化方向發(fā)展,汽車將會(huì)由統(tǒng)一的超算平臺(tái)對(duì)傳感器數(shù)據(jù)進(jìn)行處理、融合、決策最終實(shí)現(xiàn)高級(jí)別的自動(dòng)駕駛功能。傳統(tǒng):分布式ECU汽車電子操縱系統(tǒng)未來(lái):中央計(jì)算單元+操作平臺(tái)硬件層硬
50、件抽象層HAL中央處理器(冗余設(shè)置)操作系統(tǒng)/軟件車身系統(tǒng)動(dòng)力總成 總線車輛運(yùn)動(dòng)系統(tǒng) 信息娛樂(lè)系統(tǒng)262019.6 iResearch Inc.Lv12Lv3Lv45傳感器毫米波1346610攝像頭12468激光雷達(dá)N/A0113算力需求50TOPS來(lái)源:恩智浦、德?tīng)柛?、公開(kāi)網(wǎng)絡(luò)數(shù)據(jù),艾瑞研究院自主繪制。自動(dòng)駕駛與AI芯片DRIVE OS(底層開(kāi)發(fā)平臺(tái))NV MediaCUDATensorRTDeveloper ToolsDRIVEWORKS(服務(wù)器平臺(tái)配套解決方案)DRIVE AV(自動(dòng)駕駛功能方案)DRIVE IX(人機(jī)交互方案)DRIVE CoreDRIVE CalibrationDRI
51、VE NetworksDRIVEPerceptionDRIVEMappingDRIVEPlanningVisualizatio nAICoPilot來(lái)源:英偉達(dá)官網(wǎng)。272019.6 iResearch Inc.AIAssistanceDRIVE PXParker AutoChaufferDRIVE PXParker AutoCruiseDRIVEXavierDRIVEPegasus英偉達(dá)-SelfDriving HardwareAI芯片廠商需提供可編譯的“硬件+軟件”產(chǎn)品解決方案伴隨人工智能技術(shù)在視覺(jué)領(lǐng)域的應(yīng)用,基于視覺(jué)技術(shù)的自動(dòng)駕駛方案逐漸變?yōu)榭赡?,這需要在傳統(tǒng)行車電腦平臺(tái)上添加用 于視覺(jué)
52、算法處理的AI芯片。自動(dòng)駕駛汽車計(jì)算單元設(shè)計(jì)需要考慮算力、功耗體積等問(wèn)題,出于硬件資源最優(yōu)化應(yīng)用,往往 采取異構(gòu)計(jì)算平臺(tái)設(shè)計(jì)方案,及“CPU+XPU”(XPU包括:DSP/GPU/FPGA/ASIC),其中可采取DSP用于圖像特征提 取任務(wù)、GPU/FPGA/ASIC等計(jì)算單元用于目標(biāo)識(shí)別、追蹤任務(wù)等,而CPU則會(huì)用于定位、決策等邏輯運(yùn)算任務(wù)。目前最典型的產(chǎn)品如英偉達(dá)的DRIVE PX系列及后續(xù)的Xavier、Pegasus等。除硬件計(jì)算平臺(tái)外,英偉達(dá)為客戶提供配套的 軟件平臺(tái)及開(kāi)放的上層傳感器布局和自定義模塊使得客戶能夠根據(jù)自身需要進(jìn)行二次開(kāi)發(fā),其還為客戶提供感知、制圖以 及行駛策略等解決方
53、案。目前其產(chǎn)品已經(jīng)被包括ZF、Bosch、Audi、Benz以及Tesla等Tier1s、OEMs廠商及諸多自動(dòng)駕駛 創(chuàng)業(yè)公司采用作為其處理器方案所使用。行業(yè)需要完整的硬件+軟件整體解決方案(英偉達(dá) GPU+Software Stack)自動(dòng)駕駛芯片市場(chǎng)來(lái)源:英偉達(dá)官網(wǎng)、Mobileye官網(wǎng)。282019.6 iResearch Inc.廠商SoC結(jié)構(gòu)性能英偉達(dá)AutoCruise2*Denver+4*Cortex A57+2*Pascal GPU 256 CUDA coresAutoChauffeur4*Denver+8*Cortex A57+4*Pascal GPU 512 CUDA co
54、res+2*dedicated M*M modules20TFLOPS(FP16)/250WXavier8* custom ARM64+Volta GPGPU 512 CUDA cores20 TOPS(INT8 )/30WPegasus16* Custom ARM64+2* Volta GPGPU CUDA cores+2*Volta GPU320TOPS((INT8)/500WMobileye(Intel)EyeQ30.256TFLOPS/2.5WEyeQ4MIPS Warrior CPU+6*VMP(Vector Microcode Processors)+MPC(Multithread
55、ed Processing Cluster);2.5TOPS/3WEyeQ58*CPU+18*Computer Vision Processors17TOPS/5W前裝市場(chǎng)壁壘高企,企業(yè)需有深厚的汽車電子設(shè)計(jì)經(jīng)驗(yàn)積累在全部的邊緣計(jì)算場(chǎng)景中,用于自動(dòng)駕駛的計(jì)算芯片設(shè)計(jì)難度最大,這主要體現(xiàn)在:1)算力要求高, L3級(jí)以上自動(dòng)駕駛 需要復(fù)數(shù)種類的傳感器實(shí)現(xiàn)傳感器冗余,包括:612顆單目攝像頭、312臺(tái)毫米波雷達(dá)、5臺(tái)以內(nèi)的激光雷達(dá)等(不同方 案配置側(cè)重不同),因此產(chǎn)生的數(shù)據(jù)量極大( 估計(jì)L5級(jí)一天可產(chǎn)生數(shù)據(jù)量4000GB),在車輛高速行駛的情況下系統(tǒng)需要 能夠快速對(duì)數(shù)據(jù)進(jìn)行處理;2)汽車平臺(tái)同樣是由
56、電池供電,因此對(duì)于計(jì)算單元功耗有較高的要求,早期計(jì)算平臺(tái)功耗大、 產(chǎn)熱也較大,對(duì)于系統(tǒng)的續(xù)航及穩(wěn)定性都有較大的印象;3)汽車電子需要滿足ASIL-D車規(guī)級(jí)電子產(chǎn)品設(shè)計(jì)標(biāo)準(zhǔn),而使自 動(dòng)駕駛所需要的中央處理器達(dá)到ASIL-D級(jí)設(shè)計(jì)標(biāo)準(zhǔn)難度更大。目前自動(dòng)駕駛市場(chǎng)尚處于發(fā)展早期,市場(chǎng)環(huán)境不夠成熟,但以英偉達(dá)、Intel(Mobileye、Altera)等科技巨頭為代表的廠 商已經(jīng)投入巨資在該領(lǐng)域開(kāi)發(fā)出了相關(guān)的硬件產(chǎn)品及配套軟件技術(shù)。人工智能芯片創(chuàng)業(yè)公司應(yīng)該加強(qiáng)與OEMs、Tier1或產(chǎn) 業(yè)聯(lián)盟合作為其提供AI芯片+軟件工具鏈的全套解決方案。行業(yè)主流自動(dòng)駕駛核心處理器芯片解決方案邊緣計(jì)算AI芯片技術(shù)發(fā)展
57、趨勢(shì)XPU for Edge終端AI芯片多被集成 于SoC中,為客戶提供 完整的解決方案云端開(kāi)發(fā)平臺(tái)軟件開(kāi)發(fā)工具鏈采用ASIC設(shè)計(jì)專用的 AI加速單元,實(shí)現(xiàn)運(yùn) 算效能最大化低功耗/高效能可編程適當(dāng)降低AI推斷的量 化比特精度提升存訪效率小型化/低成片外存儲(chǔ)單元的依賴本近數(shù)據(jù)運(yùn)算,存內(nèi)計(jì)算對(duì)模型進(jìn)行剪枝處理, 降低模型復(fù)雜度針對(duì)自動(dòng)駕駛、智能手 機(jī)等場(chǎng)景,為客戶提供 可進(jìn)行二次開(kāi)發(fā)的產(chǎn)品提升基本運(yùn)算單元效率簡(jiǎn)化MAC運(yùn)算時(shí)鐘門控Clock- gating企業(yè)應(yīng)該具有系統(tǒng)級(jí)設(shè)計(jì)能力,為客戶提供完整個(gè)解決方案邊緣計(jì)算場(chǎng)景呈現(xiàn)多樣化分布,除我們提到的安防監(jiān)控、移動(dòng)互聯(lián)網(wǎng)、自動(dòng)駕駛以外還涉及智慧家具、智
58、能制造、智慧醫(yī) 療等多樣化物聯(lián)網(wǎng)場(chǎng)景。不同的應(yīng)用場(chǎng)景基于計(jì)算任務(wù)、場(chǎng)景限制等,對(duì)AI芯片在算力、功耗、成本等方面提出了不同的 要求。但總體來(lái)看,相對(duì)于云計(jì)算中心來(lái)說(shuō),邊緣計(jì)算場(chǎng)景要求AI芯片在芯片體積、功耗、成本方面做到更經(jīng)濟(jì),由于邊 緣計(jì)算場(chǎng)景主要執(zhí)行推斷任務(wù),芯片算力及計(jì)算精度相對(duì)于云計(jì)算中心可適量下調(diào)。由于在功耗、面積、成本方面的限制, AI芯片企業(yè)往往需要將AI芯片作為協(xié)處理器內(nèi)置于SoC中,因此對(duì)于企業(yè)的SoC系統(tǒng)級(jí)產(chǎn)品開(kāi)發(fā)能力提出了較強(qiáng)的要求。 此外,對(duì)于復(fù)雜應(yīng)用場(chǎng)景,如自動(dòng)駕駛等,芯片企業(yè)應(yīng)為客戶提供硬件+軟件開(kāi)發(fā)環(huán)境的全套解決方案。邊緣計(jì)算場(chǎng)景AI芯片設(shè)計(jì)思路及發(fā)展趨勢(shì)提升片上
59、存儲(chǔ),降低對(duì)來(lái)源:艾瑞研究院繪制。292019.6 iResearch Inc.30AI芯片行業(yè)概述1AI芯片應(yīng)用場(chǎng)景及市場(chǎng)需求分析2AI芯片行業(yè)產(chǎn)業(yè)鏈及商業(yè)模式分析3AI芯片行業(yè)發(fā)展展望4企業(yè)推薦5AI芯片行業(yè)產(chǎn)業(yè)鏈FablessFoundryOSAT注釋: Fabless/Fab-lite指:無(wú)晶圓生產(chǎn)模式。來(lái)源:艾瑞研究院。云端312019.6 iResearch Inc.邊緣半導(dǎo)體行業(yè)產(chǎn)業(yè)鏈長(zhǎng),具有資本和技術(shù)壁壘雙高的行業(yè)特點(diǎn)半導(dǎo)體行業(yè)產(chǎn)業(yè)鏈從上游到下游大體可分為:設(shè)計(jì)軟件(EDA)、設(shè)備、材料(晶圓及耗材)、IC設(shè)計(jì)、代工、封裝等。 Fabless與IDM廠商負(fù)責(zé)芯片設(shè)計(jì)工作,其中I
60、DM廠商是指集成了設(shè)計(jì)、制造、封裝、銷售等全流程的廠商,一般是一些科 技巨頭公司,F(xiàn)abless廠商相比IDM規(guī)模更小,一般只負(fù)責(zé)芯片設(shè)計(jì)工作。分工模式(Fabless-Foundry)的出現(xiàn)主要是由于芯片制程工藝的不斷發(fā)展,工藝研發(fā)費(fèi)用及產(chǎn)線投資升級(jí)費(fèi)用大幅上升 導(dǎo)致一般芯片廠商難以覆蓋成本,而 Foundry廠商則是統(tǒng)一對(duì)Fabless和IDM的委外訂單進(jìn)行流片,形成規(guī)?;a(chǎn)優(yōu)勢(shì),保證盈利的同時(shí)不斷投資研發(fā)新的制程工藝,是摩爾定律的主要推動(dòng)者。當(dāng)前在半導(dǎo)體產(chǎn)業(yè)鏈中,我國(guó)在上游軟件、設(shè)備、 高端原材料以及代工制造與全球一線廠商差距較大,而在封裝環(huán)節(jié)擁有長(zhǎng)電、華天、通富微等行業(yè)前十企業(yè),今年
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 預(yù)算合同管理規(guī)范升級(jí)版
- 銅仁市重點(diǎn)中學(xué)2025屆高三下學(xué)期質(zhì)量考評(píng)(八)英語(yǔ)試題試卷含解析
- 山西省朔州市懷仁縣2025年小升初素養(yǎng)數(shù)學(xué)檢測(cè)卷含解析
- 上??萍即髮W(xué)《醫(yī)學(xué)科研與設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 南陽(yáng)市重點(diǎn)中學(xué)2024-2025學(xué)年高三下學(xué)期學(xué)業(yè)質(zhì)量監(jiān)測(cè)生物試題試卷含解析
- 四川文軒職業(yè)學(xué)院《生物醫(yī)藥產(chǎn)業(yè)分析概論》2023-2024學(xué)年第二學(xué)期期末試卷
- 江蘇省五校揚(yáng)子中學(xué)2025屆高三第一次調(diào)研考試(物理試題理)試卷含解析
- 山東省東營(yíng)市勝利油田59中學(xué)2025年初三下學(xué)期期末模擬考試化學(xué)試題含解析
- 寧波衛(wèi)生職業(yè)技術(shù)學(xué)院《化工原理實(shí)驗(yàn)Ⅰ(1)》2023-2024學(xué)年第二學(xué)期期末試卷
- 林芝地區(qū)米林縣2024-2025學(xué)年三下數(shù)學(xué)期末綜合測(cè)試模擬試題含解析
- 項(xiàng)目經(jīng)理變更說(shuō)明(申請(qǐng))
- 機(jī)房動(dòng)力環(huán)境監(jiān)控課件
- 油氣管道高后果區(qū)管段識(shí)別分級(jí)表
- 危險(xiǎn)性較大的分部分項(xiàng)工程監(jiān)理實(shí)施細(xì)則1
- 供貨進(jìn)度及保證方案
- 腳手架穩(wěn)定計(jì)算
- 信息系統(tǒng)網(wǎng)絡(luò)安全應(yīng)急預(yù)案
- 掉落物落地品管理規(guī)定
- 科姆龍變頻器說(shuō)明書kv2000
- 小學(xué)生讀書知識(shí)競(jìng)賽試題
- 藍(lán)色簡(jiǎn)約法律通用PPT模板
評(píng)論
0/150
提交評(píng)論