




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
Equity–
AsiaResearch自動駕駛芯片研究框架ResearchFrameworkOfAutopilot
ChipsField2023年1月15日1.自動駕駛與智能座艙芯片一體化趨勢明顯,自動駕駛芯片具有高算力發(fā)展趨勢。市場容量未來5年將會高速增長。2.目前自動駕駛芯片企業(yè)中英偉達(dá)依托自己的前期GPU積累和算力優(yōu)勢,CUDA生態(tài)占據(jù)市場領(lǐng)導(dǎo)地位。3.市場滲透率仍低同時還未固化,需求和技術(shù)路線仍在探索。國內(nèi)自動駕駛芯片企業(yè)有望依托國內(nèi)強(qiáng)勢新能源車企業(yè)獲得突破。投資建議:關(guān)注國內(nèi)自動駕駛芯片企業(yè)和車企配套過程,大批量產(chǎn)品落地將會加速企業(yè)產(chǎn)品硬件軟件算法端更迭,加強(qiáng)自身壁壘。風(fēng)險提示:市場宏觀和市場規(guī)模不及預(yù)期,研發(fā)節(jié)奏和產(chǎn)品推進(jìn)不及預(yù)期,供應(yīng)鏈穩(wěn)定程度不足。Forfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
2自動駕駛芯片研究框架1.
自動駕駛芯片概況1.1自動駕駛芯片簡介1.2自動駕駛芯片產(chǎn)品趨勢2.
自動駕駛芯片架構(gòu)分析2.1GPU方案2.2FPGA方案2.3ASIC方案2.4主流架構(gòu)方案對比2.5事件相機(jī)簡介3.
自動駕駛芯片部分重點(diǎn)企業(yè)分析3.1英偉達(dá)3.2英特爾Mobileye3.3特斯拉3.4地平線3.53.6黑芝麻智能3.7芯馳科技3.8芯擎科技3.9國內(nèi)企業(yè)如何破局Forfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
31自動駕駛芯片概況AEC-Q100AEC-Q101ISO16750車規(guī)級芯片要求更加嚴(yán)苛車規(guī)級芯片市場概況車規(guī)級芯片自動駕駛芯片概況自動駕駛芯片市場規(guī)模產(chǎn)品趨勢:一體化英偉達(dá)一體化高通一體化向先進(jìn)制程延伸與高算力Forfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
41.1
自動駕駛芯片簡介:車規(guī)級芯片要求更加嚴(yán)苛
芯片按應(yīng)用場景可分為消費(fèi)芯片、工業(yè)芯片、汽車芯片和軍工芯片等。汽車是芯片應(yīng)用場景之一,汽車芯片需要具備車規(guī)級。
車規(guī)級芯片對加工工藝要求不高,但對質(zhì)量要求高。需要經(jīng)過的認(rèn)證過程,包括質(zhì)量管理標(biāo)準(zhǔn)ISO/TS16949、可靠性標(biāo)準(zhǔn)AEC-Q100、功能安全標(biāo)準(zhǔn)ISO26262等。
汽車內(nèi)不同用途的芯片要求也不同,美國制定的汽車電子標(biāo)準(zhǔn)把其分為5級。汽車各系統(tǒng)對芯片要求由高到低依次是:動力安全系統(tǒng)
>車身控制系統(tǒng)
>行駛控制系統(tǒng)
>
通信系統(tǒng)
>娛樂系統(tǒng)。車載芯片應(yīng)用分布車載芯片應(yīng)用分布表子系統(tǒng)主要應(yīng)用的芯片子系統(tǒng)主要應(yīng)用的芯片??????MCU/AP/DSPDRAMNAND/eMMCCOMSLED????LEDMCNCIS車內(nèi)車身底盤傳感器顯示芯片????MCUASICASSP功率半導(dǎo)體??MCU功率半導(dǎo)體動力資料:焉知智能汽車,搜狐汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
51.1
自動駕駛芯片簡介:車規(guī)級芯片要求更加嚴(yán)苛
車規(guī)級芯片特殊的技術(shù)和工藝要求擋住了企業(yè)進(jìn)入的腳步。車規(guī)級芯片有著比消費(fèi)級芯片更高的技術(shù)門檻,需滿足溫度、振動、電磁干擾、長使用壽命等高要求,還要通過可靠性標(biāo)準(zhǔn)AEC-Q100、
質(zhì)量管理標(biāo)準(zhǔn)ISO/TS16949、功能安全標(biāo)準(zhǔn)ISO26262等嚴(yán)苛的認(rèn)證流程,大部分芯片企業(yè)尚不具備轉(zhuǎn)型進(jìn)入能力。
目前,車規(guī)級芯片在傳統(tǒng)汽車中的成本約為
2270元
/車,在新能源汽車中的成本約為
4540元
/車。隨著汽車向電動化和智能化發(fā)展,芯片的種類、數(shù)量和價格占比將進(jìn)一步提高。整車芯片價格預(yù)測(單位:元)不同等級芯片技術(shù)要求參數(shù)要求溫度商業(yè)級芯片工業(yè)級芯片-40~+85℃車規(guī)級芯片-40~+125℃0%~100%1500016000140001200010000800060004000200000~+70℃濕度低根據(jù)使用環(huán)境而定8000JESD47(Chips)ISO16750(Modules)JESD47(Chips)ISO16750(Modules)AEC-Q100AEC-Q101ISO16750驗(yàn)證4540350030002570(Modules)出錯率<3%<1%020202030E新能源車
燃油車2050E使用時間供貨時間1~3年5~10年高至5年10~15年高至30年高至2年資料:《時代汽車》,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
61.1
自動駕駛芯片簡介:車規(guī)級芯片要求更加嚴(yán)苛
AEC-Q100
關(guān)鍵測試類別包括:AcceleratedEnvironment
Stress(加速環(huán)境應(yīng)力);Accelerate
Lifetime
Simulation
(加速壽命仿真);Packaging/Assembly(封裝/組裝);DieFabrication(芯片制程);ElectricalVerification(電氣驗(yàn)證);DefectScreening
(不良品篩選);CavityPackage
Integrity
(腔體封裝完整性)。
AEC的系列文件正是希望通過消除制造商和采購商之間的誤解,促進(jìn)信息互換,改進(jìn)產(chǎn)品,協(xié)助采購商在最短的時間內(nèi)挑選合適的產(chǎn)品。
AEC-Q100
自首次亮相以來經(jīng)歷了多次修訂。
每次修訂都與汽車行業(yè)的發(fā)展有關(guān),
AEC的政策也會同步更新。在眾多的AEC質(zhì)量認(rèn)證標(biāo)準(zhǔn)中,
AEC-Q102是針對分立光電半導(dǎo)體在汽車應(yīng)用中,
基于失效機(jī)制的壓力測試認(rèn)證。這些測試主要測量
光電元件的強(qiáng)度、安全性、可靠性和整體可行性。每個測試都有失敗標(biāo)準(zhǔn)和驗(yàn)收標(biāo)準(zhǔn)。以激光組件為例,
包括單一純激光芯片,及激光芯片、光學(xué)元件和其他轉(zhuǎn)換器的封裝組合。AEC-Q100修訂過程資料:知乎,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
71.1
自動駕駛芯片簡介:車規(guī)級芯片要求更加嚴(yán)苛
ISO/TS16949:2009是對汽車生產(chǎn)和相關(guān)配件組織應(yīng)用ISO9001:2008的特殊要求,其適用于汽車生產(chǎn)供應(yīng)鏈的組織形式。國內(nèi)、外各大整車廠均已要求其供應(yīng)商進(jìn)行ISO/TS16949:2009認(rèn)證,確保各供應(yīng)商具有高質(zhì)量的運(yùn)行業(yè)績,并提供持續(xù)穩(wěn)定的長期合作,以實(shí)現(xiàn)互惠互利。因美國或歐洲的汽車零部件供應(yīng)商同時向各大整車廠提供產(chǎn)品,這就要求其必須既要滿足QS-9001,又要滿足如VDA6.1,造成各供應(yīng)商針對不同標(biāo)準(zhǔn)的重復(fù)認(rèn)證,這就急需要求出臺一套國際通用的汽車行業(yè)質(zhì)量體系標(biāo)準(zhǔn),以同時滿足各大整車廠要求,ISO/TS16949:2009就此應(yīng)運(yùn)而生。
隨著汽車行業(yè)復(fù)雜性的日益提升,人們加大了開發(fā)安全合規(guī)系統(tǒng)的力度。例如,現(xiàn)代汽車使用了油門線控等線控系統(tǒng)。駕駛員踩油門時,踏板中的傳感器將向電子控制單元發(fā)送信號。該控制單元會對多種因素進(jìn)行分析,如發(fā)動機(jī)轉(zhuǎn)速、車輛速度及踏板位置,然后向油門傳遞指令。要測試和驗(yàn)證油門線控這類系統(tǒng),對汽車行業(yè)來說是個不小的挑戰(zhàn)。ISO26262的目標(biāo)是為所有汽車E/E系統(tǒng)提供統(tǒng)一的安全標(biāo)準(zhǔn)。IOS26262標(biāo)準(zhǔn)資料:百度百科,NI官網(wǎng),HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
81.1
自動駕駛芯片簡介:車規(guī)級芯片市場概況
車規(guī)級芯片領(lǐng)域長期被發(fā)達(dá)國家壟斷。車規(guī)級芯片分為控制芯片、微處理器芯片、存儲芯片、模擬芯片及功率器件等。當(dāng)前,以美、歐、日、韓為代表的發(fā)達(dá)國家行業(yè)巨頭,長期占據(jù)著車規(guī)級芯片的技術(shù)制高點(diǎn)和主要市場份額,歐、美、日分別占據(jù)
37%、30%和25%
的市場。行業(yè)內(nèi)
TOP8
企業(yè)占據(jù)60%以上市場份額。車規(guī)級芯片市場各國占比車規(guī)級芯片市場頭部企業(yè)占比3.50%4.50%14%37%11%37%25%10%3%8%4%7%6%30%歐洲
美國
日本
中國
其他恩智浦德州儀器安森美英飛凌德法半導(dǎo)體微芯科技瑞薩博世其他資料:《中國投資》,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
91.1
未來自動駕駛芯片市場規(guī)模將持續(xù)擴(kuò)大
根據(jù)《智能網(wǎng)聯(lián)技術(shù)路線2.0》對自動駕駛滲透率的預(yù)測,2025年中國L2/L3滲透率將達(dá)50%,2030年中國L2/L3滲透率70%,L4滲透率20%?;诖?,預(yù)計2030年中國自動駕駛芯片的市場規(guī)模為813億元,其中L2/L3芯片市場規(guī)模493億元,L4/L5芯片市場規(guī)模320億元;全球市場規(guī)模為2224億元,L2/L3芯片市場規(guī)模1348億元,L4/L5芯片市場規(guī)模876億元。2021-2030中國自動駕駛芯片市場規(guī)模2021-2030全球自動駕駛芯片市場規(guī)模12001000800600400200040.00%20.00%0.00%30002500200040.00%20.00%0.00%-20.00%-40.00%-60.00%-80.00%-100.00%-20.00%
1500-40.00%
1000-60.00%-80.00%50002021E
2022E
2023E
2024E
2025E
2026E
2027E
2028E
2029E
2030E2021E
2022E
2023E
2024E
2025E
2026E
2027E
2028E
2029E
2030EL2/L3芯片市場規(guī)模(億元)L4/L5芯片市場規(guī)模(億元)中國市場規(guī)模YOYL2/L3芯片市場規(guī)模(億元)
L4/L5芯片市場規(guī)模(億元)
全球市場規(guī)模YOY資料:《智能網(wǎng)聯(lián)技術(shù)路線2.0》,《汽車觀察》
2021年9月刊,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
101.1
未來自動駕駛芯片市場規(guī)模將持續(xù)擴(kuò)大2021-2025全球各等級自動駕駛芯片滲透率與市場規(guī)模自動駕駛芯片等級L1-L2L3L4-L52021年滲透率40%5%0%2021年市場規(guī)模(億美元)8.81.102022年滲透率28%23%0%2022年市場規(guī)模(億美元)11.181.8202023年滲透率35%32.430%30%7.22%0.726%2023年市場規(guī)模(億美元)2024年滲透率34%2024年市場規(guī)模(億美元)40.825%5010.239%152.5511%52025年滲透率2025年市場規(guī)模(億美元)資料:HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
111.2
自動駕駛芯片產(chǎn)品趨勢:一體化
云和邊緣計算的數(shù)據(jù)中心,以及自動駕駛等超級終端領(lǐng)域,都是典型的復(fù)雜計算場景,這類場景的計算平臺都是典型的大算力芯片。大芯片的發(fā)展趨勢已經(jīng)越來越明顯的從GPU、DSA的分離趨勢走向DPU、超級終端的再融合,未來會進(jìn)一步融合成超異構(gòu)計算宏系統(tǒng)芯片。
BOSCH給出了汽車電氣架構(gòu)演進(jìn)示意圖。從模塊級的ECU到集中相關(guān)功能的域控制器,再到完全集中的車載計算機(jī)。每個階段還分了兩個子階段,例如完全集中的車載計算機(jī)還包括了本地計算和云端協(xié)同兩種方式。汽車電氣架構(gòu)特征BOSCH汽車電氣架構(gòu)演進(jìn)示意圖分布式ECU架構(gòu)域集中式架構(gòu)中央計算式架構(gòu)開放式軟件平臺算力與數(shù)據(jù)無法在不同模塊共享網(wǎng)作為通信骨干增加傳感器和ECU時需部署大量通信總線,增加裝配難度和車身重量以SoC為基礎(chǔ),MCU相配合中央-層-區(qū)架構(gòu)特征無法進(jìn)行統(tǒng)一編程和軟件升級承載的信息處理量有限功能劃分集中化車輛-云端交互體系實(shí)現(xiàn)開放軟件平臺與資源共享限制了高性能傳感器和芯片的搭載能力資料:
《汽車觀察》
2021年9月刊,電子工程世界,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
121.2
自動駕駛芯片產(chǎn)品趨勢:一體化之英偉達(dá)
英偉達(dá)創(chuàng)始人黃仁勛在2022秋季GTC大會上發(fā)布了新自動駕駛芯片——Thor。Thor的特點(diǎn):一是超高AI性能,擁有770億晶體管,而上一代的Orin是170億晶體管。AI性能為2000TFLOPS@FP8。如果是INT8格式,估計可以達(dá)到4000TOPS。二是支持FP8格式,英偉達(dá)、英特爾和ARM三家聯(lián)合力推FP8格式標(biāo)準(zhǔn),力圖打通訓(xùn)練與推理之間的鴻溝。三是超高CPU性能,Thor的CPU可能是ARM的服務(wù)器CPU架構(gòu)V2或更先進(jìn)的波塞冬平臺。四是統(tǒng)一座艙、自動駕駛和自動泊車,一顆芯片包打天下。
英偉達(dá)發(fā)布的一體化自動駕駛芯片Altan&Thor的設(shè)計思路是完全的“終局思維”,相比BOSCH給出的一步步的演進(jìn)還要更近一層,跨越集中式的車載計算機(jī)和云端協(xié)同的車載計算機(jī),直接到云端融合的車載計算機(jī)。云端融合的意思是服務(wù)可以動態(tài)的、自適應(yīng)的運(yùn)行在云或端,方便云端的資源動態(tài)調(diào)節(jié)。Altan&Thor采用的是跟云端完全一致的計算架構(gòu):Grace-next
CPU、Ampere-next
GPU以及Bluefield
DPU,硬件上可以做到云端融合。Thor算力提升明顯資料:電子工程世界,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
131.2
自動駕駛芯片產(chǎn)品趨勢:一體化之英偉達(dá)
Thor的誕生,不僅是對算力、性能的提升,黃仁勛還希望顛覆現(xiàn)有智能汽車芯片架構(gòu)。當(dāng)下,汽車的停車、主動安全、駕駛員監(jiān)控、攝像頭鏡像、集群和信息娛樂均由不同的計算設(shè)備控制。黃仁勛稱,在未來,上述功能將不再由單獨(dú)的計算設(shè)備控制,而是由在Thor上運(yùn)行的,并隨時間推移不斷改進(jìn)的軟件所提供。這意味著,Thor可被配置為多種模式,可以將其2000TOPS和2000
TFLOPs全部用于自動駕駛工作流;也可以將其配置為將一部分用于駕駛艙AI和信息娛樂,一部分用于輔助駕駛。
“Thor的多計算域隔離允許并發(fā)的、對時間敏感的多進(jìn)程無中斷運(yùn)行,你可以再一臺計算機(jī)上同時運(yùn)行Linux、QNX和Android。”黃仁勛稱,Thor集中了眾多計算資源,不僅降低了成本和功耗,同時還實(shí)現(xiàn)了功能的飛躍。英偉達(dá)Thor可被配置為多種模式資料:英偉達(dá),HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
141.2
自動駕駛芯片產(chǎn)品趨勢:一體化之高通
2020年CES上,高通推出全新自動駕駛平臺高通Snapdragon
Ride,自動駕駛芯片“驍龍
Ride”。
該平臺包括安全系統(tǒng)級芯片SoC(ADAS應(yīng)用處理器)、安全(自動駕駛專用)和自動駕駛軟件棧,可支持L1-L5級別的自動駕駛;安全系統(tǒng)級芯片SoC和安全
的功能安全安全等級為ASIL-D級;平臺高度可擴(kuò)展、開放、完全可定制化,且能夠提供功耗高度優(yōu)化的自動駕駛解決方案;平臺將于2020年上半年交付OEM和Tire1進(jìn)行前期開發(fā),搭載該平臺的汽車預(yù)計將于2023年投產(chǎn)。Snapdragon
Ride各級別自動駕駛算力、硬件支持及應(yīng)用高通SnapdragonRide車規(guī)級SoC級別算力硬件支持應(yīng)用面向具備AEB、TSR和LKA等駕駛輔助功能的汽車1個ADAS應(yīng)用處理器L1/L2級ADAS30TOPS面向具備HWA(高速輔助)、自動泊車APA以及TJA(低速輔助)功能的汽車2個或多個ADASL2+級ADAS60-125TOPS應(yīng)用處理器面向在城市交通環(huán)境中的自動駕駛乘用車、機(jī)器人出租車和機(jī)器人物流車2個ADAS應(yīng)用處理器
+2個自動駕L4/L5級自動駕
700TOPS(功駛耗130W)駛(ASIC)資料:高通,焉知智能汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
151.2
自動駕駛芯片產(chǎn)品趨勢:一體化之高通
2021年8月5日,高通發(fā)布公告,計劃以每股37美元的全現(xiàn)金交易方式(總價值約46億美元)競購自動駕駛技術(shù)公司Veoneer。
Veoneer總部位于瑞典斯德哥爾摩,但于美國特拉華州注冊成立。Veoneer專注于汽車安全電子設(shè)計、開發(fā)、制造和銷售,其目標(biāo)是成為先進(jìn)駕駛員輔助系統(tǒng)(ADAS)、協(xié)同駕駛、高度自動駕駛(HAD)解決方案和自動駕駛(AD)的領(lǐng)先系統(tǒng)供應(yīng)商。高通與Veoneer是合作伙伴關(guān)系,雙方此前曾簽署合作協(xié)議,將共同開發(fā)下一代高級駕駛輔助系統(tǒng)(ADAS)與自動駕駛系統(tǒng)(AD)。
高通總裁兼CEO克里斯蒂亞諾·安蒙(CristianoAmon)表示,隨著汽車業(yè)的持續(xù)轉(zhuǎn)型,對于汽車制造商而言,擁有一家合作伙伴來開發(fā)橫向平臺以推動創(chuàng)新,促進(jìn)競爭,變得越來越重要。擬議中的收購交易將把高通的汽車解決方案與Veoneer的輔助駕駛資產(chǎn)結(jié)合在一起,為汽車制造商和一線供應(yīng)商提供一個有競爭力和開放的ADAS平臺。高通收購Veoneer公告資料:全球半導(dǎo)體觀察,高通,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
161.2
自動駕駛芯片產(chǎn)品趨勢:一體化之高通
在CES
2022展會上高通首次發(fā)布了Snapdragon
Ride視覺系統(tǒng),該系統(tǒng)采用了其子公司Veoneer的Arriver技術(shù),將于2024年開始量產(chǎn)。
Snapdragon
Ride視覺系統(tǒng)是基于4納米制程的系統(tǒng)級芯片(SoC)打造,集成了專用高性能的Snapdragon
RideSoC和Arriver下一代視覺感知軟件棧,并采用基于定制神經(jīng)網(wǎng)絡(luò)架構(gòu)開發(fā)的800萬像素廣角攝像頭。
Snapdragon
Ride視覺系統(tǒng)采用了其子公司Veoneer的Arriver技術(shù),Arriver技術(shù)主要包括自動駕駛視覺感知、駕駛策略以及其他駕駛輔助系統(tǒng)的軟件,這也是去年高通花費(fèi)天價收購Veoneer公司的最重要的目的之一。Snapdragon
Ride視覺系統(tǒng)Snapdragon
Ride視覺系統(tǒng)的4納米SoC資料:車東西,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
171.2
自動駕駛芯片產(chǎn)品趨勢:一體化之高通
就在英偉達(dá)發(fā)布
Thor
兩天后,高通就推出“業(yè)內(nèi)首個集成式汽車超算
SOC”Snapdragon
RideFlex,單顆算力
600TOPS
以上,綜合
AI算力能夠達(dá)到
2000TOPS。Snapdragon
RideFlex確切的說是一個SoC產(chǎn)品家族,其包括Mid、High、Premium三個級別。最高級的RideFlexPremium
SoC再加上外掛的AI(可能是NPU,MAC陣列)組合起來,就可以實(shí)現(xiàn)2000TOPS的綜合AI算力。Snapdragon
RideFlex作為一個超算芯片家族,其最大的目標(biāo)是實(shí)現(xiàn)車內(nèi)的中央計算——即同時為智能駕駛、智能座艙、通信等能力提供計算支持,這也與英偉達(dá)Thor雷神芯片一致。Snapdragon
RideFlex資料:車東西,Autolab,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
181.2
自動駕駛芯片產(chǎn)品趨勢:向先進(jìn)制程延伸
高端自動駕駛芯片向先進(jìn)制程延申:用于L1-L2自動駕駛的芯片只需要28nm制程即可制造,L3及以上的高階自動駕駛對算力的要求越發(fā)苛刻,規(guī)劃中針對L4/L5自動駕駛的SoC芯片普遍需要7nm,甚至5nm的先進(jìn)制程。先進(jìn)的制程可以影響功耗,先進(jìn)的制程又可以影響集成度;而功耗則影響可靠性,集成度影響性能。
目前的
5nm制程芯片尚處于研發(fā)或發(fā)布狀態(tài),均未進(jìn)入量產(chǎn)階段;不過
7nm芯片中,已有
Orin、FSD、EyeQ5、8155
等芯片實(shí)現(xiàn)量產(chǎn),其他芯片則在未來幾年陸續(xù)實(shí)現(xiàn)量產(chǎn),這預(yù)示著先進(jìn)制程車用芯片開始進(jìn)入量產(chǎn)加速期。主流公司自動駕駛芯片制程對比公司芯片名稱ParkerXavier制程工藝16nm12nm7nm市場定位L0-L1推出時間2018L3及以上L3及以上2020Orin-X2022英偉達(dá)Atlan5nmL4-L5L32024E2018EyeQ428nmMobileyeEyeQ5EyeQ67nm7nmL1-L4L520202023EJourney2Journey528nm16nmL2及以上L2及以上20192021地平線資料:《汽車觀察》
2021年9月刊,愛集微,各公司官網(wǎng),HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
191.2自動駕駛芯片產(chǎn)品趨勢:高算力
自動駕駛時代算力不足問題逐步顯現(xiàn)。
一方面,各大車廠正在全力備戰(zhàn)高級自動駕駛的量產(chǎn),多傳感器融合已經(jīng)成為高階自動駕駛應(yīng)對復(fù)雜場景與安全冗余的必然趨勢。處理這些數(shù)據(jù)需要非常強(qiáng)大的計算能力,L2級自動駕駛的算力要求大概是10+TOPS,但是到了L4/L5級自動駕駛算力則需要達(dá)到1000+TOPS,同比翻了100倍。另一方面,包括安波福、博世等Tier1巨頭,以及大眾、寶馬等車企開始探索新型的電子電氣架構(gòu),傳統(tǒng)分布式的汽車電子電氣架構(gòu)正在向域集中式架構(gòu)演進(jìn),從而帶動了高性能大算力芯片的需求急劇上漲。現(xiàn)階段,汽車產(chǎn)業(yè)在芯片廠家的推動下進(jìn)入了算力比拼時代。各自動駕駛等級對算力需求算力(TOPS)12001000+TOPS10008006004002000500+TOPS100+TOPS<1TOPS<1TOPS10+TOPSL0L1L2L3L4L5資料:焉知智能汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
202自動駕駛芯片架構(gòu)分析GPU自動駕駛芯片方案FGPAASIC自動駕駛芯片架構(gòu)分析簡介及工作機(jī)制事件相機(jī)在自動駕駛領(lǐng)域的應(yīng)用通過減少無效計算節(jié)約算力Forfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
212.1
主流架構(gòu)方案對比:三種主流架構(gòu)
當(dāng)前主流的AI芯片主要分為三類,GPU、FPGA、ASIC。GPU、FPGA均是前期較為成熟的芯片架構(gòu),屬于通用型芯片。ASIC屬于為AI特定場景定制的芯片。行業(yè)內(nèi)已經(jīng)確認(rèn)CPU不適用于AI計算,但是在AI應(yīng)用領(lǐng)域也是必不可少。自動駕駛芯片不同架構(gòu)特點(diǎn)類別特點(diǎn)GPUFPGAASIC類腦芯片功耗低響應(yīng)速度快尚不成熟性能高功耗高通用性好可編程性、靈活功耗與通用性介于GPU與ASIC間定制化設(shè)計性能穩(wěn)定優(yōu)秀的功耗控制英偉達(dá)AMD賽靈思深鑒科技寒武紀(jì)地平線代表公司IBM資料:各公司官網(wǎng),焉知智能汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
222.1
GPU方案:GPU與CPU的架構(gòu)對比
CPU遵循的是馮·諾依曼架構(gòu),其核心是存儲程序/數(shù)據(jù)、串行順序執(zhí)行。因此CPU的架構(gòu)中需要大量的空間去放置存儲單元(Cache)和控制單元(Control),相比之下計算單元(ALU)只占據(jù)了很小的一部分,所以CPU在進(jìn)行大規(guī)模并行計算方面受到限制,相對而言更擅長于處理邏輯控制。
GPU(GraphicsProcessing
Unit),即圖形處理器,是一種由大量運(yùn)算單元組成的大規(guī)模并行計算架構(gòu),早先由CPU中分出來專門用于處理圖像并行計算數(shù)據(jù),專為同時處理多重并行計算任務(wù)而設(shè)計。GPU中也包含基本的計算單元、控制單元和存儲單元,但GPU的架構(gòu)與CPU有很大不同,其架構(gòu)圖如下所示。
與CPU相比,CPU芯片空間的不到20%是ALU,而GPU芯片空間的80%以上是ALU。即GPU擁有更多的ALU用于數(shù)據(jù)并行處理。GPU架構(gòu)圖資料Forfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
:焉知智能汽車,HTI232.1
GPU方案:GPU與CPU區(qū)別
CPU
由專為順序串行處理而優(yōu)化的幾個核心組成,而
GPU
則擁有一個由數(shù)以千計的更小、更高效的核心組成的大規(guī)模并行計算架構(gòu),這些更小的核心專為同時處理多重任務(wù)而設(shè)計。
CPU和GPU之所以大不相同,是由于其設(shè)計目標(biāo)的不同,它們分別針對了兩種不同的應(yīng)用場景。CPU需要很強(qiáng)的通用性來處理各種不同的數(shù)據(jù)類型,同時又要邏輯判斷又會引入大量的分支跳轉(zhuǎn)和中斷的處理。這些都使得CPU的內(nèi)部結(jié)構(gòu)異常復(fù)雜。而GPU面對的則是類型高度統(tǒng)一的、相互無依賴的大規(guī)模數(shù)據(jù)和不需要被打斷的純凈的計算環(huán)境。CPU與GPU核心數(shù)量對比圖資料:汽車之家,小鵬汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
242.1
GPU方案:GPU加速技術(shù)簡述
對于深度學(xué)習(xí)來說,目前硬件加速主要靠使用圖形處理單元。相比傳統(tǒng)的
CPU,GPU
的核心計算能力要多出幾個數(shù)量級,也更容易進(jìn)行并行計算。
GPU
的眾核體系結(jié)構(gòu)包含幾千個流處理器,可將運(yùn)算并行化執(zhí)行,大幅縮短模型的運(yùn)算時間。隨著
NVIDIA、AMD
等公司不斷推進(jìn)其
GPU
的大規(guī)模并行架構(gòu)支持,面向通用計算的
GPU已成為加速并行應(yīng)用程序的重要手段。
目前
GPU
已經(jīng)發(fā)展到了較為成熟的階段。利用
GPU
來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),可以充分發(fā)揮其數(shù)以千計計算核心的高效并行計算能力,在使用海量訓(xùn)練數(shù)據(jù)的場景下,所耗費(fèi)的時間大幅縮短,占用的服務(wù)器也更少。如果針對適當(dāng)?shù)纳疃壬窠?jīng)網(wǎng)絡(luò)進(jìn)行合理優(yōu)化,一塊
GPU
卡可相當(dāng)于數(shù)十甚至上百臺
CPU服務(wù)器的計算能力,因此
GPU
已經(jīng)成為業(yè)界在深度學(xué)習(xí)模型訓(xùn)練方面的首選解決方案。CPU與GPU架構(gòu)對比圖資料:CNKI,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
252.1
GPU方案:GPU加速技術(shù)簡述
當(dāng)訓(xùn)練的模型規(guī)模比較大時,可以通過數(shù)據(jù)并行的方法來加速模型的訓(xùn)練,數(shù)據(jù)并行可以對訓(xùn)練數(shù)據(jù)做切分,同時采用多個模型實(shí)例對多個分塊的數(shù)據(jù)同時進(jìn)行訓(xùn)練。在數(shù)據(jù)并行的實(shí)現(xiàn)中,由于是采用同樣的模型、不同的數(shù)據(jù)進(jìn)行訓(xùn)練,影響模型性能的瓶頸在于多
CPU
或多
GPU
間的參數(shù)交換。根據(jù)參數(shù)更新公式,需要將所有模型計算出的梯度提交到參數(shù)服務(wù)器并更新到相應(yīng)參數(shù)上,所以數(shù)據(jù)片的劃分以及與參數(shù)服務(wù)器的帶寬可能會成為限制數(shù)據(jù)并行效率的瓶頸。
除了數(shù)據(jù)并行,還可以采用模型并行的方式來加速模型的訓(xùn)練。模型并行是指將大的模型拆分成幾個分片,由若干個訓(xùn)練單元分別持有,各個訓(xùn)練單元相互協(xié)作共同完成大模型的訓(xùn)練。數(shù)據(jù)并行的基本架構(gòu)模型并行的基本架構(gòu)資料:CNKI,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
262.1
GPU方案:GPU加速計算
GPU
加速計算是指同時利用圖形處理器
(GPU)
和
CPU,加快科學(xué)、分析、工程、消費(fèi)和企業(yè)應(yīng)用程序的運(yùn)行速度。GPU于
2007年由
NVIDIA率先推出,現(xiàn)已在世界各地為政府實(shí)驗(yàn)室、高校、公司以及中小型企業(yè)的高能效數(shù)據(jù)中心提供支持。GPU
能夠使從汽車、手機(jī)和平板電腦到無人機(jī)和機(jī)器人等平臺的應(yīng)用程序加速運(yùn)行。
GPU
加速計算可以提供非凡的應(yīng)用程序性能,能將應(yīng)用程序計算密集部分的工作負(fù)載轉(zhuǎn)移到
GPU,同時仍由
CPU
運(yùn)行其余程序代碼。從用戶的角度來看,應(yīng)用程序的運(yùn)行速度明顯加快。
GPU當(dāng)前只是單純的并行矩陣的乘法和加法運(yùn)算,對于神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建和數(shù)據(jù)流的傳遞還是在CPU上進(jìn)行。CPU
與GPU的交互流程:獲取GPU信息,配置GPU
id、加載神經(jīng)元參數(shù)到GPU、GPU加速神經(jīng)網(wǎng)絡(luò)計算、接收GPU計算結(jié)果。GPU如何加速計算CPU如何輔助GPU實(shí)現(xiàn)加速資料:小鵬汽車,焉知智能汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
272.1
GPU方案:為什么GPU在自動駕駛領(lǐng)域如此重要
自動駕駛技術(shù)中最重要的技術(shù)范疇之一是深度學(xué)習(xí),基于深度學(xué)習(xí)架構(gòu)的人工智能如今已被廣泛應(yīng)用于計算機(jī)視覺、自然語言處理、傳感器融合、目標(biāo)識別、自動駕駛等汽車行業(yè)的各個領(lǐng)域,從自動駕駛初創(chuàng)企業(yè)、互聯(lián)網(wǎng)公司到各大OEM廠商,都正在積極探索通過利用GPU構(gòu)建神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)最終的自動駕駛。
GPU加速計算誕生后,它為企業(yè)數(shù)據(jù)提供了多核并行計算架構(gòu),支撐了以往CPU架構(gòu)無法處理的數(shù)據(jù)源。根據(jù)對比,為了完成相同的深度學(xué)習(xí)訓(xùn)練任務(wù),使用GPU計算集群所需要的成本只是CPU計算集群的200分之一。自動駕駛訓(xùn)練基本流程圖資料:小鵬汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
282.1
GPU方案:GPU是自動駕駛與深度學(xué)習(xí)的關(guān)鍵
無論是讓汽車實(shí)時感知周邊實(shí)時環(huán)境,還是迅速規(guī)劃行車路線和動作,這些都需要依賴汽車大腦快速的響應(yīng),因此對計算機(jī)硬件廠商提出了巨大挑戰(zhàn),自動駕駛的過程中時刻需要深度學(xué)習(xí)或者人工智能算法應(yīng)對無限可能的狀況,而人工智能、深度學(xué)習(xí)和無人駕駛的蓬勃發(fā)展,帶來了GPU計算發(fā)展的黃金時代。
GPU的另一個重要參數(shù)是浮點(diǎn)計算能力。浮點(diǎn)計數(shù)是利用浮動小數(shù)點(diǎn)的方式使用不同長度的二進(jìn)制來表示一個數(shù)字,與之對應(yīng)的是定點(diǎn)數(shù)。在自動駕駛算法迭代時對精度要求較高,需要浮點(diǎn)運(yùn)算支持。自動駕駛數(shù)據(jù)訓(xùn)練資料:佐思汽車研究,小鵬汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
292.2
FPGA方案:FPGA芯片定義及結(jié)構(gòu)
FPGA(Field-Programmable
Gate
Array),即現(xiàn)場可編程門陣列,它是在PAL、GAL、CPLD等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。它是作為專用集成電路領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點(diǎn)。
FPGA芯片主要由6部分完成,分別為:可編程輸入輸出單元、基本可編程邏輯單元、完整的時鐘管理、嵌入塊式RAM、豐富的布線資源、內(nèi)嵌的底層功能單元和內(nèi)嵌專用硬件模塊。目前主流的FPGA仍是基于查找表技術(shù)的,已經(jīng)遠(yuǎn)遠(yuǎn)超出了先前版本的基本性能,并且整合了常用功能(如RAM、時鐘管理和DSP)的硬核(ASIC型)模塊。FPGA芯片內(nèi)部結(jié)構(gòu)資料:焉知智能汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
302.2
FPGA方案:FPGA工作原理
由于FPGA需要被反復(fù)燒寫,它實(shí)現(xiàn)組合邏輯的基本結(jié)構(gòu)不可能像ASIC那樣通過固定的與非門來完成,而只能采用一種易于反復(fù)配置的結(jié)構(gòu)。查找表可以很好地滿足這一要求,目前主流FPGA都采用了基于SRAM工藝的查找表結(jié)構(gòu),也有一些軍品和宇航級FPGA采用Flash或者熔絲與反熔絲工藝的查找表結(jié)構(gòu)。通過燒寫文件改變查找表內(nèi)容的方法來實(shí)現(xiàn)對FPGA的重復(fù)配置。
查找表(Look-Up-Table)簡稱為LUT,LUT本質(zhì)上就是一個RAM。目前FPGA中多使用4輸入的LUT,所以每一個LUT可以看成一個有4位地址線的
的RAM。當(dāng)用戶通過原理圖或HDL語言描述了一個邏輯電路以后,PLD/FPGA開發(fā)軟件會自動計算邏輯電路的所有可能結(jié)果,并把真值表(即結(jié)果)事先寫入RAM,這樣,每輸入一個信號進(jìn)行邏輯運(yùn)算就等于輸入一個地址進(jìn)行查表,找出地址對應(yīng)的內(nèi)容,然后輸出即可。使用LUT實(shí)現(xiàn)4輸入與門電路的真值表資料:焉知智能汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
312.2
FPGA方案:FPGA工作原理
可編程輸入/輸出單元簡稱I/O單元,是芯片與外界電路的接口部分,完成不同電氣特性下對輸入/輸出信號的驅(qū)動與匹配要求。FPGA內(nèi)的I/O按組分類,每組都能夠獨(dú)立地支持不同的I/O標(biāo)準(zhǔn)。通過軟件的靈活配置,可適配不同的電氣標(biāo)準(zhǔn)與I/O物理特性,可以調(diào)整驅(qū)動電流的大小,可以改變上、下拉電阻。目前,I/O口的頻率也越來越高,一些高端的FPGA通過DDR寄存器技術(shù)可以支持高達(dá)2Gbps的數(shù)據(jù)速率。
CLB是FPGA內(nèi)的基本邏輯單元。CLB的實(shí)際數(shù)量和特性會依器件的不同而不同,但是每個CLB都包含一個可配置開關(guān)矩陣,此矩陣由4或6個輸入、一些選型電路(多路復(fù)用器等)和觸發(fā)器組成。開關(guān)矩陣是高度靈活的,可以對其進(jìn)行配置以便處理組合邏輯、移位寄存器或RAM。在Xilinx公司的FPGA器件中,CLB由多個(一般為4個或2個)相同的Slice和附加邏輯構(gòu)成。每個CLB模塊不僅可以用于實(shí)現(xiàn)組合邏輯、時序邏輯,還可以配置為分布式RAM和分布式ROM。IOB內(nèi)部結(jié)構(gòu)示意圖CLB內(nèi)部結(jié)構(gòu)示意圖資料:焉知智能汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
322.2
FPGA方案:自動駕駛的“芯”殺手
自動駕駛和高級駕駛輔助系統(tǒng)(ADAS)細(xì)分市場正在經(jīng)歷蛻變,對計算和傳感器功能提出了新的復(fù)雜需求。FPGA擁有其他芯片解決方案無法比擬的獨(dú)特優(yōu)勢,是滿足自動駕駛行業(yè)不斷發(fā)展變化的優(yōu)良選擇。FPGA是芯片領(lǐng)域的一種特殊技術(shù),一方面能夠通過軟件工具進(jìn)行反復(fù)多次配置,另一方面擁有豐富的IO接口和計算單元。因此,F(xiàn)PGA能夠根據(jù)應(yīng)用場景的具體需求,同時處理流水線并行和數(shù)據(jù)并行,天生具有計算性能高、延遲低、功耗小等優(yōu)勢。
FPGA具備高吞吐量、高能效以及實(shí)時處理等多項(xiàng)優(yōu)點(diǎn),非常契合自動駕駛所需要的技術(shù)需求。高級輔助駕駛系統(tǒng)(ADAS)、車載體驗(yàn)(IVE)應(yīng)用的標(biāo)準(zhǔn)和要求正在快速演變,系統(tǒng)設(shè)計人員關(guān)注的問題主要包括出色的靈活性和更快的開發(fā)周期,同時維持更高的性能功耗比。通過可重新編程的FPGA和不斷增多的汽車級產(chǎn)品相結(jié)合,支持汽車設(shè)計師滿足設(shè)計要求,在不斷變化的汽車行業(yè)中始終保持領(lǐng)先。FPGA芯片圖示資料:英特爾FPGA中國創(chuàng)新中心,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
332.2
FPGA方案:適應(yīng)性更強(qiáng)的平臺
對于自動駕駛芯片來說真正的價值在于計算引擎的利用率,即理論性能和實(shí)際性能之間的差異。FPGA包含大量的路由鏈路以及大量的小型存儲。這些資源的組合使設(shè)計人員能夠?yàn)槠溆嬎阋鎰?chuàng)建定制的數(shù)據(jù)饋送網(wǎng)絡(luò),以獲得更高的利用水平??删幊踢壿嫗榭蛻籼峁┝烁叨鹊撵`活性,以適應(yīng)ADAS和自動駕駛等新興應(yīng)用領(lǐng)域不斷變化的需求。利用改進(jìn)的接口標(biāo)準(zhǔn)、算法創(chuàng)新和新的傳感器技術(shù),都需要適應(yīng)性強(qiáng)的平臺,不僅可以支持軟件更改,還可以支持硬件更改,而這正是FPGA芯片的優(yōu)勢所在。
FPGA芯片擁有可擴(kuò)展性??赏卣沟男酒淖兞丝删幊踢壿嫷臄?shù)量,大多采用引腳兼容的封裝。這意味著開發(fā)人員可以創(chuàng)建單個ECU平臺來承載低、中、高版本的ADAS功能包,并根據(jù)需要通過選擇所需的最小密度芯片來縮放成本。FPGA芯片可拓展性示例資料:電子創(chuàng)新網(wǎng)賽靈思社區(qū),HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
342.2
FPGA方案:差異化解決方案
FPGA芯片允許開發(fā)人員創(chuàng)建獨(dú)特的差異化處理解決方案,這些解決方案可以針對特定應(yīng)用或傳感器進(jìn)行優(yōu)化。這對于ASSP芯片來說是無法實(shí)現(xiàn)的,即使是那些提供專用的芯片,它們的使用方式也受到限制,而且基本上可以提供給所有競爭對手。例如Xilinx的長期客戶已經(jīng)創(chuàng)建了只有他們可以訪問的高價值IP庫,并且這些功能可以被公司的各種產(chǎn)品使用。從90nm節(jié)點(diǎn)開始,對于大批量汽車應(yīng)用,Xilinx的芯片就已經(jīng)極具成本效益,有超過1.6億顆Xilinx芯片在該行業(yè)獲得應(yīng)用。FPGA芯片可進(jìn)行軟硬件拓展資料:電子創(chuàng)新網(wǎng)賽靈思社區(qū),HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
352.3
ASIC方案:ASIC定義及特點(diǎn)
ASIC芯片可根據(jù)終端功能不同分為
TPU
芯片、DPU芯片和
NPU芯片等。其中,TPU為張量處理器,專用于機(jī)器學(xué)習(xí)。如Google于
2016年
5月研發(fā)針對
Tensorflow
平臺的可編程
AI,其內(nèi)部指令集在
Tensorflow
程序變化或更新算法時可運(yùn)行。DPU即
Data
Processing
Unit,可為數(shù)據(jù)中心等計算場景提供引擎。NPU是神經(jīng)網(wǎng)絡(luò)處理器,在電路層模擬人類神經(jīng)元和突觸,并用深度學(xué)習(xí)指令集直接處理大規(guī)模電子神經(jīng)元和突觸數(shù)據(jù)。
ASIC有全定制和半定制兩種設(shè)計方式。全定制依靠巨大的人力時間成本投入以完全自主的方式完成整個集成電路的設(shè)計流程,雖然比半定制的
ASIC更為靈活性能更好,但它的開發(fā)效率與半定制相比甚為低下。ASIC設(shè)計流程資料:半導(dǎo)體產(chǎn)業(yè)縱橫,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
362.3
ASIC方案:性能提升明顯
ASIC芯片非常適合人工智能的應(yīng)用場景。例如英偉達(dá)首款專門為深度學(xué)習(xí)從零開始設(shè)計的芯片
Tesla
P100數(shù)據(jù)處理速度是其
2014年推出GPU
系列的
12倍。谷歌為機(jī)器學(xué)習(xí)定制的芯片
TPU
將硬件性能提升至相當(dāng)于當(dāng)前芯片按摩爾定律發(fā)展7年后的水平。正如
CPU
改變了當(dāng)年龐大的計算機(jī)一樣,人工智能
ASIC芯片也將大幅改變?nèi)缃?/p>
AI硬件設(shè)備的面貌。如大名鼎鼎的
AlphaGo
使用了約
170個圖形處理器(GPU)和
1200個中央處理器(CPU),這些設(shè)備需要占用一個機(jī)房,還要配備大功率的空調(diào),以及多名專家進(jìn)行系統(tǒng)維護(hù)。而如果全部使用專用芯片,極大可能只需要一個普通收納盒大小的空間,且功耗也會大幅降低。
ASIC技術(shù)路線是有限開放,芯片公司需要面向與駕駛相關(guān)的主流網(wǎng)絡(luò)、模型、算子進(jìn)行開發(fā)。在相同性能下,芯片的面積更小、成本更低、功耗更低。ASIC技術(shù)路線未來的潛力會很大,選擇ASIC路線并不意味著要對不同車型開發(fā)不同的ASIC,或進(jìn)行不同的驗(yàn)證。因?yàn)椴煌囆托枰獙?shí)現(xiàn)的功能大致相同,而且芯片面對模型和算子進(jìn)行有限開放,算法快速迭代不會影響到芯片對上層功能的支持。車廠與芯片設(shè)計公司合作,進(jìn)行差異化定制,或是更好的選擇。因?yàn)榧词故沁M(jìn)行差異化的定制,芯片內(nèi)部50%的部分也是通用的。芯片設(shè)計公司可以在原有版本的基礎(chǔ)上進(jìn)行差異化設(shè)計,實(shí)現(xiàn)部分差異功能。Forfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
372.4
主流架構(gòu)方案對比:三種主流架構(gòu)
FPGA是在PAL、GAL等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。它是作為專用集成電路領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點(diǎn)。
優(yōu)點(diǎn):可以無限次編程,延時性比較低,同時擁有流水線并行和數(shù)據(jù)并行、實(shí)時性最強(qiáng)、靈活性最高。缺點(diǎn):開發(fā)難度大、只適合定點(diǎn)運(yùn)算、價格比較昂貴。
圖形處理器(GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、游戲機(jī)和一些移動設(shè)備(如平板、手機(jī)等)上做圖像和圖形相關(guān)運(yùn)算工作的微處理器。優(yōu)點(diǎn):提供了多核并行計算的基礎(chǔ)結(jié)構(gòu),且核心數(shù)非常多,可以支撐大量數(shù)據(jù)的并行計算,擁有更高的浮點(diǎn)運(yùn)算能力。缺點(diǎn):管理控制能力(最弱),功耗(最高)。
ASIC,即專用集成電路,指應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計、制造的集成電路。目前用CPLD(復(fù)雜可編程邏輯器件)和FPGA(現(xiàn)場可編程邏輯陣列)來進(jìn)行ASIC設(shè)計是最為流行的方式之一。優(yōu)點(diǎn):它作為集成電路技術(shù)與特定用戶的整機(jī)或系統(tǒng)技術(shù)緊密結(jié)合的產(chǎn)物,與通用集成電路相比具有體積更小、重量更輕、功耗更低、可靠性提高、性能提自動駕駛芯片不同架構(gòu)特點(diǎn)高、保密性增強(qiáng)、成本降低等優(yōu)點(diǎn)。缺點(diǎn):靈活性不夠,成本比FPGA貴。類別GPUFPGAASIC類腦芯片性能高功耗高通用性好可編程性、靈活功耗與通用性介于GPU與ASIC間定制化設(shè)計性能穩(wěn)定優(yōu)秀的功耗控制功耗低響應(yīng)速度快尚不成熟特點(diǎn)英偉達(dá)AMD賽靈思深鑒科技寒武紀(jì)地平線代表公司IBM資料:焉知智能汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
382.5
唯算力論的局限:TOPS算力不完全等于實(shí)際性能
隨著ADAS、自動駕駛技術(shù)的興起,以及軟件定義汽車的逐步深入,智能汽車對于計算能力和海量數(shù)據(jù)處理能力等的需求暴增,傳統(tǒng)汽車的芯片“堆疊”方案已經(jīng)無法滿足自動駕駛的算力需求。芯片最終是為車企的車載計算平臺服務(wù)的,在“軟件定義汽車”的情況下,解決智能駕駛系統(tǒng)計算平臺的支撐問題,無法只通過芯片算力堆疊來實(shí)現(xiàn)。
芯片是軟件的舞臺,衡量芯片優(yōu)劣的標(biāo)準(zhǔn),要看芯片之上的軟件能否最大化地發(fā)揮作用,算力和軟件之間需要有效匹配。兩款相同算力的芯片比較,能讓軟件運(yùn)行得更高效的芯片才是“好芯片”。決定算力真實(shí)值最主要因素是內(nèi)存(
SRAM和DRAM)帶寬,還有實(shí)際運(yùn)行頻率(即供電電壓或溫度),以及算法的batch尺寸。
單顆芯片算力TOPS是關(guān)鍵指標(biāo),但并非唯一,自動駕駛是一個復(fù)雜系統(tǒng),需要車路云邊協(xié)同。所以它的較量除了芯還有軟硬協(xié)同還有平臺以及工具鏈等等。芯片算力的無限膨脹和硬件預(yù)埋不會是未來的趨勢,硬件也需要匹配實(shí)際。高算力背后是高功耗和低利用率的問題。車路協(xié)同圖示資料:焉知智能汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
392.5
事件相機(jī):簡介及工作機(jī)制
事件相機(jī)的靈感來自人眼和動物的視覺,也有人稱之為硅視網(wǎng)膜。生物的視覺只針對有變化的區(qū)域才敏感,事件相機(jī)就是捕捉事件的產(chǎn)生或者變化的產(chǎn)生。
在傳統(tǒng)的視覺領(lǐng)域,相機(jī)傳回的信息是同步的,所謂同步,就是在某一時刻t,相機(jī)會進(jìn)行曝光,把這一時刻所有的像素填在一個矩陣?yán)锘貍鳎a(chǎn)生一張照片。一張照片上所有的像素都對應(yīng)著同一時刻。至于視頻,不過是很多幀的圖片,相鄰圖片間的時間間隔可大可小,這便是幀率(framerate),也稱為時延(time
latency)。事件相機(jī)類似于人類的大腦和眼睛,跳過不相關(guān)的背景,直接感知一個場景的核心,創(chuàng)建純事件而非數(shù)據(jù)。常規(guī)相機(jī)與事件相機(jī)幀記錄對比
事件相機(jī)的工作機(jī)制是,當(dāng)某個像素所處位置的亮度發(fā)生變化達(dá)到一定閾值時,相機(jī)就會回傳一個上述格式的事件,其中前兩項(xiàng)為事件的像素坐標(biāo),第三項(xiàng)為事件發(fā)生的時間戳,最后一項(xiàng)取值為極性(polarity)0、1(或者-1、1),代表亮度是由低到高還是由高到低。資料:焉知智能汽車,HTI
就這樣,在整個相機(jī)視野內(nèi),只要有一個像素值變化,就會回傳一個事件,這些所有的事件都是異步發(fā)生的(再小的時間間隔也不可能完全同時),所以事件的時間戳均不相同,由于回傳簡單,所以和傳統(tǒng)相機(jī)相比,它具有低時延的特性,可以捕獲很短時間間隔內(nèi)的像素變化,延遲是微秒級的。Forfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
402.5
事件相機(jī):在自動駕駛領(lǐng)域的應(yīng)用
當(dāng)今自動駕駛領(lǐng)域所運(yùn)用的視覺識別算法,基本上都基于卷積神經(jīng)網(wǎng)絡(luò),視覺算法的運(yùn)算本質(zhì)上是一次次的卷積運(yùn)算。這種計算并不復(fù)雜,本質(zhì)上只涉及到加減乘除,也就是一種乘積累加運(yùn)算。但這種簡單運(yùn)算在卷積神經(jīng)網(wǎng)絡(luò)中是大量存在的,這就對處理器的性能提出了很高的要求。
以ResNet-152為例,這是一個152層的卷積神經(jīng)網(wǎng)絡(luò),它處理一張224*224大小的圖像所需的計算量大約是226億次,如果這個網(wǎng)絡(luò)要處理一個1080P的30幀的攝像頭,他所需要的算力則高達(dá)每秒33萬億次,十分龐大。卷積運(yùn)算圖示資料:焉知智能汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
412.5
事件相機(jī):通過減少無效計算節(jié)約算力
自動駕駛領(lǐng)域99%的視覺數(shù)據(jù)在AI處理中是無用的背景。例如檢測鬼探頭,變化的區(qū)域是很小一部分,但傳統(tǒng)的視覺處理仍然要處理99%的沒有出現(xiàn)變化的背景區(qū)域,這不僅浪費(fèi)了大量的算力,也浪費(fèi)了時間。亦或者像在沙礫里有顆鉆石,AI芯片和傳統(tǒng)相機(jī)需要識別每一顆沙粒,篩選出鉆石,但人類只需要看一眼就能檢測到鉆石,AI芯片和傳統(tǒng)相機(jī)耗費(fèi)的時間是人類的100倍或1000倍。
除了冗余信息減少和幾乎沒有延遲的優(yōu)點(diǎn)外,事件相機(jī)的優(yōu)點(diǎn)還有由于低時延,在拍攝高速物體時,傳統(tǒng)相機(jī)由于會有一段曝光時間會發(fā)生模糊,而事件相機(jī)則幾乎不會。此外事件相機(jī)擁有真正的高動態(tài)范圍,由于事件相機(jī)的特質(zhì),在光強(qiáng)較強(qiáng)或較弱的環(huán)境下,傳統(tǒng)相機(jī)均會“失明”,但像素變化仍然存在,所以事件相機(jī)仍能看清眼前的東西。常規(guī)相機(jī)與事件相機(jī)對比資料:焉知智能汽車,HTIForfulldisclosure
ofrisks,valuationmethodologies
and
target
priceformationon
allHTIrated
stocks,
please
refer
tothe
latest
fullreport
on
our
website
at
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《Unit 2 I'm Li Le》(教學(xué)設(shè)計)-2024-2025學(xué)年川教版(三起)(2024)英語三年級上冊
- 2024-2025學(xué)年高中物理 第四章 機(jī)械能和能源 第1節(jié) 功教學(xué)設(shè)計 粵教版必修2
- 邏輯學(xué)基礎(chǔ)知識課程
- 《第二單元 智能感知 4 智能調(diào)光》教學(xué)設(shè)計-2023-2024學(xué)年川教版信息技術(shù)(2019)六年級上冊
- 三年級信息技術(shù)上冊 海底世界圖片展教學(xué)設(shè)計 冀教版
- 校園安全目錄設(shè)計
- 《 分?jǐn)?shù)的初步認(rèn)識(二)》(教學(xué)設(shè)計)-2023-2024學(xué)年蘇教版數(shù)學(xué)三年級下冊
- 11 - 20 各數(shù)的認(rèn)識(教學(xué)設(shè)計)-2024-2025學(xué)年一年級上冊數(shù)學(xué)人教版
- 褥瘡的預(yù)防護(hù)理
- 28《海的女兒》第1課時教學(xué)設(shè)計2023-2024學(xué)年統(tǒng)編版語文四年級下冊
- 2024年山東水利技師學(xué)院招聘初級專業(yè)技術(shù)崗位人員考試真題
- 人教版四年級英語下冊教學(xué)課件-四下recycle1 第一課時
- 2024年廣東公需課《百縣千鎮(zhèn)萬村高質(zhì)量發(fā)展工程與城鄉(xiāng)區(qū)域協(xié)調(diào)發(fā)展》試題及答案
- 職業(yè)教育數(shù)字化轉(zhuǎn)型
- 2024年電子商務(wù)新興業(yè)態(tài)探討試題及答案
- 2025版《保障中小企業(yè)款項(xiàng)支付條例》學(xué)習(xí)解讀課件
- 開封尉氏縣事業(yè)單位招聘工作人員考試真題2024
- 空調(diào)改造安裝合同
- 2025年中考道德與法治專題復(fù)習(xí):非選擇題答題指導(dǎo)與答題模板 課件67張
- 2025年浙江安防職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫必考題
- 奔馳事故留修專員年終總結(jié)
評論
0/150
提交評論