2023中國(guó)AIGC數(shù)據(jù)標(biāo)注產(chǎn)業(yè)全景報(bào)告-量子位智庫(kù)_第1頁(yè)
2023中國(guó)AIGC數(shù)據(jù)標(biāo)注產(chǎn)業(yè)全景報(bào)告-量子位智庫(kù)_第2頁(yè)
2023中國(guó)AIGC數(shù)據(jù)標(biāo)注產(chǎn)業(yè)全景報(bào)告-量子位智庫(kù)_第3頁(yè)
2023中國(guó)AIGC數(shù)據(jù)標(biāo)注產(chǎn)業(yè)全景報(bào)告-量子位智庫(kù)_第4頁(yè)
2023中國(guó)AIGC數(shù)據(jù)標(biāo)注產(chǎn)業(yè)全景報(bào)告-量子位智庫(kù)_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

中Pan國(guó)oramAicIGReCpo數(shù)rt

o據(jù)f

Ge標(biāo)nera注tive產(chǎn)AI

D業(yè)ata全Lab景elin報(bào)g

In告dustry

in

China2023.11 楊凈 量?位智庫(kù) QbitAI

Insights序 ?數(shù)據(jù)標(biāo)注,正迎來(lái)關(guān)鍵時(shí)刻。作為AI認(rèn)識(shí)世界的起點(diǎn),數(shù)據(jù)標(biāo)注本質(zhì)上是將現(xiàn)實(shí)世界信息結(jié)構(gòu)化、數(shù)字化,充分發(fā)揮數(shù)據(jù)信息的價(jià)值。?模型時(shí)代到來(lái),AIGC眾多垂直場(chǎng)景落地,以及通?智能、具?智能等前沿領(lǐng)域探索,與?質(zhì)量、專業(yè)化的場(chǎng)景數(shù)據(jù)密不可分,數(shù)據(jù)標(biāo)注從勞動(dòng)密集型加速朝著知識(shí)密集型轉(zhuǎn)型,?業(yè)壁壘進(jìn)?步提?。作為底層基礎(chǔ)服務(wù),數(shù)據(jù)標(biāo)注貫穿?模型全?命周期(訓(xùn)練測(cè)試、評(píng)估驗(yàn)證和應(yīng)?迭代)。???,牽涉關(guān)鍵Know-how,更多?模型公司/AI企業(yè)選擇?建標(biāo)注團(tuán)隊(duì)和管線;另???,上下游合作關(guān)系將更為緊密和耦合,專業(yè)數(shù)據(jù)服務(wù)提供商更多機(jī)會(huì)將在垂直領(lǐng)域,幫助企業(yè)完成私有化部署。機(jī)遇與挑戰(zhàn)并存。合成數(shù)據(jù)作為新衍?賽道,潛在市場(chǎng)空間巨?。與此同時(shí),數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)難以統(tǒng)?、數(shù)據(jù)處理流程尚未規(guī)范,?學(xué)歷多領(lǐng)域多專業(yè)成為標(biāo)注?才的硬指標(biāo)。!"!#!$!%? 錄?模型時(shí)代下的數(shù)據(jù)標(biāo)注AIGC數(shù)據(jù)標(biāo)注四?變化AIGC數(shù)據(jù)標(biāo)注三?影響因素?cái)?shù)據(jù)標(biāo)注產(chǎn)業(yè)競(jìng)爭(zhēng)格局/市場(chǎng)規(guī)模數(shù)據(jù)標(biāo)注代表玩家案例集!&?模型時(shí)代下的數(shù)據(jù)標(biāo)注!"數(shù)據(jù)標(biāo)注是AI認(rèn)識(shí)世界的起點(diǎn)?本:詞性標(biāo)注、分類標(biāo)注、情緒標(biāo)注、命名實(shí)體識(shí)別、語(yǔ)義標(biāo)注、圖像:?頻:視頻:意圖標(biāo)注等;圖像分類、語(yǔ)義分割、實(shí)例分割、拉框、OCR轉(zhuǎn)寫等;語(yǔ)?識(shí)別、聲紋識(shí)別、語(yǔ)?轉(zhuǎn)寫等;?標(biāo)跟蹤、?為識(shí)別等;3D點(diǎn)云數(shù)據(jù)標(biāo)注是將原始數(shù)據(jù)進(jìn)?加?處理,?如分類、拉框、注釋、標(biāo)記等操作轉(zhuǎn)換成機(jī)器可識(shí)別信息的過(guò)程。國(guó)內(nèi)數(shù)據(jù)標(biāo)注?商,?義稱之為基礎(chǔ)數(shù)據(jù)服務(wù)提供商,通常需要完成數(shù)據(jù)集結(jié)構(gòu)/流程設(shè)計(jì)、數(shù)據(jù)處理、數(shù)據(jù)質(zhì)檢等?作,為下游客?提供通?數(shù)據(jù)集、定制化服務(wù)、數(shù)據(jù)閉環(huán)?具鏈等。這也是本次AIGC數(shù)據(jù)標(biāo)注全景報(bào)告的研究對(duì)象。根據(jù)原始數(shù)據(jù)類型以及訓(xùn)練任務(wù)劃分:?般數(shù)據(jù)處理流程:原始數(shù)據(jù)測(cè)試/驗(yàn)證據(jù) 模型訓(xùn)練數(shù)據(jù) 數(shù)清洗 標(biāo)注數(shù)質(zhì)據(jù)檢數(shù)據(jù)標(biāo)注中的??定律通常在一個(gè)AI項(xiàng)目中,數(shù)據(jù)準(zhǔn)備工作需要80時(shí)長(zhǎng),模型訓(xùn)練和部署僅占20

。?模型時(shí)代下的數(shù)據(jù)標(biāo)注發(fā)布:上市公司股價(jià)狂飆,創(chuàng)業(yè)公司融資加速海天瑞聲是國(guó)內(nèi)唯??家AI數(shù)據(jù)上市公司,今年2?以來(lái)股價(jià)受ChatGPT熱潮曾?度狂飆,截?11?10?股價(jià)較年初上漲59.75%。創(chuàng)業(yè)代表公司融資情況星塵數(shù)據(jù)|22年12?5000萬(wàn)A輪標(biāo)?科技|23年4?超億元B2輪整數(shù)智能|23年6?數(shù)千萬(wàn)Pre

A輪柏川數(shù)據(jù)|23年7?千萬(wàn)元天使輪?模型數(shù)據(jù)解決?案多處開花,以?站式、定制化服務(wù)為主圍繞?模型開發(fā)全?命周期(包括預(yù)訓(xùn)練、監(jiān)督微調(diào)、RLHF、紅隊(duì)測(cè)試、基準(zhǔn)測(cè)試等),專業(yè)數(shù)據(jù)服務(wù)商、?模型企業(yè)、AI公司等各?都拿出相關(guān)數(shù)據(jù)解決?案,?部分以?站式、定制化服務(wù)為主。云測(cè)數(shù)據(jù):?向垂直?業(yè)?模型數(shù)據(jù)解決?案星塵數(shù)據(jù):星塵COSMO?模型數(shù)據(jù)?字塔解決?案澳鵬Appen:AI聊天反饋和基準(zhǔn)測(cè)試兩?解決?案??引擎:????(涵蓋數(shù)據(jù)服務(wù)模塊)百度:?個(gè)?模型數(shù)據(jù)標(biāo)注基地曼孚科技|23年9?數(shù)千萬(wàn)B輪愷望數(shù)據(jù)|23年4?戰(zhàn)略融資23年9?數(shù)千萬(wàn)Pre

A輪?模型范式涌?數(shù)據(jù)標(biāo)注,?動(dòng)化標(biāo)注?檻?幅降低以SAM模型為代表的圖像分割模型開源;GPT-4、GPT-4V為代表的?模型也被驗(yàn)證在?本、圖像領(lǐng)域標(biāo)注具有可?性,并衍?出專?做數(shù)據(jù)標(biāo)注的?模型,?幅降低?動(dòng)化標(biāo)注?檻。國(guó)內(nèi)不少數(shù)據(jù)服務(wù)商進(jìn)?相關(guān)?模型研發(fā),部分產(chǎn)品已經(jīng)海天瑞聲:數(shù)據(jù)?產(chǎn)垂直?模型(研發(fā)階段)曼孚科技:?動(dòng)駕駛數(shù)據(jù)標(biāo)注視覺?模型(已完成研發(fā))?貓數(shù)據(jù):?動(dòng)駕駛?模型AutopilotGPT(發(fā)布)商湯:明眸SenseAnnotation?動(dòng)化數(shù)據(jù)標(biāo)注平臺(tái)(發(fā)布)標(biāo)?科技:烘焙師?模型Baker-GPT(發(fā)布)智能駕駛新感知范式,BEV+Transformer是機(jī)遇也是挑戰(zhàn)作為最具代表性應(yīng)?場(chǎng)景,智能駕駛迎來(lái)新感知范式:以BEV+Transformer為代表的四維感知替代掉2D+CNN為代表的?維感知?案,給數(shù)據(jù)服務(wù)?商帶來(lái)更多機(jī)遇與挑戰(zhàn),包括不限于標(biāo)注場(chǎng)景難度?、數(shù)據(jù)量產(chǎn)能?要求?等。?前國(guó)內(nèi)部分?商給出了數(shù)據(jù)閉環(huán)?具鏈和解決?案等。(圖源:特斯拉)AIGC重塑數(shù)據(jù)標(biāo)注量?位智庫(kù)認(rèn)為,數(shù)據(jù)標(biāo)注正迎來(lái)重新洗牌的關(guān)鍵時(shí)刻,有四?關(guān)鍵趨勢(shì):1、數(shù)據(jù)標(biāo)注要求從客觀到主觀,很難建?統(tǒng)?標(biāo)準(zhǔn)?模型的開發(fā)范式?jīng)Q定了?模型數(shù)據(jù)標(biāo)注對(duì)?然語(yǔ)?要求要求很?,包括排序、改寫、多輪對(duì)話、評(píng)估等操作,難以依靠客觀的評(píng)價(jià)體系,?如準(zhǔn)確率、效率等。2、?學(xué)歷多領(lǐng)域?才成剛需,缺?或達(dá)百萬(wàn)本科以上多領(lǐng)域多專業(yè)開始成為標(biāo)注?才的硬指標(biāo),標(biāo)注??也隨著?模型全?命周期更為細(xì)分,?如AI訓(xùn)練師、模型精調(diào)師、指令?程師等。3、產(chǎn)業(yè)鏈重構(gòu),?模型公司/AI企業(yè)涌??模型Know-how涉及到數(shù)據(jù)處理流程的設(shè)計(jì),?模型公司/AI企業(yè)開始?建數(shù)據(jù)標(biāo)注團(tuán)隊(duì)和數(shù)據(jù)處理管線,甚?對(duì)外輸出服務(wù),產(chǎn)業(yè)鏈重新洗牌。4、國(guó)內(nèi)百億級(jí)市場(chǎng)規(guī)模,合成數(shù)據(jù)增速最?量?位智庫(kù)預(yù)計(jì),國(guó)內(nèi)AI基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模將達(dá)百億規(guī)模,約占全球市場(chǎng)10%份額。其中合成數(shù)據(jù)作為衍?出來(lái)的新賽道,存在巨?市場(chǎng)空間,增速超40%。AIGC數(shù)據(jù)標(biāo)注四?變化!#需求變化:與?業(yè)場(chǎng)景強(qiáng)相關(guān),高質(zhì)量數(shù)據(jù)需求長(zhǎng)期且持續(xù)?模型時(shí)代的到來(lái),正加速推動(dòng)??智能開發(fā)從以模型為中?朝著以數(shù)據(jù)為中?的?向轉(zhuǎn)變。?質(zhì)量數(shù)據(jù)服務(wù)需求貫穿?模型全?命周期。?前?模型技術(shù)路徑已經(jīng)完整清晰,訓(xùn)練流程主要分為三個(gè)階段:預(yù)訓(xùn)練?模型監(jiān)督SF微T

調(diào) 強(qiáng)化學(xué)習(xí)RLHF預(yù)?訓(xùn)次練*能等相關(guān)探索,如何快速擴(kuò)展到更多真實(shí)邊緣場(chǎng)景,?質(zhì)量場(chǎng)景數(shù)據(jù)也將成為剛需。除此之外,實(shí)時(shí)保障輸出內(nèi)容的安全合規(guī),也遠(yuǎn)?以往更受重視。從訓(xùn)練、迭代到應(yīng)?落地,數(shù)據(jù)服務(wù)貫穿?模型全?命周期。?泛認(rèn)知?,?模型是以數(shù)據(jù)為中?的產(chǎn)物。數(shù)據(jù)數(shù)量和質(zhì)量很?程度決定著?模型能?的上限。以模型為中?:迭代模型,數(shù)據(jù)相對(duì)固定。以數(shù)據(jù)為中?:關(guān)注數(shù)據(jù)本?,模型成為了數(shù)據(jù)的「容器」。企業(yè)端客?需要?期且持續(xù)的數(shù)據(jù)服務(wù),產(chǎn)業(yè)鏈上下游供應(yīng)關(guān)系遠(yuǎn)?以往更為緊密和耦合。*實(shí)際訓(xùn)練過(guò)程中,部分垂直領(lǐng)域大模型需用小規(guī)模語(yǔ)料進(jìn)行二次預(yù)訓(xùn)練操作數(shù)據(jù)處理流程設(shè)計(jì)涉及?模型Know-how,直接決定?模型性能好壞。尤其后兩個(gè)階段需要專業(yè)???成數(shù)據(jù)或?qū)?shù)據(jù)進(jìn)?改寫或排序,最終形成符合?類標(biāo)準(zhǔn)(?如專業(yè)邏輯、核?價(jià)值觀等)?質(zhì)量數(shù)據(jù)。(圖源:OpenAI官?)?后隨著?模型持續(xù)地實(shí)時(shí)更新迭代、朝著多垂直領(lǐng)域落地,尤其通?智能、具?智(圖源:Data-centric

AI:

Perspectives

and

Challenges)處理流程側(cè)變化:標(biāo)準(zhǔn)從客觀到主觀,?學(xué)歷多領(lǐng)域成?才硬指標(biāo)傳統(tǒng)數(shù)據(jù)標(biāo)注?模型數(shù)據(jù)標(biāo)注領(lǐng)域劃分具體實(shí)操按不同領(lǐng)域或任務(wù)劃分拉框、描點(diǎn)、轉(zhuǎn)寫等操作按不同階段劃分排序、改寫、?成等操作標(biāo)注要求偏客觀偏主觀評(píng)價(jià)指標(biāo)解決?案準(zhǔn)確率+效率?具/平臺(tái)標(biāo)注+?類質(zhì)檢難以對(duì)?標(biāo)準(zhǔn)專業(yè)培訓(xùn)、定期開會(huì)對(duì)?等舉措?才要求??茷橹鞅究埔陨希囝I(lǐng)域?qū)I(yè)?才按職能劃分按階段劃分標(biāo)注??覆蓋區(qū)域標(biāo)注員、質(zhì)檢員、管理員主要集中在三四線城市AI訓(xùn)練師、模型精調(diào)師、指令?程師、紅隊(duì)測(cè)試軍團(tuán)等。重新打散例如,百度在海?專為?模型建設(shè)的數(shù)據(jù)標(biāo)注基地,本科?例100%,培訓(xùn)專業(yè)?才已達(dá)1000?。未來(lái)五年,數(shù)據(jù)標(biāo)注相關(guān)專業(yè)?才缺?將達(dá)百萬(wàn)量級(jí)。數(shù)據(jù)標(biāo)注從勞動(dòng)密集朝著知識(shí)密集型轉(zhuǎn)變。業(yè)務(wù)變化:合成數(shù)據(jù)成新衍?賽道,潛在市場(chǎng)空間巨?合成數(shù)據(jù)的優(yōu)勢(shì)&特點(diǎn)1、降本增效降低數(shù)據(jù)獲取成本,?成數(shù)據(jù)?帶?質(zhì)量標(biāo)注,緩解“數(shù)據(jù)荒”問(wèn)題。2、數(shù)據(jù)可定制應(yīng)?可擴(kuò)展性強(qiáng),靈活度?,可覆蓋更多邊緣、?尾場(chǎng)景。3、隱私安全天然規(guī)避掉數(shù)據(jù)隱私安全合規(guī)的問(wèn)題。?動(dòng)駕駛 機(jī)器??融?物醫(yī)藥?業(yè)…具A?R/智VR能…應(yīng)?場(chǎng)景數(shù)據(jù)增強(qiáng) 模型驗(yàn)證 可解釋AI企業(yè)案例群核科技Coohom

Cloud(群核云)作為?前為數(shù)不多提供室內(nèi)場(chǎng)景數(shù)據(jù)服務(wù)的代表?商,能針對(duì)不同應(yīng)?場(chǎng)景合成2D、3D數(shù)據(jù)集,客?覆蓋全球,服務(wù)多家海內(nèi)外科技巨頭公司,并于英特爾在產(chǎn)研等開源性項(xiàng)?上進(jìn)?深度合作。所謂合成數(shù)據(jù),即是?AI?成數(shù)據(jù)??真實(shí)產(chǎn)?,能夠替代真實(shí)數(shù)據(jù)來(lái)訓(xùn)練、測(cè)試和驗(yàn)證?模型。?前主要在?動(dòng)駕駛、機(jī)器?、?物醫(yī)藥等領(lǐng)域應(yīng)?。英偉達(dá)Meta亞?遜等全球科技巨頭均有相關(guān)布局(投資、收購(gòu)等)。OpenAICEO

SamAltman曾放?:未來(lái)所有數(shù)據(jù)都將變成合成數(shù)據(jù)。量?位智庫(kù)預(yù)計(jì),合成數(shù)據(jù)將成為未來(lái)增速最快賽道,年增?率可達(dá)45%。(圖源:官?)供應(yīng)鏈變化:重新洗牌,?模型公司/AI企業(yè)涌?基礎(chǔ)數(shù)據(jù)服務(wù)提供商(AI 數(shù)據(jù)需求?企業(yè)、傳統(tǒng)企業(yè)、政企機(jī)構(gòu)、科研機(jī)構(gòu)等)百度智能云??引擎阿?云華為云騰訊云綜合招聘平臺(tái)……專業(yè)數(shù)據(jù)服務(wù)提供商海天瑞聲云測(cè)數(shù)據(jù)星塵數(shù)據(jù)曼孚科技標(biāo)?科技?貓數(shù)據(jù)群核科技倍賽科技數(shù)據(jù)堂晴數(shù)智慧37度數(shù)據(jù)景聯(lián)?科技科樂園整數(shù)智能博登智能愷望數(shù)據(jù)澳鵬中國(guó)卓印智能未有科技?云數(shù)據(jù)朗勢(shì)科技柏川數(shù)據(jù)冰?數(shù)據(jù)…?模型公司/AI企業(yè)中?團(tuán)隊(duì)百度智能云??引擎阿?云京東商湯科技毫末智?……?模型公司/AI企業(yè)?建數(shù)據(jù)處理管線,對(duì)外輸出?模型數(shù)據(jù)解決?案,傳統(tǒng)產(chǎn)業(yè)鏈重新洗牌。部分?商還具備云服務(wù)能?,同數(shù)據(jù)服務(wù)打包輸出,更易建?起客?之間的?碑和信任,具備競(jìng)爭(zhēng)優(yōu)勢(shì)。硬件/云服務(wù)?商、??資源?商京東云AIGC數(shù)據(jù)標(biāo)注三?影響因素!$三?影響因素:以技術(shù)+場(chǎng)景聚合的?輪效應(yīng)數(shù)據(jù)標(biāo)注作為AI底層服務(wù),最本質(zhì)是為客?降本增效。持續(xù)迭代技術(shù)能?的企業(yè)將有機(jī)會(huì)脫穎?出,包括不限于以下?點(diǎn):數(shù)據(jù)閉環(huán)?具鏈的智能化?平對(duì)?模型/算法Know-how的理解數(shù)據(jù)?程化能?、數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)?質(zhì)量場(chǎng)景數(shù)據(jù)*能夠根據(jù)客?需求,快速找到并利?與場(chǎng)景數(shù)據(jù)標(biāo)注仍具備?輪效應(yīng);新創(chuàng)業(yè)公司?局?檻進(jìn)?步提?;專業(yè)數(shù)據(jù)服務(wù)商更多機(jī)會(huì)將在垂類場(chǎng)景,幫助企業(yè)完成私有化部署;對(duì)外輸出數(shù)據(jù)服務(wù)的?模型公司/AI企業(yè)也存在競(jìng)爭(zhēng)優(yōu)勢(shì)。業(yè)務(wù)量增?獲客容易獲得?碑渠+道??AIGC數(shù)據(jù)處理能?越強(qiáng)標(biāo)注經(jīng)驗(yàn)越豐富可擴(kuò)展性靈活性更強(qiáng)獲得?碑技術(shù)+場(chǎng)景?看技術(shù)能?……?看場(chǎng)景資源?業(yè)Know-how*最為貼合的資源。三看?輪效應(yīng)場(chǎng)景專業(yè)?才(領(lǐng)域?qū)<?、深??等)傳統(tǒng)數(shù)據(jù)標(biāo)注?輪獲客越容易AIGC賦能數(shù)據(jù)標(biāo)注?輪產(chǎn)業(yè)競(jìng)爭(zhēng)格局/市場(chǎng)規(guī)模!%市場(chǎng)競(jìng)爭(zhēng)格局?jǐn)?shù)據(jù)標(biāo)注?業(yè)傳統(tǒng)依靠渠道、??等形成的低成本競(jìng)爭(zhēng)優(yōu)勢(shì)將被基于以上原因,量?位智庫(kù)將從數(shù)據(jù)基礎(chǔ)設(shè)施、場(chǎng)景資源兩個(gè)?數(shù)據(jù)設(shè)施?質(zhì)量場(chǎng)景資源大模型相關(guān)數(shù)據(jù)解決方案我國(guó)數(shù)據(jù)標(biāo)注?業(yè)企業(yè)競(jìng)爭(zhēng)格局大模型數(shù)據(jù)資源/標(biāo)注團(tuán)隊(duì)代表公司:海天瑞聲數(shù)據(jù)堂澳鵬中國(guó)晴數(shù)智慧未有科技37度數(shù)據(jù)景聯(lián)?科技模型/應(yīng)?層公司?建數(shù)據(jù)管線等?來(lái)分析?前的業(yè)內(nèi)玩家分布及現(xiàn)狀。第?象限:有技術(shù)有場(chǎng)景的明星公司該象限存在兩種情況:第?種是模型層公司本?有?模型技術(shù)范式以及場(chǎng)景落地經(jīng)驗(yàn)積累,可快速輸出數(shù)據(jù)解決?案,與云服務(wù)打包輸出建?信任;第?種則是主要以技術(shù)驅(qū)動(dòng)的明星企業(yè),?部分擁有數(shù)據(jù)閉環(huán)?具鏈,再結(jié)合?年來(lái)?業(yè)經(jīng)驗(yàn),在?模型浪潮下易受到企業(yè)???睞。第四象限:場(chǎng)景壁壘更為深厚的?業(yè)玩家該象限著更為深厚的?業(yè)數(shù)據(jù)壁壘,可為下游??提供?質(zhì)量數(shù)據(jù)集或擁有?模型數(shù)據(jù)標(biāo)注團(tuán)隊(duì),以海天瑞聲為例,不僅是LIama2的唯?中國(guó)伙伴,還發(fā)布超?規(guī)模中?多輪對(duì)話數(shù)據(jù)集DOTS-NLP-216,合作企業(yè)超810家,覆蓋全球近200個(gè)主要語(yǔ)種及??,有近20年?業(yè)深耕。第?象限:有強(qiáng)技術(shù)?撐的創(chuàng)業(yè)新勢(shì)?該象限主要聚焦在近兩年創(chuàng)?的創(chuàng)業(yè)公司,主要以?動(dòng)駕駛場(chǎng)景作為切?點(diǎn),再覆蓋到AIGC及其他領(lǐng)域。他們飽受資本市場(chǎng)認(rèn)可,以愷望數(shù)據(jù)為例,?年半時(shí)間就是完成了三輪融資。13 包括中?眾包團(tuán)隊(duì),4重塑,數(shù)據(jù)需求?將更看重?cái)?shù)據(jù)質(zhì)量、場(chǎng)景多樣性和可擴(kuò)展性。 2 代表公司整數(shù)智能愷望數(shù)據(jù)柏川數(shù)據(jù)博登智能卓印智能基礎(chǔ) 代表公司:百度群核科技星塵數(shù)據(jù)云測(cè)數(shù)據(jù)?貓數(shù)據(jù)曼孚科技倍賽科技重新洗牌(2023-2025年)??標(biāo)注(2017年前)平臺(tái)/?具標(biāo)注(2017-2022年)知識(shí)密集(2025年后)以訓(xùn)練任務(wù)、算法司開始涌現(xiàn)。以?動(dòng)駕駛為代表 數(shù)據(jù)質(zhì)量驅(qū)動(dòng);模型為導(dǎo)向; 的場(chǎng)景爆發(fā); 產(chǎn)業(yè)鏈重新洗牌,簡(jiǎn)單圖像標(biāo)注為主。 ??標(biāo)注?法滿? 更多企業(yè)參與數(shù)據(jù)數(shù)據(jù)需求,

?動(dòng)化 標(biāo)注,

供應(yīng)合作關(guān)標(biāo)注興起; 系緊密;?量AI

數(shù)據(jù)初創(chuàng)公 創(chuàng)業(yè)?檻提?。?機(jī)協(xié)同關(guān)系進(jìn)?步耦合,

??更多承擔(dān)關(guān)鍵決策??;

市場(chǎng)競(jìng)爭(zhēng)格局趨于穩(wěn)定。國(guó)內(nèi)基礎(chǔ)數(shù)據(jù)服務(wù)百億市場(chǎng)規(guī)?!??標(biāo)注】關(guān)鍵節(jié)點(diǎn):2007年,李??團(tuán)隊(duì)啟動(dòng)ImageNet,借助亞?遜眾包平臺(tái)完成圖像分類和標(biāo)注來(lái)訓(xùn)練機(jī)器學(xué)習(xí)算法。數(shù)據(jù)標(biāo)注從此拉開序幕?!酒脚_(tái)/?具標(biāo)注】關(guān)鍵節(jié)點(diǎn):2017年,以數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)成為?業(yè)共識(shí),?動(dòng)駕駛?爆發(fā),國(guó)內(nèi)外初創(chuàng)公司涌現(xiàn),數(shù)據(jù)標(biāo)注迎來(lái)龐?的市場(chǎng)需求?!局匦孪磁啤筷P(guān)鍵節(jié)點(diǎn):2023年,以ChatGPT為代表的?模型涌現(xiàn),更?質(zhì)量、專業(yè)化的數(shù)據(jù)標(biāo)注成為剛需。【知識(shí)密集】關(guān)鍵節(jié)點(diǎn):垂直?模型落地加速,數(shù)據(jù)處理范式、標(biāo)準(zhǔn)基本確定。未來(lái)機(jī)器將滿??部分標(biāo)注需求,??將承擔(dān)關(guān)鍵決策任務(wù)。需求推算:作為AI底層基礎(chǔ)服務(wù),始終依托于??智能的發(fā)展,約占??智能市場(chǎng)份額10%左右。?前?模型垂直領(lǐng)域落地仍處于探索階段。典型樣本:海天瑞聲市占率達(dá)12.9%

,上半年?duì)I收?去年同期增?翻番。國(guó)內(nèi)AI基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模單位:億元0501001502002503003502023E2028E2030E數(shù)據(jù)標(biāo)注代表玩家案例集!&百度智能云百度智能云數(shù)據(jù)眾包,依托百度10余年AI數(shù)據(jù)經(jīng)驗(yàn)、產(chǎn)品技術(shù)能?和國(guó)內(nèi)產(chǎn)值規(guī)模領(lǐng)先的單體數(shù)據(jù)標(biāo)注基地,具備數(shù)據(jù)“采、標(biāo)、存、管、訓(xùn)”?體化的服務(wù)能?,根據(jù)特定領(lǐng)域、特定場(chǎng)景的客?需求與委托,可提供數(shù)據(jù)采集、標(biāo)注、加?等處理服務(wù),為客?交付標(biāo)準(zhǔn)化、結(jié)構(gòu)化的服務(wù)成果。當(dāng)前,百度智能云升級(jí)?模型數(shù)據(jù)服務(wù)能?,在海?市建設(shè)全國(guó)?個(gè)專業(yè)?模型數(shù)據(jù)標(biāo)注基地,專業(yè)?模型數(shù)據(jù)標(biāo)注師達(dá)數(shù)百?,?員本科率達(dá)100%。?模型能?評(píng)估體系Copilot輔助評(píng)估?員定向募集與準(zhǔn)?盲評(píng)、擬合多輪審驗(yàn)可視報(bào)表與案例分析 優(yōu)化提案與服務(wù)?持應(yīng)?能?問(wèn)答創(chuàng)作對(duì)話代碼基礎(chǔ)語(yǔ)?處理通?能?指令滿約?束上下?記憶跨語(yǔ)?處理學(xué)習(xí)能?SFTInL-eCaorntienxgt-評(píng)估流程與?具專業(yè) 公正 ?效?模型評(píng)估服務(wù):全?評(píng)價(jià)應(yīng)?表現(xiàn),洞察短板,牽引優(yōu)化洞察與優(yōu)化交付:代?表類?反類饋偏好標(biāo)的注打服分務(wù)排序數(shù)據(jù)??模模型型數(shù)數(shù)據(jù)?據(jù)產(chǎn)標(biāo)C注op?ilo產(chǎn)t賦線能數(shù)據(jù)接?數(shù)據(jù)交付資源調(diào)度規(guī)則學(xué)增習(xí)強(qiáng)數(shù)據(jù)分發(fā)?動(dòng)分類數(shù)據(jù)標(biāo)注智能標(biāo)注質(zhì)量審核?動(dòng)質(zhì)檢+?模型標(biāo)注服務(wù):?員、?具、質(zhì)控、研發(fā)多管?下,保證?質(zhì)?效交付:輸指?令提數(shù)?據(jù)和輸標(biāo)出注的服?務(wù)質(zhì)量監(jiān)督數(shù)據(jù)運(yùn)營(yíng)能?專業(yè)化數(shù)據(jù)咨詢+安全標(biāo)注?案標(biāo)注資源各領(lǐng)域眾包專家+專職基地??群核科技Coohom

Cloud(群核云)是群核科技(酷家樂)推出的,?向室內(nèi)智能體認(rèn)知和圖形智能的AI訓(xùn)練合成數(shù)據(jù)平臺(tái)。基于真實(shí)三維場(chǎng)景數(shù)據(jù)資源以及AIGC技術(shù)的驅(qū)動(dòng),提供豐富的2D/3D數(shù)據(jù)集,針對(duì)智能機(jī)器?、??智能、元宇宙、智能房產(chǎn)、?動(dòng)駕駛等領(lǐng)域,為AI模型以及仿真器研究提供豐富的訓(xùn)練資源,讓智能體更智能。應(yīng)?產(chǎn)品室外??機(jī)導(dǎo)航機(jī)器???機(jī)器?廚房機(jī)械臂清潔機(jī)器??態(tài)兼容仿?軟件:Isaac

Sim、UE、Gazebo、Unity

等數(shù)據(jù)格式:USD/UE/SDF/OBJ/HM3D/PCD/COCO/VOC/NYU40標(biāo)簽/?定義超?性價(jià)?成本降低10倍場(chǎng)景確定后,數(shù)據(jù)集規(guī)模越?,單圖成本越低效率提升10倍GPU集群并發(fā)渲染,可合成20w組數(shù)據(jù)/?體驗(yàn)提升10倍可視化交互?具,實(shí)現(xiàn)所?即所得質(zhì)量提升10倍像素級(jí)精準(zhǔn)標(biāo)注合作成功案例與伙伴論?

InteriorNetBMVC

2018Structured3DECCV

2020MINERVASCGF

2022?校&企業(yè)

英特爾科沃斯追覓美的等??智能元宇宙智能房產(chǎn)?動(dòng)駕駛智能機(jī)器?數(shù)字孿?視覺感知 三維重建內(nèi)容?成 SLAM 決策與控制?業(yè)技術(shù)應(yīng)?解決?案提供以虛擬仿真合成數(shù)據(jù)集為中?的?站式服務(wù)成本真實(shí)數(shù)據(jù)??為主成本?優(yōu)劣對(duì)? 數(shù)字化采集耗時(shí)久/標(biāo)注錯(cuò)誤多成本?昂/侵犯隱私?:?次性數(shù)據(jù)集+項(xiàng)?制算?為主成本低復(fù)雜完場(chǎng)美景實(shí)標(biāo)驗(yàn)注/格成式本統(tǒng)低?/?/多持樣?性難豐度富采集有:?復(fù)?的性靈數(shù)活據(jù)修集改+基于任務(wù)數(shù)據(jù)集作為AI訓(xùn)練的核?要素,其規(guī)模和質(zhì)量與算法效果,效率密切相關(guān)海量 33億渲染圖?均?成40萬(wàn)套設(shè)計(jì)?案素材庫(kù) 2.7億個(gè)3D家居商空商品模型,字典級(jí)標(biāo)簽體系3D數(shù)據(jù)格式轉(zhuǎn)換場(chǎng)景創(chuàng)作與增強(qiáng)虛擬仿真世界數(shù)據(jù)增強(qiáng)引擎KoolAI渲染引擎AI引擎交互引擎規(guī)則引擎(質(zhì)檢)分布式云計(jì)算服務(wù)器集群CAD空間設(shè)計(jì)家裝設(shè)計(jì)?具商空設(shè)計(jì)?具全景設(shè)計(jì)?具智能設(shè)計(jì)?格快搭?具CAE仿真模擬照明仿真聲學(xué)仿真WiFi仿真流體?學(xué)仿真機(jī)器?物理仿真仿真數(shù)據(jù)基礎(chǔ)設(shè)施3DMAXMAYASketchUpREVITUNREALUnityBlenderOmniverse星塵數(shù)據(jù)模型?業(yè)應(yīng)??業(yè)?模型平臺(tái)?具服務(wù)基礎(chǔ)數(shù)據(jù)服務(wù)醫(yī)療問(wèn)診寫作助?智能客服法律助??融助?輔助編程輔助設(shè)計(jì)醫(yī)療?模型傳媒?模型法律?模型?融?模型教育?模型……數(shù)據(jù)標(biāo)注平臺(tái)數(shù)據(jù)管理系統(tǒng)知識(shí)庫(kù)問(wèn)答管理系統(tǒng)模型管理系統(tǒng)數(shù)據(jù)采集數(shù)據(jù)存儲(chǔ)數(shù)據(jù)清洗數(shù)據(jù)清洗數(shù)據(jù)增強(qiáng)數(shù)據(jù)審核數(shù)據(jù)安全數(shù)據(jù)分析數(shù)據(jù)管理模型評(píng)測(cè)服務(wù)?動(dòng)化評(píng)測(cè)??評(píng)測(cè)評(píng)測(cè)報(bào)告評(píng)測(cè)榜單2

層:專有能?數(shù)據(jù)

1

層:通?能?數(shù)據(jù)

0

層:公共數(shù)據(jù)

四層數(shù)據(jù)結(jié)構(gòu),加速?語(yǔ)?模型構(gòu)建平臺(tái)?動(dòng)化?平達(dá)到60%以上,數(shù)據(jù)質(zhì)量達(dá)到99.9%。星塵COSMO?模型數(shù)據(jù)?字塔解決?案星塵數(shù)據(jù)成?于2017年5?,2023年1?宣布完成5000萬(wàn)A輪融資。通過(guò)?動(dòng)化標(biāo)注技術(shù)、數(shù)據(jù)策略專家服務(wù)和數(shù)據(jù)閉環(huán)系統(tǒng),服務(wù)?動(dòng)駕駛(50+頭部客?)、?模型、智能家居、智慧城市、智能機(jī)器?、智慧醫(yī)療、智慧教育、智能零售、智能遙感、智慧?融等眾多數(shù)據(jù)場(chǎng)景。核?產(chǎn)品:Rosetta平臺(tái)3.0 3

層:企業(yè)私有化部署數(shù)據(jù)可?持?萬(wàn)?以上同時(shí)在線標(biāo)注,數(shù)據(jù)年處理量過(guò)億,可提供先進(jìn)的AI算法輔助標(biāo)注?具和項(xiàng)?管理?具,可?持圖像、點(diǎn)云、?本、語(yǔ)?、多模態(tài)等各類型100+種主流采集和標(biāo)注場(chǎng)景,?前持續(xù)預(yù)訓(xùn)練下游任務(wù)微調(diào)灰度發(fā)布聯(lián)調(diào)垂直?業(yè)知識(shí)?機(jī)協(xié)作優(yōu)化基準(zhǔn)評(píng)測(cè)定向垂直場(chǎng)景的數(shù)據(jù)服務(wù)能?場(chǎng)景化數(shù)據(jù)采集能?持續(xù)訂閱服務(wù)能?基于數(shù)據(jù)要求清洗分類能?基于下游任務(wù)微調(diào)的?機(jī)耦合標(biāo)注能?多輪對(duì)話??圖排序4D疊幀OCR預(yù)識(shí)別?視頻轉(zhuǎn)寫Prompt編寫?章判斷…基于定向垂直領(lǐng)域?員測(cè)試特定領(lǐng)域?qū)<页?場(chǎng)景化服務(wù)能?系統(tǒng)集成?持特定數(shù)據(jù)回流處理適?于新?代AI?程化數(shù)據(jù)處理平臺(tái)云測(cè)數(shù)據(jù)云測(cè)數(shù)據(jù)是Testin云測(cè)旗下AI訓(xùn)練數(shù)據(jù)服務(wù)品牌,以?質(zhì)量、場(chǎng)景化的AI訓(xùn)練數(shù)據(jù)服務(wù)為基礎(chǔ),持續(xù)為智能駕駛、智慧城市、智能家居、智慧?融等眾多領(lǐng)域提供通?數(shù)據(jù)集、數(shù)據(jù)標(biāo)注平臺(tái)&數(shù)據(jù)管理?具、數(shù)據(jù)采集/數(shù)據(jù)標(biāo)注等服務(wù)。?向垂直?業(yè)?模型AI數(shù)據(jù)解決?案適?于新?代AI?程化數(shù)據(jù)處理?作臺(tái)數(shù)回?fù)?jù)流數(shù)推據(jù)送數(shù)據(jù)池?cái)?shù)據(jù)推送功能模塊數(shù)據(jù)標(biāo)簽數(shù)據(jù)可視化版本管理數(shù)據(jù)統(tǒng)計(jì)數(shù)清據(jù)洗數(shù)標(biāo)據(jù)注數(shù)質(zhì)據(jù)檢數(shù)推據(jù)送任務(wù)創(chuàng)建*通過(guò)標(biāo)準(zhǔn)API接口與其他業(yè)務(wù)集成處理數(shù)據(jù)應(yīng)?待處理數(shù)據(jù)?貓數(shù)據(jù)?貓數(shù)據(jù)成?于2014年,專業(yè)提供?動(dòng)駕駛、計(jì)算機(jī)視覺、智能語(yǔ)?、?然語(yǔ)?理解數(shù)據(jù)采集標(biāo)注服務(wù),具備數(shù)據(jù)標(biāo)注、數(shù)據(jù)采集、內(nèi)容審核等能?。針對(duì)AIGC類?持多傳感器數(shù)據(jù)類型,可進(jìn)??標(biāo)檢測(cè)、?標(biāo)追蹤、?標(biāo)分割、?駛區(qū)域識(shí)別。只需上傳圖?(通?格式均可)、點(diǎn)云pcd格式,就可?動(dòng)識(shí)別結(jié)果。AIGC數(shù)據(jù)標(biāo)注流程「質(zhì)量保障」:引??模型,交叉驗(yàn)證??對(duì)?評(píng)測(cè)結(jié)果。評(píng)測(cè)數(shù)據(jù)標(biāo)注?員A輸出結(jié)果標(biāo)注?員B輸出結(jié)果?模型輸出結(jié)果輸出結(jié)果是是否結(jié)?果致否真實(shí)數(shù)據(jù)仿真數(shù)據(jù)?動(dòng)標(biāo)注模型DAM模塊標(biāo)注結(jié)果數(shù)據(jù)集識(shí)別能?對(duì)?數(shù)據(jù)集A數(shù)據(jù)集B數(shù)據(jù)集CDAMDAMDAMwithoutDAMwithoutDAMwithoutDAM業(yè)務(wù),?貓數(shù)據(jù)2016年推出標(biāo)注平臺(tái)1.0版本,?前已執(zhí)?1000+項(xiàng)?,標(biāo)注??2000+。?動(dòng)駕駛?模型AutopilotGPTAutopilotGPT是基于Tran

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論