版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
大語(yǔ)言模型通識(shí)微課
什么是數(shù)據(jù)標(biāo)注數(shù)據(jù)標(biāo)注是大模型數(shù)據(jù)能力鏈上的重要一環(huán)。數(shù)據(jù)是人工智能的基礎(chǔ),更是大模型源源不斷的養(yǎng)分來(lái)源,數(shù)據(jù)標(biāo)注直接決定了大模型有多聰明。OpenAI在數(shù)據(jù)標(biāo)注上的方式是先做出預(yù)訓(xùn)練模型,再用強(qiáng)化學(xué)習(xí)加上人工反饋來(lái)調(diào)優(yōu),也就是RLHF(從人類(lèi)反饋中強(qiáng)化學(xué)習(xí))。他們找了很多家數(shù)據(jù)公司來(lái)共同完成數(shù)據(jù)標(biāo)注,自己組建一個(gè)質(zhì)檢團(tuán)隊(duì)檢查標(biāo)注好的數(shù)據(jù)。數(shù)據(jù)標(biāo)注不是以對(duì)錯(cuò)來(lái)評(píng)估,而是給每個(gè)問(wèn)題選出多個(gè)匹配的結(jié)果,再經(jīng)過(guò)多人多輪的結(jié)果排序,直至模型數(shù)據(jù)符合常人思維,甚至某些專(zhuān)業(yè)領(lǐng)域的結(jié)果要達(dá)到特定要求的知識(shí)水平。微課4.1人工數(shù)據(jù)標(biāo)注人工智能是通過(guò)機(jī)器學(xué)習(xí)方法大量學(xué)習(xí)已知樣本,有了預(yù)測(cè)能力之后再預(yù)測(cè)未知樣本,以達(dá)到智能化的效果。實(shí)際應(yīng)用中有監(jiān)督的深度學(xué)習(xí)方式是主流。監(jiān)督學(xué)習(xí)對(duì)標(biāo)注數(shù)據(jù)有著強(qiáng)依賴(lài)性需求。未經(jīng)標(biāo)注處理過(guò)的原始數(shù)據(jù)多以非結(jié)構(gòu)化數(shù)據(jù)為主,這些數(shù)據(jù)難以被機(jī)器識(shí)別和學(xué)習(xí)。只有標(biāo)注處理后的結(jié)構(gòu)化數(shù)據(jù)才能被算法模型訓(xùn)練使用。數(shù)據(jù)標(biāo)注通過(guò)人工標(biāo)注方式,把需要機(jī)器識(shí)別和分辨的語(yǔ)音、圖片、文本、視頻等數(shù)據(jù)打上標(biāo)簽,進(jìn)行加工處理,為機(jī)器系統(tǒng)提供大量的學(xué)習(xí)樣本,然后讓計(jì)算機(jī)不斷地學(xué)習(xí)這些數(shù)據(jù)的特征,最終實(shí)現(xiàn)計(jì)算機(jī)自主識(shí)別。4.1.1什么是數(shù)據(jù)標(biāo)注大模型數(shù)據(jù)標(biāo)注的特點(diǎn)主要如下。(1)非結(jié)構(gòu)化。早期的數(shù)據(jù)標(biāo)注工作主要以“打點(diǎn)”和“畫(huà)框”為主,就是讓機(jī)器學(xué)習(xí)什么是“人臉”,什么是“障礙物”,需要嚴(yán)格按照客戶(hù)給定的標(biāo)注規(guī)范進(jìn)行,標(biāo)注要求也偏客觀。大模型標(biāo)注則更像是在做閱讀理解,模型學(xué)習(xí)應(yīng)該給出什么樣的內(nèi)容,大模型生成的多個(gè)結(jié)果哪個(gè)更接近滿(mǎn)分答案,標(biāo)注要求偏主觀,難以形成統(tǒng)一的標(biāo)準(zhǔn)。標(biāo)準(zhǔn)從客觀到主觀,非??简?yàn)標(biāo)注師的主觀能動(dòng)性以及解決問(wèn)題的能力。4.1.1什么是數(shù)據(jù)標(biāo)注(2)知識(shí)密集型。大模型背景下的標(biāo)注工作主要分為兩類(lèi):通識(shí)大模型標(biāo)注、領(lǐng)域大模型標(biāo)注。大模型產(chǎn)品多數(shù)是通識(shí)大模型,需要標(biāo)注師具備較強(qiáng)的自然語(yǔ)言能力。領(lǐng)域大模型標(biāo)注對(duì)學(xué)歷、能力、專(zhuān)業(yè)度的要求更高。大多數(shù)行業(yè)或企業(yè)需要具備領(lǐng)域知識(shí)的專(zhuān)業(yè)人才,他們要重點(diǎn)解決金融、醫(yī)療、科技等領(lǐng)域的專(zhuān)業(yè)問(wèn)題,最終形成專(zhuān)業(yè)的高質(zhì)量數(shù)據(jù)。(3)學(xué)歷要求高。早期的數(shù)據(jù)標(biāo)注工作者算是人工智能領(lǐng)域的流水線(xiàn)工人。如今的標(biāo)注師們屬于互聯(lián)網(wǎng)公司的白領(lǐng),甚至很多專(zhuān)業(yè)領(lǐng)域的標(biāo)注人員都是碩士或博士學(xué)歷,其身份是領(lǐng)域標(biāo)注專(zhuān)家。4.1.1什么是數(shù)據(jù)標(biāo)注從不同的角度思考,數(shù)據(jù)標(biāo)注有許多不同的分類(lèi)。(1)從難易程度方面,數(shù)據(jù)標(biāo)注可劃分為常識(shí)性標(biāo)注與專(zhuān)業(yè)性標(biāo)注。例如地圖識(shí)別標(biāo)注多為常識(shí)性標(biāo)注,標(biāo)注道路、路牌、地圖等數(shù)據(jù),語(yǔ)音識(shí)別標(biāo)注也多為常識(shí)性標(biāo)注。難點(diǎn)在于需要大量標(biāo)注訓(xùn)練樣本,因?yàn)閼?yīng)用場(chǎng)景多樣且復(fù)雜,一般對(duì)標(biāo)注員無(wú)專(zhuān)業(yè)技能要求。醫(yī)療診斷領(lǐng)域標(biāo)注多為專(zhuān)業(yè)性標(biāo)注,因?yàn)椴》N、癥狀的分類(lèi)與標(biāo)注需要有醫(yī)療專(zhuān)業(yè)知識(shí)的人才來(lái)完成。4.1.2數(shù)據(jù)標(biāo)注的分類(lèi)(2)從標(biāo)注目的方面,數(shù)據(jù)標(biāo)注可劃分為評(píng)估型標(biāo)注與樣本型標(biāo)注。評(píng)估型標(biāo)注一般是為了評(píng)估模型的準(zhǔn)確率,發(fā)現(xiàn)一些不好的樣例,然后優(yōu)化算法模型。樣本型標(biāo)注是為模型提供前期的訓(xùn)練樣本作為機(jī)器學(xué)習(xí)的輸入。為了樣本的均衡性,標(biāo)注樣本大都是隨機(jī)抽取的。這樣可在一定程度上避免樣本偏差,但缺點(diǎn)是要標(biāo)注大量數(shù)據(jù)。4.1.2數(shù)據(jù)標(biāo)注的分類(lèi)數(shù)據(jù)標(biāo)注從標(biāo)注對(duì)象方面,可劃分為圖像、語(yǔ)音、視頻和文本標(biāo)注。圖像標(biāo)注是對(duì)未經(jīng)處理的圖片數(shù)據(jù)進(jìn)行加工處理,轉(zhuǎn)換為機(jī)器可識(shí)別信息,然后輸送到人工智能算法和模型里完成調(diào)用。常見(jiàn)的圖像標(biāo)注方法有語(yǔ)義分割、矩形框標(biāo)注、多邊形標(biāo)注、關(guān)鍵點(diǎn)標(biāo)注、點(diǎn)云標(biāo)注、3D立方體標(biāo)注、2D/3D融合標(biāo)注、目標(biāo)追蹤等。圖4-4圖像標(biāo)注4.1.3圖像標(biāo)注語(yǔ)音標(biāo)注是標(biāo)注員把語(yǔ)音中包含的文字信息、各種聲音先“提取”出來(lái),再進(jìn)行轉(zhuǎn)寫(xiě)或者合成。標(biāo)注后的數(shù)據(jù)主要用于機(jī)器學(xué)習(xí),使計(jì)算機(jī)可以擁有語(yǔ)音識(shí)別能力。常見(jiàn)的語(yǔ)音標(biāo)注類(lèi)型有語(yǔ)音轉(zhuǎn)寫(xiě)、語(yǔ)音切割、語(yǔ)音清洗、情緒判斷、聲紋識(shí)別、音素標(biāo)注、韻律標(biāo)注、發(fā)音校對(duì)等。
圖4-5語(yǔ)音標(biāo)注4.1.3語(yǔ)音標(biāo)注點(diǎn)云數(shù)據(jù)一般由激光雷達(dá)等3D掃描設(shè)備獲取空間若干點(diǎn)的信息,包括XYZ位置信息、RGB顏色信息和強(qiáng)度信息等,是一種多維度的復(fù)雜數(shù)據(jù)集合。3D點(diǎn)云數(shù)據(jù)可以提供豐富的幾何、形狀和尺度信息,并且不易受光照強(qiáng)度變化和其它物體遮擋等影響,可以很好地了解機(jī)器的周?chē)h(huán)境。常見(jiàn)的3D點(diǎn)云標(biāo)注類(lèi)型有3D點(diǎn)云目標(biāo)檢測(cè)標(biāo)注、3D點(diǎn)云語(yǔ)義分割標(biāo)注、2D3D融合標(biāo)注、點(diǎn)云連續(xù)幀標(biāo)注等。圖4-63D點(diǎn)云標(biāo)注4.1.43D點(diǎn)云標(biāo)注文本標(biāo)注是對(duì)文本進(jìn)行特征標(biāo)記的過(guò)程,對(duì)其打上具體的語(yǔ)義、構(gòu)成、語(yǔ)境、目的、情感等數(shù)據(jù)標(biāo)簽。通過(guò)標(biāo)注好的訓(xùn)練數(shù)據(jù),可以教會(huì)機(jī)器識(shí)別文本中所隱含的意圖或者情感,使機(jī)器可以更好地理解語(yǔ)言。常見(jiàn)的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年河北省建筑安全員-A證考試題庫(kù)及答案
- 2025河南省建筑安全員A證考試題庫(kù)
- 《家禽常見(jiàn)病資料》課件
- 《法醫(yī)檢驗(yàn)相關(guān)》課件
- 單位人力資源管理制度集粹匯編十篇
- 單位人力資源管理制度呈現(xiàn)大合集十篇
- 北方華創(chuàng)刻蝕和薄膜沉積設(shè)備領(lǐng)域優(yōu)勢(shì)突出打造平臺(tái)型設(shè)備龍頭
- 2025年人形機(jī)器人行業(yè)投資策略報(bào)告:量產(chǎn)元年曙光將現(xiàn)
- 單位管理制度收錄大全人事管理十篇
- 單位管理制度收錄大合集員工管理篇十篇
- 少年宮2025年度象棋活動(dòng)計(jì)劃
- 2025年國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心省級(jí)分中心招聘39人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- ISO 56001-2024《創(chuàng)新管理體系-要求》專(zhuān)業(yè)解讀與應(yīng)用實(shí)踐指導(dǎo)材料之21:“7支持-7.5成文信息”(雷澤佳編制-2025B0)
- 2023-2024年電商直播行業(yè)現(xiàn)狀及發(fā)展趨勢(shì)研究報(bào)告
- 中央2024年市場(chǎng)監(jiān)管總局直屬事業(yè)單位招聘中層干部歷年參考題庫(kù)(頻考版)含答案解析
- 阜陽(yáng)市重點(diǎn)中學(xué)2025屆高考數(shù)學(xué)全真模擬密押卷含解析
- 2024年市特殊教育學(xué)校工作總結(jié)范文(2篇)
- LNG采購(gòu)框架合同范例
- 課題1 金屬材料 教學(xué)設(shè)計(jì) 九年級(jí)化學(xué)下冊(cè)人教版2024
- 能源崗位招聘筆試題與參考答案(某大型國(guó)企)
- 工業(yè)設(shè)計(jì)基礎(chǔ)知識(shí)單選題100道及答案解析
評(píng)論
0/150
提交評(píng)論