版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
大語言模型通識
訓(xùn)練集、測試集、驗證集訓(xùn)練集、測試集、驗證集三者在數(shù)據(jù)目的與功能、數(shù)據(jù)交互頻率上、數(shù)據(jù)劃分與比例以及使用時機(jī)等方面均有不同之處。訓(xùn)練集、測試集和驗證集在數(shù)據(jù)來源、預(yù)處理、目標(biāo)、獨(dú)立性以及數(shù)據(jù)質(zhì)量和代表性方面都有著相似之處,這些相似性是確保模型完成有效訓(xùn)練和評估的基礎(chǔ)。微課6.2訓(xùn)練集、測試集、驗證集訓(xùn)練集用于訓(xùn)練模型,驗證集用于在訓(xùn)練過程中選擇模型和調(diào)整超參數(shù),測試集則用來最終評估模型的性能?!居?xùn)練集】訓(xùn)練模型。幫助模型確定權(quán)重和偏置等參數(shù),通過深入學(xué)習(xí)和理解訓(xùn)練集數(shù)據(jù),逐漸學(xué)會識別其中的模式和規(guī)律,并逐步優(yōu)化其預(yù)測能力?!掘炞C集】選擇和調(diào)參。用于模型選擇和超參數(shù)調(diào)整。主要幫助在眾多可能性中,找到那些能夠使模型性能達(dá)到巔峰的超參數(shù),如網(wǎng)絡(luò)層數(shù)、網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)、迭代次數(shù)、學(xué)習(xí)率等,為挑選最優(yōu)模型超參數(shù)提供優(yōu)質(zhì)的咨詢和建議?!緶y試集】評估性能??简?zāi)P停瑢δP偷姆夯芰ψ龀鲈u價。6.2.1目的與功能不同訓(xùn)練集、測試集、驗證集這三者和模型的數(shù)據(jù)交互頻率不同。訓(xùn)練集會不斷交互,驗證集是定期交互,而測試集只交互一次?!居?xùn)練集】不斷交互。通過多次學(xué)習(xí)、調(diào)整和迭代來提高性能。訓(xùn)練中,模型通過一次次的迭代優(yōu)化,逐步提升自己的工藝水平?!掘炞C集】定期交互。驗證集在訓(xùn)練過程中的不同時間點(diǎn)交互,幫助開發(fā)人員調(diào)整模型參數(shù)和決定訓(xùn)練的結(jié)束點(diǎn)。【測試集】交互一次。測試集在整個訓(xùn)練過程完成后僅交互一次,用于模型的最終評估,這個活動只有在整個訓(xùn)練過程圓滿完成后才會出現(xiàn)。6.2.2數(shù)據(jù)交互頻率不同通常情況下,數(shù)據(jù)集會通過隨機(jī)抽樣、分層抽樣、時間序列抽樣等方式,按照不同比例劃分為訓(xùn)練集、驗證集和測試集,三者之間不能有交集。【訓(xùn)練集】占比約60%~80%。訓(xùn)練集作為模型學(xué)習(xí)的主要來源,需要占據(jù)較大的比例,以確保模型有足夠的數(shù)據(jù)來捕捉到數(shù)據(jù)中的模式和規(guī)律。【驗證集】占比約10%~20%。一般來說,能提供有關(guān)模型泛化能力的有用信息就行,不用過多?!緶y試集】占比約10%~20%。因為測試集在模型訓(xùn)練完成后只評估一次,所以只要足夠用于評估模型最終性能就行。6.2.3數(shù)據(jù)劃分與比例不同訓(xùn)練集、驗證集和測試集在模型的整個訓(xùn)練過程的不同階段發(fā)揮作用,所以開發(fā)人員使用它們的時機(jī)是不同的?!居?xùn)練集】在模型的初始訓(xùn)練階段使用。模型剛剛搭建起來的時候,需要耐心地用訓(xùn)練集進(jìn)行大量的訓(xùn)練,直到它掌握了所有的知識為止?!掘炞C集】在模型訓(xùn)練過程中定期使用。需要在過程中可以監(jiān)督學(xué)習(xí)效果。【測試集】在模型訓(xùn)練完成后使用。最終評估模型性能。需要保證測試集的數(shù)據(jù)是模型之前未見過的數(shù)據(jù)。6.2.4使用時機(jī)不同訓(xùn)練集、驗證集和測試集通常來自同一數(shù)據(jù)源或具有相同的數(shù)據(jù)分布。這意味著它們共享相同的數(shù)據(jù)特征和屬性,確保模型在不同階段處理的數(shù)據(jù)具有一致性。6.2.5數(shù)據(jù)來源一致在模型訓(xùn)練之前,訓(xùn)練集、驗證集和測試集都需要進(jìn)行相似的數(shù)據(jù)預(yù)處理步驟,如歸一化、標(biāo)準(zhǔn)化、缺失值處理等。歸一化是將數(shù)據(jù)縮放到一個特定的范圍,通常是在0和1之間,目的是讓數(shù)據(jù)在相同的尺度上,以便模型能夠更好地學(xué)習(xí)和識別其中的模式。通過歸一化,使每個特征對模型的貢獻(xiàn)更加均衡。6.2.6相似的數(shù)據(jù)預(yù)處理標(biāo)準(zhǔn)化則是調(diào)整數(shù)據(jù)的尺碼,將數(shù)據(jù)特征縮放到一個標(biāo)準(zhǔn)單位。這個過程有助于算法(如線性回歸)的訓(xùn)練和預(yù)測過程更加穩(wěn)定。缺失值的處理像是填補(bǔ)數(shù)據(jù)中的空白,讓整個數(shù)據(jù)集更加完整。在數(shù)據(jù)集中,可能會有一些數(shù)據(jù)點(diǎn)由于各種原因(如測量錯誤、數(shù)據(jù)錄入錯誤等)而丟失。處理這些缺失值的方法有多種,包括刪除含有缺失值的樣本、填充缺失值(如使用平均值、中位數(shù)或眾數(shù)填充)、或者使用模型預(yù)測缺失值等。處理缺失值的關(guān)鍵是確保不會引入偏差,同時保留盡可能多的有效信息。6.2.7相似的數(shù)據(jù)預(yù)處理訓(xùn)練、驗證和測試三個數(shù)據(jù)集在模型開發(fā)的不同階段使用,但它們的目標(biāo)是一致的,即都是為了構(gòu)建一個泛化能力強(qiáng)、能夠準(zhǔn)確預(yù)測新數(shù)據(jù)的模型。為了保證模型評估的公正性,三個數(shù)據(jù)集中的樣本必須保持相互獨(dú)立。這意味著,每個集合中的數(shù)據(jù)是獨(dú)一無二的,不會與其他集合的數(shù)據(jù)交叉重疊,讓模型在評估過程中的表現(xiàn)不會受到其他集合數(shù)據(jù)的影響。這種獨(dú)立性確保了評估結(jié)果的真實(shí)性和有效性。6.2.8目標(biāo)一致,各具有獨(dú)立性為了確保模型在不同階段的學(xué)習(xí)和評估過程中能夠獲得準(zhǔn)確和可靠的結(jié)果,訓(xùn)練集、驗證集和測試集都需要能夠代表原始數(shù)據(jù)的整體特性,同時還需保證數(shù)據(jù)質(zhì)量。這意味著它們都應(yīng)該包含所有可能的數(shù)據(jù)特征和類別,以便模型能夠在不同的數(shù)據(jù)集上都能學(xué)習(xí)到有效的模式,提高其泛化能力。從訓(xùn)練集、驗證集和測試集的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園元旦活動計劃8篇
- 2024年版企業(yè)勞動協(xié)議參考文本版B版
- 2022幼兒手工教案
- 小區(qū)物業(yè)工作計劃
- 2024-2030年中國酚醛樹脂涂料行業(yè)發(fā)展運(yùn)行現(xiàn)狀及投資潛力預(yù)測報告
- 半導(dǎo)體激光治療儀項目可行性分析報告
- 大班健康活動教案四篇
- 大學(xué)班主任工作計劃
- 美術(shù)教師個人工作總結(jié)5篇
- 醫(yī)學(xué)類實(shí)習(xí)報告模板九篇
- 大學(xué)生勞動教育課件:發(fā)展專業(yè)技能進(jìn)行創(chuàng)造性勞動
- 2024年意識形態(tài)工作專題會議記錄【6篇】
- 北師大版九年級《數(shù)學(xué)》上冊全冊教案
- 人民大會堂介紹課件
- 建行家裝貸產(chǎn)品介紹
- 護(hù)理分級標(biāo)準(zhǔn)2023版(新舊標(biāo)準(zhǔn)對比詳解)
- 《比特幣完整介紹》課件
- 機(jī)電運(yùn)輸安全基本知識
- XX藥業(yè)公司受試者日記卡
- 連鎖藥店GSP質(zhì)量管理體系詳細(xì)文件
- 《電氣工程講》課件
評論
0/150
提交評論