




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
人工智能基礎(chǔ)進(jìn)階篇匯報(bào)人:XXXfoundationofartificialintelligence目錄讓人工智能更智能無監(jiān)督機(jī)器學(xué)習(xí)的方法阿爾法狗背后的秘密CONTENT讓人工智能更智能Makeartificialintelligencesmarter監(jiān)督學(xué)習(xí)需要訓(xùn)練數(shù)據(jù)的標(biāo)注信息的學(xué)習(xí)過程,就是監(jiān)督學(xué)習(xí)如:分類器從數(shù)據(jù)中學(xué)會了區(qū)分鳶尾花的品種如:對圖像、音頻和視頻的分類,都需要類別的標(biāo)注信息,都屬于監(jiān)督學(xué)習(xí)沒有類別的標(biāo)注信息供人工智能參考時(shí),怎么辦?“計(jì)算機(jī)能不能自動將照片整理好?”無監(jiān)督學(xué)習(xí)沒有標(biāo)注信息的學(xué)習(xí)過程無類別信息指導(dǎo)很難判斷哪一些鳶尾花是相同品種“計(jì)算機(jī)能不能自動將照片整理好?”聚類(clustering)通過分析數(shù)據(jù)在特征空間的聚集情況,可以將一組數(shù)據(jù)分成不同的類。旨在把一群樣本分為多個(gè)集合,使得同一個(gè)集合內(nèi)的元素盡量“相似”或者“相近”是一種無監(jiān)督學(xué)習(xí)過程不需要數(shù)據(jù)的類別標(biāo)注不需要預(yù)先定義類別讓人工智能像真正的科學(xué)家一樣,自己發(fā)掘規(guī)律。問題的提出我們希望人工智能在不知道鳶尾花品種的前提下將這N朵鳶尾花分為K類,使得同一類樣本的特征相似程度高,而不同類樣本的特征相似程度低。算法主要思路先從任意一組劃分出發(fā),通過調(diào)整,逐步達(dá)成上述目標(biāo)算法步驟1.先計(jì)算鳶尾花的聚類中心2.針對矛盾樣本進(jìn)行調(diào)整3.K均值聚類結(jié)果4.重復(fù)第2、3步驟,直到聚類中心與劃分方式不再發(fā)生變化K均值聚類算法KmeansclusteringalgorithmUnsupervisedmachinelearningmethods無監(jiān)督機(jī)器學(xué)習(xí)的方法聚類算法示例(鳶尾花分類問題)1.先計(jì)算鳶尾花的聚類中心2.針對矛盾樣本進(jìn)行調(diào)整3.K均值聚類結(jié)果K均值聚類算法Kmeansclusteringalgorithm只要我們能對照片中的人臉提取特征,用特征空間里的特征點(diǎn)表示每一張人臉,就能使用K均值算法將“相似”的人臉聚集起來了相冊中的人臉聚類K均值聚類算法Kmeansclusteringalgorithm聚類數(shù)量過大會導(dǎo)致照片劃分得過細(xì),這樣就失去了實(shí)用性,需要在平均距離與聚類數(shù)量之間取得平衡如圖,在K=3的時(shí)候,曲線產(chǎn)生了一個(gè)明顯的拐點(diǎn),拐點(diǎn)后隨著K的增加平均距離減少得非常慢,因此K=3是個(gè)合適的選擇。K值的確定手肘法(elbowmethod)K均值聚類算法Kmeansclusteringalgorithm潛在語義分析技術(shù)Latentsemanticanalysis針對文本數(shù)據(jù)“多主題”的特點(diǎn)而設(shè)計(jì)計(jì)算機(jī)可以借助該技術(shù),從海量的文本數(shù)據(jù)中自動發(fā)掘潛在的主題,進(jìn)而完成對文本內(nèi)容的概括和提煉相關(guān)專有名詞語料庫(corpus):海量的文本數(shù)據(jù)文檔(document):語料庫中獨(dú)立的文本主題:文檔的中心思想或主要內(nèi)容主題模型與潛在語義分析技術(shù)TopicModelandLatentSemanticAnalysisTechnology詞袋模型
詞袋模型(bagofwords
model)是用于描述文本的一個(gè)簡單的數(shù)學(xué)模型,常用文本特征提取方式之一。詞袋模型將一篇文文件看作是一個(gè)“裝有若干詞語的袋子”,只考慮詞語在文檔中出現(xiàn)的次數(shù),而忽略詞語的順序以及句子的結(jié)構(gòu)。利用詞袋模型構(gòu)建文本特征的基本流程文本的特征中文分詞詞頻特征文檔詞袋刪除停止詞與低頻詞中文分詞中文分詞詞典詞頻率—逆文檔頻率特征主題模型與潛在語義分析技術(shù)TopicModelandLatentSemanticAnalysisTechnology中文分詞
對中文文本進(jìn)行詞袋構(gòu)建之前,我們還需要藉助額外的手段拆分詞語,這項(xiàng)技術(shù)稱為中文分詞。中文分詞方法大多基于匹配和統(tǒng)計(jì)學(xué)方法。停止詞與低頻詞停止詞:是文檔常出現(xiàn)的,構(gòu)成中文句子的基本字詞,對區(qū)分不同文文件的主題沒有任何幫助(不攜帶任何主題信息的高頻詞)低頻詞:通常是一些不常用的專有名詞,只出現(xiàn)于特定的文章中(比如姓名),不能代表某一主題。詞頻率與逆文檔頻率反映一個(gè)詞語對于一篇文檔的重要性的兩個(gè)指標(biāo)一個(gè)詞語在一篇文文件中出現(xiàn)的頻率即為詞頻率(team
frequency)借助逆文檔頻率(inversedocumentfrequency)來修正每個(gè)詞語在每篇文檔中的重要性文本的特征主題模型與潛在語義分析技術(shù)TopicModelandLatentSemanticAnalysisTechnology主題模型(topic
model)是描述語料庫及其中潛在主題的一類數(shù)學(xué)模型將文文檔詞頻、主題比重、主題詞頻三者的關(guān)系表示為:D
=
WT,這個(gè)等式建立了語料庫與潛在主題之間的關(guān)系,是主題模型的核心。通過主題模型,我們建立了語料庫與其中潛在主題之間的關(guān)系發(fā)掘文本中潛在的主題主題模型與潛在語義分析技術(shù)TopicModelandLatentSemanticAnalysisTechnology生成對抗絡(luò)GenerativeAdversarialNetwork概述生成對抗絡(luò)由生成絡(luò)(generativenetwork)和判別絡(luò)(discriminativenetwork)兩部分構(gòu)成生成絡(luò):用于生成數(shù)據(jù)判別絡(luò):用來分辨數(shù)據(jù)是真還是假generativeadversarialnetwork,GAN02由“生成”、“對抗”和“路”三個(gè)詞語構(gòu)成。其中“生成”是指它是一個(gè)生成模型(generativemodel),即它可以隨機(jī)生成觀測數(shù)據(jù)0103基本思想:通過生成絡(luò)和判別絡(luò)之間的相互“對抗”來學(xué)習(xí)0504數(shù)據(jù)空間與數(shù)據(jù)分布數(shù)據(jù)空間(dataspace)是數(shù)據(jù)所在的空間假定輸入圖片的分辨率為128x128,此時(shí)的數(shù)據(jù)空間就是所有形狀為128x128x3的張量的集合。此時(shí)每張圖片都是此空間里的一個(gè)點(diǎn)(數(shù)據(jù)點(diǎn))數(shù)據(jù)分布(datadistribution)是數(shù)據(jù)點(diǎn)在空間的分布情況生成對抗絡(luò)GenerativeAdversarialNetwork分類路與生成路工作方式的比較生成絡(luò)生成器(generator)把潛在空間中的分布變換為圖像空間中的分布(生成分布)生成絡(luò)生成的點(diǎn)就叫做生成點(diǎn)生成對抗絡(luò)GenerativeAdversarialNetwork例:用判別絡(luò)分辨點(diǎn)的來源判別絡(luò)判別器(discriminator)判斷一張圖片究竟是來自真實(shí)數(shù)據(jù)還是由生成絡(luò)所生成訓(xùn)練判別絡(luò)訓(xùn)練數(shù)據(jù)標(biāo)注輸入圖片來自真實(shí)數(shù)據(jù):標(biāo)注數(shù)值1,輸入圖片來自生成路:標(biāo)注數(shù)值0輸出結(jié)果用一個(gè)數(shù)值來指示空間中的一個(gè)點(diǎn)來自真實(shí)數(shù)據(jù)的可能性(概率)生成對抗絡(luò)GenerativeAdversarialNetwork包含兩個(gè)交替進(jìn)行的階段固定生成路,訓(xùn)練判別路1.給定二分類數(shù)據(jù)集:真實(shí)圖片/隨機(jī)生成圖片2.目標(biāo):使判別路對真實(shí)圖片的預(yù)測接近1,而對生成圖片的預(yù)測接近0固定判別路,訓(xùn)練生成路1.生成路利用判別路給出的反饋訊息來調(diào)整路參數(shù)2.目標(biāo):使生成路輸出更接近真實(shí)圖片的生成圖片對抗過程生成絡(luò)的訓(xùn)練生成對抗絡(luò)GenerativeAdversarialNetworkThesecretbehindAlphaDog阿爾法狗背后的秘密深藍(lán)vs卡斯帕羅夫阿爾法狗vs李世石強(qiáng)化學(xué)習(xí)(reinforcementlearning)功不可沒~棋類計(jì)算機(jī)程序的發(fā)展Developmentofchesscomputerprograms價(jià)值絡(luò)阿爾法狗的走棋絡(luò)AlphaDog'sChessNetwork01030402走棋絡(luò)又被稱為策略絡(luò)(policynetwork)該絡(luò)接受當(dāng)前棋盤局面作為輸入,并輸出在當(dāng)前局面下選擇每個(gè)位置的落子概率。策略絡(luò)監(jiān)督學(xué)習(xí)策略絡(luò)強(qiáng)化學(xué)習(xí)策略絡(luò)輸入局面(3000萬樣本)深度卷積神經(jīng)絡(luò)落子概率預(yù)測(s,a)s:當(dāng)前棋局局面狀態(tài)
a:人類的落子方案監(jiān)督學(xué)習(xí)決策絡(luò)可以模仿人類的風(fēng)格下棋,可人類棋手的水平高低不一,并非每個(gè)樣本都是好的落子方案,絡(luò)把好的壞的都學(xué)了,如何提高棋力?監(jiān)督學(xué)習(xí)策略絡(luò)Supervisedlearningstrategynetwork強(qiáng)化學(xué)習(xí)的目的是找到一個(gè)最佳策略,從而使得主體發(fā)出一系列動作后,收到的累計(jì)回報(bào)最多策略梯度的強(qiáng)化學(xué)習(xí)技術(shù)監(jiān)督學(xué)習(xí)策略絡(luò)強(qiáng)化學(xué)習(xí)策略絡(luò)A強(qiáng)化學(xué)習(xí)策略絡(luò)B初始化自我對弈強(qiáng)化學(xué)習(xí)絡(luò)在訓(xùn)練時(shí)的目標(biāo)不再是模擬人類棋手的風(fēng)格,而是以最終贏棋為目標(biāo)強(qiáng)化學(xué)習(xí)策略絡(luò)ReinforcementLearningStrategyNetwork阿爾法元只以棋盤當(dāng)局作為絡(luò)輸入,使用策略迭代的強(qiáng)化學(xué)習(xí)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 快遞環(huán)保方案行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 生物質(zhì)能源融資行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 木材加工粉塵收集系統(tǒng)企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 環(huán)境保護(hù)行業(yè)行為獎(jiǎng)懲措施
- 食品安全檢測新冠病毒檢測流程
- 2024-2025學(xué)年湘教版三年級上冊班級管理計(jì)劃
- 金融科技領(lǐng)域用戶身份核對流程優(yōu)化
- 新能源項(xiàng)目圖紙?jiān)O(shè)計(jì)質(zhì)量控制措施
- 老年護(hù)理服務(wù)人員培訓(xùn)計(jì)劃
- 2024-2025學(xué)年人教版小學(xué)一年級閱讀理解提升計(jì)劃
- 山東省濟(jì)南育英中學(xué) 2024-2025學(xué)年下學(xué)期七年級3月月考英語試題(原卷版+解析版)
- T-SDFA 049-2024 混合型飼料添加劑中安普霉素的測定 液相色譜-串聯(lián)質(zhì)譜法
- 公司事故隱患內(nèi)部報(bào)告獎(jiǎng)勵(lì)制度
- 2025年甘肅甘南州國控資產(chǎn)投資管理集團(tuán)有限公司面向社會招聘工作人員12人筆試參考題庫附帶答案詳解
- 2025年安徽省滁州市鳳陽縣部分事業(yè)單位招聘歷年自考難、易點(diǎn)模擬試卷(共500題附帶答案詳解)
- 2025年遼寧省交通高等??茖W(xué)校單招職業(yè)適應(yīng)性測試題庫必考題
- 2025年高考數(shù)學(xué)第一次模擬考試(江蘇卷1)(全解全析)
- 2024年臨港新片區(qū)文員招聘筆試真題
- 2025年中級維修電工(四級)技能認(rèn)定理論考試指導(dǎo)題庫(含答案)
- 2024年食品微生物檢驗(yàn)技術(shù)試題庫及答案(含各題型)
- 2025廣東深圳證券信息有限公司人員招聘筆試參考題庫附帶答案詳解
評論
0/150
提交評論