人工智能算法分析 課件 【ch01】緒論_第1頁
人工智能算法分析 課件 【ch01】緒論_第2頁
人工智能算法分析 課件 【ch01】緒論_第3頁
人工智能算法分析 課件 【ch01】緒論_第4頁
人工智能算法分析 課件 【ch01】緒論_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

人工智能算法分析新知識體系人工智能教材緒論第一章人類的學(xué)習與機器的學(xué)習011.1.1人類的學(xué)習Duda(1989)認為,學(xué)習是由經(jīng)歷引起的內(nèi)部表達的創(chuàng)新或修改,這一變化可以保持相當長一段時間(甚至可以保持很多年),而內(nèi)部表達是指“能夠有效地指導(dǎo)行為的結(jié)構(gòu)化神經(jīng)編碼方式”。早在20世紀初,隨著行為主義上升為一種主要的思想流派,學(xué)習就成為心理學(xué)關(guān)注的主要對象。在人工智能以外的領(lǐng)域,學(xué)習更多的是作為心理學(xué)概念。學(xué)習可以通過對單個剌激的習慣化或敏感化而實現(xiàn),也可以通過兩個或更多剌激之間的聯(lián)系而獲得。今天,學(xué)習依然是許多心理學(xué)領(lǐng)域(認知、教育、社會和發(fā)育等)關(guān)注的重點問題,而人工智能更關(guān)注機器的學(xué)習能力。1.1.1人類的學(xué)習主動性所謂主動性學(xué)習,是指學(xué)習者可以控制自己的學(xué)習行為,知道自己懂得什么、不懂得什么,這樣可以自己掌握學(xué)習進展和內(nèi)容。機械式學(xué)習機械式學(xué)習是指不加理解、重復(fù)記憶的學(xué)習,只對學(xué)習材料進行機械識記。有時,機械式學(xué)習是理解式學(xué)習的必要前提。聯(lián)想與非聯(lián)想式學(xué)習聯(lián)想式學(xué)習涉及兩種或兩種以上的剌激和響應(yīng)連接,非聯(lián)想式學(xué)習是指由單一刺激重復(fù)呈現(xiàn)引起的較為持久的行為變化。情景學(xué)習由一個事件導(dǎo)致行為發(fā)生變化,這稱為情景學(xué)習。例如,有句諺語叫“一朝被蛇咬,十年怕井繩“。010203041.1.1人類的學(xué)習05理解式學(xué)習對人類而言,學(xué)習材料對學(xué)習者而言具有重要的潛在意義,如果學(xué)習者頭腦中吸收了新學(xué)材料的知識,學(xué)習者具有學(xué)習的意向,那么這種情況下的學(xué)習過程稱為理解式學(xué)習,這一種類型的學(xué)習往往涉及些復(fù)雜而綜合的知識。06玩耍式學(xué)習玩耍式學(xué)習玩耍式學(xué)習,通常是指自身沒有特別結(jié)果的行為,卻能改善未來相似環(huán)境中的行為(如捕食或逃避敵害),這在哺乳動物和鳥類中十分常見。這顯示了玩耍與學(xué)習的密切關(guān)系。07濡化與涵化濡化是指人的價值觀和社會準則被該社會成員傳承或習得的過程,而涵化是指不同民族接觸而引起原有文化變遷的過程,這種變化既可在群體水平上發(fā)生,也可在個體水平上發(fā)生。1.1.1人類的學(xué)習除了上述幾種主要的學(xué)習類型,美國心理學(xué)家加涅還將學(xué)習分為八個層次和五種類別。八個層次是信號學(xué)習、剌激-反應(yīng)學(xué)習、連鎖學(xué)習、言語聯(lián)結(jié)學(xué)習、辨別學(xué)習、概念學(xué)習、原理(規(guī)則)學(xué)習和解決問題學(xué)習。五種學(xué)習類別是言語信息、智慧技能、認知策略、動作技能和態(tài)度。1.1.1人類的學(xué)習認識階段了解問題的結(jié)構(gòu)(起始狀態(tài)、目標狀態(tài)及所需要的步驟和算子)。01聯(lián)結(jié)階段用具體方法將某一領(lǐng)域的陳述性知識轉(zhuǎn)化為程序性知識(程序化)。02自動化階段將復(fù)雜的技能學(xué)習分解為對一些個別成分的法則的學(xué)習。它們又可復(fù)合成大的技能學(xué)習過程。03美國心理學(xué)家和計算機學(xué)家安德森認為,心智技能的形成需要經(jīng)過3個階段1.1.1人類的學(xué)習無論怎樣劃分,上述關(guān)于人類的學(xué)習類型都是根據(jù)人類對自身學(xué)習的長期觀察而總結(jié)出來的。人的學(xué)習能力與大腦、身體、環(huán)境、社會等都有緊密聯(lián)系,而不僅僅是大腦自己的功能。顯而易見,1~6項學(xué)習類型都是與個體大腦智能有關(guān)的學(xué)習,而濡化與涵化是基于個體與群體、社會的關(guān)系形成的學(xué)習類型,說明人類的學(xué)習能力是十分復(fù)雜的問題。理解人類的學(xué)習類型有助于理解機器學(xué)習的本質(zhì)。1.1.2機器的學(xué)習下面考慮這樣一個問題,怎樣用算法來判斷一個水果是橘子還是梨?在回答這個問題之前,我們先看人類是怎樣做的。人類在識別這兩種水果時使用了有區(qū)分度的特征:第一個典型特征是質(zhì)量,梨比橘子的質(zhì)量大;第二個典型特征就是顏色,橘子一般呈桶黃色,梨呈黃色。1.1.2機器的學(xué)習計算機算法采用類似的手段來解決此問題。首先,需要采集一些橘子和梨的樣本,測量這些樣本的質(zhì)量和顏色等特征數(shù)據(jù),將這些特征數(shù)據(jù)作為訓(xùn)練樣本,然后,將水果畫在二維平面上,得到用于區(qū)分橘子與梨的特征。1.1.2機器的學(xué)習質(zhì)量和顏色是區(qū)分這兩類水果的有用信息,將它們組合在一起可形成二維特征向量。這些特征向量是三維空間的點,橫坐標x代表質(zhì)量,縱坐標y代表顏色。每測量一個水果,就可以得到一個點。將這些點描繪在二維平面上可以發(fā)現(xiàn):梨在第一象限的右下方,橘子在第一象限的左上方。利用這一規(guī)律,可以在平面上找到一條直線,把該平面分成兩部分,將落在第一部分的點判定為橘子,將落在第二部分的點判定為梨。1.1.2機器的學(xué)習假設(shè)找到一條直線,它的方程為ax+by+c=0將位于直線左上方的所有點判定為橘子,將落在直線右下方的所有點判定為梨。線左上方的點滿足ax+by+c≤0直線下方的點滿足ax+by+c>0給兩類水果進行編號,稱為類別標簽,在這里,橘子的類別標簽為-1,梨的類別標簽為+1。上面的判定規(guī)則可以寫成決策函數(shù)1.1.2機器的學(xué)習現(xiàn)在的問題是怎樣找到這條直線,即確定參數(shù)a、b和c的值。采集大量的水果樣本,測量它們的質(zhì)量和顏色,形成平面上的一系列點。如果能夠通過某種方法找到一條直線,保證這些點能夠被正確分類,那么就可以用這條直線對新加入的水果進行判定。通過這些樣本尋找好類直線的過程就是機器學(xué)習的訓(xùn)練過程。由于要判斷一個物體所屬的類別,所以前面的問題被稱為分類問題,根據(jù)之前的表述,可以得到預(yù)測水果類別的函數(shù)為sgn(ax+by+c)sgn是符號函數(shù),其定義為1.1.2機器的學(xué)習在后面的各種機器學(xué)習算法中會經(jīng)常用到此函數(shù)。前面的例子有一個特點:需要用樣本數(shù)據(jù)進行學(xué)習,得到一個函數(shù)(或稱為模型),然后用這個模型對新加入的樣本進行預(yù)測。機器學(xué)習任務(wù)的一般流程如圖1.3所示。1.1.2機器的學(xué)習圖1.3是監(jiān)督學(xué)習的一般流程,還有一些機器學(xué)習算法沒有此訓(xùn)練過程,如聚類和數(shù)據(jù)降維,將在本章其他部分介紹。機器學(xué)習算法和其他算法的一個顯著區(qū)別是需要樣本數(shù)據(jù),它是一種數(shù)據(jù)驅(qū)動的方法。機器學(xué)習與人類思考的對比如圖1.4所示。1.1.2機器的學(xué)習人類在成長、生活過程中積累了很多的歷史與經(jīng)驗。人類定期地對這些經(jīng)驗進行“歸納”,獲得生活的“規(guī)律”。當人類遇到新的問題或需要對未來進行“推測”的時候,人類使用這些“規(guī)律”,對未知問題與未來進行“推測”,從而指導(dǎo)自己的生活和工作。機器學(xué)習中的“訓(xùn)練”與“預(yù)測”過程可以對應(yīng)人類的“歸納”和“推測”過程。通過這樣的對應(yīng)可以發(fā)現(xiàn),機器學(xué)習僅僅是對人類在生活中學(xué)習成長的模擬。由于機器學(xué)習不是基于編程形成的結(jié)果,因此它的處理過程不是因果的邏輯,而是通過歸納思想得出的相關(guān)性結(jié)論。因此,要通過現(xiàn)階段的機器學(xué)習技術(shù)使機器具備類人智能,還有很大差距,但己經(jīng)發(fā)展出的機器學(xué)習技術(shù)通過計算機進行各種數(shù)據(jù)分析和處理的能力是人類智能所無法比擬的。機器學(xué)習

與機器智能021.2.1機器學(xué)習的概念一般來說,機器學(xué)習就是指計算機算法能夠像人一樣,從數(shù)據(jù)中找到信息,從而學(xué)習一些規(guī)律,其經(jīng)典定義是“利用經(jīng)驗來改善系統(tǒng)自身的性能”。因為在計算機系統(tǒng)中,“經(jīng)驗”通常是以數(shù)據(jù)的形式存在的,因此機器學(xué)習要利用經(jīng)驗,就必須對數(shù)據(jù)進行分析。在前面的例子中,預(yù)測就是對水果的類型做出判斷。機器學(xué)習讓計算機算法具有類似人的學(xué)習能力,像人一樣能夠從實例中學(xué)到經(jīng)驗和知識,從而具備判斷和預(yù)測的能力。這里的實例可以是圖像、聲音,也可以是數(shù)字、文字。1.2.1機器學(xué)習的概念機器學(xué)習的本質(zhì)是對模型的選擇及對模型參數(shù)的確定。抽象來看,在大多數(shù)情況下,機器學(xué)習算法是要確定一個映射函數(shù)f及函數(shù)的參數(shù)θ,建立如下映射關(guān)系其中,x為函數(shù)的輸入值,一般是一個向量:y為函數(shù)的輸出值,是一個向量或標量。當映射函數(shù)和它的參數(shù)確定之后,給定一個輸入值就可以產(chǎn)生一個輸出值。映射函數(shù)的選擇并沒有特定限制。在上面的例子中使用了最簡單的線性函數(shù),一般情況下,需要根據(jù)問題和數(shù)據(jù)的特點選擇合適的函數(shù)。用映射函數(shù)的輸出值可以實現(xiàn)人們需要的推理或決策。與傳統(tǒng)的為解決特定任務(wù)、硬編碼的軟件程序不同,機器學(xué)習是指用數(shù)據(jù)來訓(xùn)練,通過各種算法從數(shù)據(jù)中學(xué)習如何完成任務(wù)。因此,機器學(xué)習理論主要是設(shè)計和分析一些讓計算機可以自動“學(xué)習”的算法。1.2.1機器學(xué)習的概念機器學(xué)習算法的主要作用是從數(shù)據(jù)中自動分析,獲得規(guī)律,并利用規(guī)律對未知數(shù)據(jù)進行分類和預(yù)測。因為機器學(xué)習算法中涉及大量的統(tǒng)計學(xué)理論,所以機器學(xué)習與推斷統(tǒng)計學(xué)的聯(lián)系尤為密切,也被稱為統(tǒng)計學(xué)習理論。機器學(xué)習算法的基本作用就是通過對真實世界中的事件進行分類、預(yù)測,并做出決策。在算法設(shè)計方面,機器學(xué)習理論關(guān)注可以實現(xiàn)的、行之有效的學(xué)習算法。1.2.1機器學(xué)習的概念機器學(xué)習有很多方法與人類智能沒有關(guān)系,如統(tǒng)計學(xué)習。統(tǒng)計學(xué)習是基于數(shù)學(xué)、統(tǒng)計學(xué)發(fā)展而來的一種機器學(xué)習方法。其目的在于采用經(jīng)典統(tǒng)計學(xué)大量久經(jīng)考驗的技術(shù)和操作方法,如貝葉斯網(wǎng)絡(luò),利用之前的知識概念等實現(xiàn)機器智能,這種方法在本質(zhì)上是一種基于統(tǒng)計學(xué)的計算方法。在大數(shù)據(jù)時代,大數(shù)據(jù)相當于“礦山”,想得到數(shù)據(jù)中蘊涵的“礦藏”,還需要有效的數(shù)據(jù)分析技術(shù),機器學(xué)習就是這樣的技術(shù)。1.2.2機器學(xué)習如何實現(xiàn)機器智能人類的學(xué)習能力是與生俱來的,隨著年齡增長和受教育程度的提高而不斷增長。那么機器如何獲得學(xué)習能力呢?機器能像人一樣具備學(xué)習能力嗎?如果能的話,那么機器如何做到呢?機器具備了學(xué)習能力,是否就具有了智能或類人的智能?或者達到人類的智能水平?或者產(chǎn)生完全不同于人類的智能?這些問題都取決于機器具有何種學(xué)習能力。從實現(xiàn)機器智能的角度看,機器學(xué)習是一種試圖使機器具備像人一樣的學(xué)習能力,從而實現(xiàn)機器智能的方式。1.2.2機器學(xué)習如何實現(xiàn)機器智能機器要實現(xiàn)智能,必須能主動獲取和處理知識。主動獲取知識是機器智能的瓶頸問題。機器學(xué)習的任務(wù)就是弄清人類的學(xué)習機理,進而將有關(guān)原理用于建立機器學(xué)習方法。理想、目標是讓機器能夠通過學(xué)習書本、與人談話、觀察環(huán)境等自然方式獲取知識。如果這一目標得以實現(xiàn),機器就可以擁有真正的類人智能甚至超級智能。人類的學(xué)習能力遠非其他動物所及。人具備學(xué)習識別事物和對對象進行分類的能力,還會抽象、概括、歸納、舉一反三,能通過學(xué)習發(fā)現(xiàn)關(guān)系、規(guī)律、模式等。機器要具備類人的智能,也必須有類似的學(xué)習能力。1.2.2機器學(xué)習如何實現(xiàn)機器智能因此,機器學(xué)習的目的就是專門研究機器(主要是計算機)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習行為,以獲取新的知識或技能,重新組織己有的知識結(jié)構(gòu),使之可以不斷改善自身的性能,從而實現(xiàn)機器智能。機器學(xué)習是使計算機等機器具有智能的重要途徑之一。機器學(xué)習的

發(fā)展歷程03我們知道,在人工智能的歷史中20世紀70年代(在圖1.5中表示為1970s的形式,余同),人工智能研究進入了“知識時期”。在此時期,大量“專家系統(tǒng)”問世,在很多應(yīng)用領(lǐng)域取得了大量成果。但后來人們逐漸發(fā)現(xiàn),把知識總結(jié)出來再教給計算機相當困難,于是一些學(xué)者希望機器從數(shù)據(jù)中自動學(xué)習知識,人工智能進入“機器學(xué)習時期“?!皺C器學(xué)習時期”也分為三個階段,20世紀80年代,連接主義較為流行,其代表方法有感知機(Perceptron)和神經(jīng)網(wǎng)絡(luò)(NeuralNetwork)。人工智能的發(fā)展歷程如圖1.5所示。20世紀90年代,以支持向量機為代表的統(tǒng)計學(xué)習方法及集成學(xué)習、稀疏學(xué)習統(tǒng)計學(xué)習方法等開始占據(jù)主流地位。進入21世紀,2006年,多倫多大學(xué)教授辛頓在前向神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上提出了基于深度神經(jīng)網(wǎng)絡(luò)的深度學(xué)習。機器學(xué)習是經(jīng)歷史上各學(xué)派既相互競爭又相互融合發(fā)展而得到的結(jié)果。與人工智能的各學(xué)派類似,機器學(xué)習也發(fā)展出很多學(xué)派。符號學(xué)派人工智能主要的符號學(xué)派也開發(fā)了許多人工智能技術(shù),符號學(xué)派使用基于規(guī)則的符號系統(tǒng)進行推理,其本質(zhì)是一種基于推理的學(xué)習方法。符號學(xué)派大部分都圍繞著這種方法。20世紀80年代開發(fā)的一種符號推理系統(tǒng)試圖用邏輯規(guī)則將人類對這個世界的理解編碼。這種方法主要的缺陷在于其脆弱性,因為面對復(fù)雜多變的情況,僵化的知識庫一般不適用,但現(xiàn)實是模糊和不確定的。符號學(xué)派發(fā)展出了基于案例的學(xué)習和決策樹分類器等機器學(xué)習方法。貝葉斯學(xué)派使用概率規(guī)則及其依賴關(guān)系進行推理的一派。概率圖模型是這一派通用的方法,其主要計算機制是一種用于抽樣分布(稱為蒙特卡洛)的方法。這種方法與符號學(xué)派的方法的相似之處在于,可以以某種方式得到對結(jié)果的解釋。這種方法的另一個優(yōu)點是存在可以在結(jié)果中表示的對不確定性的度量。該學(xué)派采用的主要方法包括樸素貝葉斯和馬爾科夫鏈等。聯(lián)結(jié)學(xué)派從使機器能夠?qū)W習的角度看,聯(lián)結(jié)主義所發(fā)展出的人工神經(jīng)網(wǎng)絡(luò)一直是一種重要的機器學(xué)習方法,只不過,在機器學(xué)習誕生之前,人工神經(jīng)網(wǎng)絡(luò)并沒有在這方面發(fā)揮出應(yīng)有的價值。在機器學(xué)習誕生之后,人工神經(jīng)網(wǎng)絡(luò)在機器學(xué)習中的作用越來越大,從早期的感知器到現(xiàn)在的深度學(xué)習,基于人工神經(jīng)網(wǎng)絡(luò)的機器學(xué)習方法事實上己成為該領(lǐng)域的核心方法。進化學(xué)派該法是受到達爾文進化論啟發(fā)的機器學(xué)習方法。該學(xué)派的主要思想是將進化過程看作一種學(xué)習過程。通過計算機模擬生物的進化過程,使機器通過逐步進化形成學(xué)習能力,進而產(chǎn)生智能。20世紀60年代至20世紀70年代,進化學(xué)派從基于細胞自動機的生命游戲發(fā)展到復(fù)雜自適應(yīng)系統(tǒng)。進化學(xué)派發(fā)展出的遺傳算法起源于模擬生物繁衍的變異和達爾文的自然選擇,把概念的各種變體當作物種的個體,根據(jù)客觀功能測試概念的誘發(fā)變化和重組合并,決定哪種情況應(yīng)在基因組合中予以保留。自然計算領(lǐng)域的遺傳算法早期是作為一種機器學(xué)習方法使用的,后來演變?yōu)橹挥糜谇蠼鈨?yōu)化問題的算法。類推學(xué)派這一學(xué)派更多地關(guān)注心理學(xué)和數(shù)學(xué)最優(yōu)化,通過外推來進行相似性判斷。類推學(xué)派遵循“最近鄰”原理進行研究,采用的主要方法是支持向量機。20世紀末至今,聯(lián)結(jié)學(xué)派掀起熱潮,人工神經(jīng)科學(xué)和概率論的方法得到了廣泛應(yīng)用。人工神經(jīng)網(wǎng)絡(luò)可以更精準地識別圖像、語音,做好機器翻譯乃至情感分析等任務(wù)。同時,由于神經(jīng)網(wǎng)絡(luò)需要大量計算,基礎(chǔ)架構(gòu)也從20世紀80年代的服務(wù)器變?yōu)榇笠?guī)模數(shù)據(jù)中心或云。您的內(nèi)容打在這里,或者通過復(fù)制您的文本后,在此框中選擇粘貼20世紀80年代流行符號學(xué)派,其主導(dǎo)方法是知識工程。從20世紀90年代開始,貝葉斯學(xué)派發(fā)展了起來,概率論成為當時的主流思想,也就是統(tǒng)計學(xué)習。您的內(nèi)容打在這里,或者通過復(fù)制您的文本后,在此框中選擇粘貼0102030420世紀80年代流行符號學(xué)派,其主導(dǎo)方法是知識工程。從20世紀90年代開始,貝葉斯學(xué)派發(fā)展了起來,概率論成為當時的主流思想,也就是統(tǒng)計學(xué)習。20世紀末至今,聯(lián)結(jié)學(xué)派掀起熱潮,人工神經(jīng)科學(xué)和概率論的方法得到了廣泛應(yīng)用。人工神經(jīng)網(wǎng)絡(luò)可以更精準地識別圖像、語音,做好機器翻譯乃至情感分析等任務(wù)。同時,由于神經(jīng)網(wǎng)絡(luò)需要大量計算,基礎(chǔ)架構(gòu)也從20世紀80年代的服務(wù)器變?yōu)榇笠?guī)模數(shù)據(jù)中心或云。如今,各學(xué)派開始相互借鑒融合,21世紀的前十年,最顯著的就是聯(lián)結(jié)學(xué)派和符號學(xué)派的結(jié)合,由此產(chǎn)生了記記神經(jīng)網(wǎng)絡(luò)及能夠根據(jù)知識進行簡單推理的智能體。今后,聯(lián)結(jié)學(xué)派、符號學(xué)派和貝葉斯學(xué)派也將融合到一起,實際上已經(jīng)出現(xiàn)了這樣的趨勢,DeepMind開發(fā)了貝葉斯與深度神經(jīng)網(wǎng)絡(luò)結(jié)合的深度學(xué)習方法,主要的局限是感知任務(wù)由神經(jīng)網(wǎng)絡(luò)完成,但涉及推理和動作時還是需要人為編寫規(guī)則。深度學(xué)習在AlphaGo、無人駕駛汽車、人工智能助理、語音識別、自然語言理解等方面取得了很大的進展,對工業(yè)界產(chǎn)生了巨大影響?,F(xiàn)在,隨著數(shù)據(jù)量和計算能力的不斷提開,以深度學(xué)習為基礎(chǔ)的諸多人工智能應(yīng)用逐漸成熟。在過去的20年里,人類收集、存儲、傳輸、處理數(shù)據(jù)的能力取得了飛速提升,亟須能有效地對數(shù)據(jù)進行分析和利用的計算機算法,而機器學(xué)習恰恰順應(yīng)了大時代的這個迫切需求。人工智能的發(fā)展從早期的邏輯推理到中期的專家系統(tǒng),這些科研進步確實使機器越來越智能,但距離人類智能還有一大段距離。機器學(xué)習誕生以后,人工智能界終于找對了方向?;跈C器學(xué)習的圖像識別和語音識別在某些垂直領(lǐng)域達到了可以跟人相媲美的程度,機器學(xué)習使人類第一次如此接近強人工智能的夢想。機器學(xué)習的類型04機器學(xué)習是一個龐大的家族體系,涉及眾多算法、任務(wù)和學(xué)習理論。從方法的角度分,機器學(xué)習可以分為線性模型和非線性模型,線性模型較為簡單,但其作用不可忽視,線性模型是非線性模型的基礎(chǔ),很多非線性模型都是在線性模型的基礎(chǔ)上變換而來的。非線性模型又可以分為傳統(tǒng)機器學(xué)習模型和現(xiàn)代機器學(xué)習模型。1.按方法劃分2.按學(xué)習理論劃分按照不同的學(xué)習理論劃分,機器學(xué)習模型可以分為監(jiān)督學(xué)習、半監(jiān)督學(xué)習、無監(jiān)督學(xué)習、遷移學(xué)習和強化學(xué)習。監(jiān)督或無監(jiān)督的區(qū)別在于是否需要對訓(xùn)練學(xué)習模型所需要的樣本進行人工標注或打標簽,就是是否需要人工事先將數(shù)據(jù)分成不同的類別。因為機器不會像人一樣自動對輸入的數(shù)據(jù)進行分類或?qū)Σ煌哪J竭M行識別,而人類大腦對模式的識別能力一部分是與生俱來的,一部分也是通過后天學(xué)習訓(xùn)練而獲得的。機器不具備這樣的能力,因此必須對傳輸給它的數(shù)據(jù)進行標注,將這種打好標簽的數(shù)據(jù)輸入機器學(xué)習算法或系統(tǒng),才能使系統(tǒng)具備一定的學(xué)習能力,完成分類、預(yù)測等任務(wù),使其表現(xiàn)出一定的決策能力。因此,對機器學(xué)習來說,當訓(xùn)練樣本帶有標簽時,是監(jiān)督學(xué)習:當訓(xùn)練樣本部分有標簽、部分無標簽時,是半監(jiān)督學(xué)習;當訓(xùn)練樣本全部無標簽時,是無監(jiān)督學(xué)習。監(jiān)督學(xué)習也稱為有教師學(xué)習,即將機器學(xué)習過程比作人類教師教育學(xué)生的過程。人類事先對數(shù)據(jù)進行標注,再交給計算機處理,就相當于教師教授學(xué)生。對于機器來說,標注好的數(shù)據(jù)就是訓(xùn)練數(shù)據(jù)集,機器學(xué)習就是從給定的訓(xùn)練數(shù)據(jù)集中學(xué)習得到一個函數(shù),當新的數(shù)據(jù),也就是類別未知的數(shù)據(jù)被輸入機器時,機器就可以根據(jù)這個函數(shù)預(yù)測結(jié)果,這個對新數(shù)據(jù)處理分析的過程也是一個測試過程。要求監(jiān)督學(xué)習的訓(xùn)練數(shù)據(jù)集包括輸入和輸出,也可以說是特征和目標。如圖1.6所示,這是一個監(jiān)督學(xué)習或有教師學(xué)習系統(tǒng)。監(jiān)督學(xué)習的一般形式是,給定一個輸入向量x,學(xué)習預(yù)測一個輸出y,實際輸出為t。根據(jù)輸出的形式,監(jiān)督學(xué)習又可以細分為兩個子類別。進行監(jiān)督學(xué)習的進行監(jiān)督學(xué)習的典型過程通常是,首先選擇一類模型y=f(x;m),它接受輸入向量x使用相關(guān)參數(shù)W,得到最后的輸出y。這里也可以將模型看作一種映射,是輸入到輸出經(jīng)W作用的映射。因此,學(xué)習的核心就是調(diào)整這些參數(shù)W,使得模型輸出y與期望輸出t之間的差距盡可能小。無監(jiān)督學(xué)習與監(jiān)督學(xué)習相比,最大的區(qū)別就是訓(xùn)練數(shù)據(jù)集沒有人為標注。常見的無監(jiān)督學(xué)習算法稱為聚類。半監(jiān)督學(xué)習介于監(jiān)督學(xué)習與無監(jiān)督學(xué)習之間,是結(jié)合(少量的)標注數(shù)據(jù)和(大量的)未標注數(shù)據(jù)來進行學(xué)習的。3.接任務(wù)劃分以任務(wù)為基礎(chǔ)的機器學(xué)習類型及方法如圖1.7所示,其中包括監(jiān)督學(xué)習、無監(jiān)督學(xué)習、遷移學(xué)習、強化學(xué)習等。機器學(xué)習的

主要方法05人類的學(xué)習過程與推理過程是緊密相連的,與人類的學(xué)習類似,機器學(xué)習主要有機械學(xué)習、示例學(xué)習、演繹學(xué)習、類比學(xué)習、解釋學(xué)習、歸納學(xué)習、聯(lián)結(jié)學(xué)習、統(tǒng)計學(xué)習、集成學(xué)習、強化學(xué)習、分析學(xué)習、發(fā)現(xiàn)學(xué)習、遺傳學(xué)習等方式,其中,多數(shù)學(xué)習方法屬于監(jiān)督學(xué)習。機械學(xué)習是最簡單的基本學(xué)習過程。機械學(xué)習是指機器學(xué)習過程無須任何推理或其他的知識轉(zhuǎn)換,直接吸取環(huán)境所提供的信息。早期的跳棋程序等機械學(xué)習系統(tǒng)主要考慮的是如何索引存儲的知識并加以利用。系統(tǒng)的學(xué)習方法是指直接通過事先編好、構(gòu)造好的程序來學(xué)習,機器或計算機不做任何工作,或者通過直接接收既定的事實和數(shù)據(jù)進行學(xué)習,對輸入信息不進行任何推理??砂褜W(xué)習系統(tǒng)的執(zhí)行部分抽象成某個函數(shù),該函數(shù)得到自變量輸入值(X1,X2,···,Xn)之后,計算并輸出函數(shù)(Y1,Y2,···Yn)。機械學(xué)習在存儲器中簡單地記憶存儲對[(X1,X2···Xn),(Y1,Y2···Yn)],當需要f(X1,X2···)時,執(zhí)行部分就從存儲器中把(Y1,Y2···Yn)簡單地檢索出來而不是重新計算它。這種簡單的學(xué)習模型如下1.機械學(xué)習示例學(xué)習就是機器從環(huán)境(信息源,如教科書等)中獲取信息,把知識轉(zhuǎn)換成內(nèi)部可使用的表示形式,并將新知識和原有知識有機地結(jié)合為一體。一般要求機器學(xué)習方法有一定程度的推理能力,但環(huán)境仍要做大量的工作。人類以某種形式提出和組織知識,以使機器擁有的知識可以不斷增加。這種學(xué)習方法和人類社會的學(xué)校教學(xué)方式相似,學(xué)習的任務(wù)就是建立一個系統(tǒng),使它能接受教導(dǎo)和建議,并有效地存儲和應(yīng)用學(xué)到的知識。不少早期的專家系統(tǒng)在建立知識庫時使用這種方法實現(xiàn)知識獲取。2.示例學(xué)習3.演繹學(xué)習演繹學(xué)習主要采用演繹推理形式。推理是從公理出發(fā),經(jīng)過邏輯變換推導(dǎo)出結(jié)論的過程。這種學(xué)習方法包含宏操作學(xué)習、知識編輯和組塊技術(shù)。演繹推理的逆過程是歸納推理。4.類比學(xué)習類比學(xué)習是通過目標對象與源對象的相似性,運用源對象的求解方法來解決目標對象的問題。利用兩個不同領(lǐng)域(源域、目標域)的知識相似性,可以通過類比,從源域的知識(包括相似的特征和其他性質(zhì))推導(dǎo)出目標域的相應(yīng)知識,從而實現(xiàn)學(xué)習。5.解釋學(xué)習這種機器學(xué)習方式是機器根據(jù)人類提供的目標概念或該概念的一個例子、領(lǐng)域理論及可操作準則,首先構(gòu)造一個解釋來說明為什么該例子滿足目標概念,然后將解釋推廣為目標概念的一個滿足可操作準則的充分條件。6.歸納學(xué)習歸納學(xué)習是根據(jù)人類或環(huán)境提供的某概念的一些實例或反例,讓機器學(xué)習系統(tǒng)通過歸納推理得出該概念的一般描述。歸納學(xué)習是基本的、發(fā)展較為成熟的學(xué)習方法,在人工智能領(lǐng)域中已經(jīng)得到廣泛的研究和應(yīng)用。聯(lián)結(jié)學(xué)習聯(lián)結(jié)學(xué)習就是通過對人工神經(jīng)網(wǎng)絡(luò)進行典型實例訓(xùn)練的學(xué)習方式,使其能夠識別輸入模式的不同類別。由人主神經(jīng)網(wǎng)絡(luò)發(fā)展出的深度神經(jīng)網(wǎng)絡(luò)形成了所謂的深度學(xué)習技術(shù)。07統(tǒng)計學(xué)習統(tǒng)計學(xué)習是研究利用經(jīng)驗數(shù)據(jù)通過統(tǒng)計分析進行機器學(xué)習的方法,是機器學(xué)習比較重要的方法。統(tǒng)計學(xué)習的目的在于使期望風險最小化。08集成學(xué)習集成學(xué)習是結(jié)合多個分類方法組成的輸出(對一些不同的輸入有不同的分類結(jié)果),形成一個比任意單一分類方法的泛化能力都好的綜合分類器。09強化學(xué)習通過觀察來學(xué)習做成怎樣的動作。每個動作都會對環(huán)境有所影響,學(xué)習對象根據(jù)觀察到的周圍環(huán)境的反饋來做出判斷。強化學(xué)習和監(jiān)督學(xué)習最大的不同是,每次的決定沒有對與錯,而是希望獲得最多的累計獎勵。強化學(xué)習過程如圖1.9所示。強化學(xué)習的輸出是一個動作或一串動作序列。這里也存在監(jiān)督性的信號,不過這只是不定時出現(xiàn)的一些獎勵(或懲罰)。因此,強化學(xué)習的目標是選擇最合適的動作來最大化將來可能獲得的獎勵的期望和。通常情況下,對每個獎勵會設(shè)置一個跟時間相關(guān)的衰減因子,這樣,越后面的獎勵,加權(quán)后的重要性越小,從而使得模型不用考慮太遠的將來。10.強化學(xué)習機器學(xué)習的

主要算法06決策樹:一般都是自上而下生成的。每個決策或事件(自然狀態(tài))都可能引出兩個或多個事件,導(dǎo)致不同的結(jié)果,把這種決策分支畫成圖形就像一棵樹的枝干,因此稱為決策樹。決策樹算法很擅長處理非數(shù)值型數(shù)據(jù),這與神經(jīng)網(wǎng)絡(luò)只能處理數(shù)值型數(shù)據(jù)相比,免去了很多數(shù)據(jù)預(yù)處理工作。高斯過程:一種良好的貝葉斯分類方法和回歸過程,也可應(yīng)用于半監(jiān)督聚類方面。線性判別分析:即判別分析,是統(tǒng)計學(xué)上的一種分析方法,用于在已知的分類下遇到新的樣本時,選定一個判別標準,以判定將新樣本放置于哪個類別之中。kNN算法:如果一個樣本在特征空間的k個最相似(在特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個類別,那么該樣本也屬于這個類別。在kNN算法中,所選擇的鄰近樣本都是己經(jīng)正確分類的對象。該方法在定類決策上只依據(jù)一個或幾個樣本的類別來決定待分類樣本所屬的類別。kNN算法雖然從原理上依賴極限定理,但在進行類別決策時,只與極少量的鄰近樣本有關(guān)。支持向量機的思想可以概括為兩點:①它是針對線性可分的情況進行分析的,對于線性不可分的情況,通過使用非線性映射算法將低維輸入空間線性不可分的樣本轉(zhuǎn)化為高維特征空間的樣本,使其線性可分,從而使得高維特征空間采用線性算法對樣本的非線性特征進行線性分析成為可能;②它基于結(jié)構(gòu)風險最小化理論,在特征空間中建構(gòu)最優(yōu)分割超平面,使學(xué)習器得到全局最優(yōu)化,并且在整個樣本空間的期望風險以一定的概率滿足一定的上界。具體內(nèi)容見第2章。最大期望(EM)算法:Dempster、Laind和Rubin于1977年提出的求參數(shù)極大似然估計(MaximumLikelihoodEstimate,MLE)的一種方法,它可以從非完整數(shù)據(jù)集中對參數(shù)進行MLE,可以廣泛地應(yīng)用于處理缺損數(shù)據(jù)、截尾數(shù)據(jù)、帶有噪聲的所謂的不完全數(shù)據(jù)。貝葉斯網(wǎng)絡(luò):統(tǒng)計學(xué)分類方法,它是一類利用概率統(tǒng)計知識進行分類的算法。馬爾可夫隨機域:馬爾可夫性質(zhì)是指一個隨機變量序列按時間先后關(guān)系依次排開時,第N+1時刻的分布特性與N時刻以前的隨機變量的取值無關(guān)。當給每個位置按照某種分布方法隨機賦予相空間的一個值之后,其全體就叫作隨機域。流形學(xué)習:假設(shè)數(shù)據(jù)是均勻采樣子一個高維歐氏空間中的低維流形,流形學(xué)習就是從高維采樣數(shù)據(jù)中恢復(fù)低維流形結(jié)構(gòu),即找到高維空間中的低維流形,并求出相應(yīng)的嵌入映射,以實現(xiàn)維數(shù)約簡或數(shù)據(jù)可視化。它從觀測到的現(xiàn)象中尋找事物的本質(zhì),找到產(chǎn)生數(shù)據(jù)的內(nèi)在規(guī)律。多實例學(xué)習:半監(jiān)督學(xué)習(如藥物設(shè)計方面的應(yīng)用)。主成分分析(PCA):一種掌握事物主要矛盾的統(tǒng)計分析方法,它可以從多元事物中解析出主要影響因素,揭示事物的本質(zhì),簡化復(fù)雜的問題。計算主成分的目的是將高維數(shù)據(jù)映射到較低維空間。獨立成分分析(ICA):一種利用統(tǒng)計原理進行分析的方法,它是一種線性變換。這種變換把數(shù)據(jù)或信號分離成統(tǒng)計獨立的非高斯信號源的線性組合。獨立成分分析是盲信號分離(BlindSourceSeparation,BSS)的一種特例。聚類分析:將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程,它是一種重要的人類行為。聚類分析的目標就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。集成學(xué)習(EnsembleLeaming):當前機器學(xué)習的熱點研究方向之一。它的根本思路是對同一問題使用一系列學(xué)習器進行學(xué)習,并使用一定的策略將各個不同的學(xué)習結(jié)果整合,從而獲得比單個學(xué)習器更好的學(xué)習效果。和傳統(tǒng)的單個學(xué)習器的構(gòu)造目的不同,集成學(xué)習并非力求得到單一的最優(yōu)分類器,而是通過一組由多個假設(shè)組合而成的集成得到更優(yōu)的假設(shè)。1.6.2新型機器學(xué)習算法人工神經(jīng)網(wǎng)絡(luò):一種應(yīng)用類似大腦神經(jīng)突觸連接的結(jié)構(gòu)進行信息處理的數(shù)學(xué)模型。神經(jīng)網(wǎng)絡(luò)是一種運算模型,由大量的神經(jīng)元及其之間的相互連接構(gòu)成。每個神經(jīng)元代表一種特定的輸出函數(shù),一般稱之為激勵函數(shù)。每兩個神經(jīng)元之間的連接都代表一個對于通過該連接的信號的加權(quán)值,稱之為權(quán)重,這相當于人工神經(jīng)網(wǎng)絡(luò)的記憶。網(wǎng)絡(luò)的輸出則因網(wǎng)絡(luò)的連接方式、權(quán)重值和激勵函數(shù)的不同而異。覆蓋算法:在FP算法的基礎(chǔ)上發(fā)展起來的構(gòu)造性算法。1995年,張鈴教授提出的多層反饋神經(jīng)網(wǎng)絡(luò)的FP算法和綜合算法就是最初的構(gòu)造性學(xué)習方法,主要針對BP等算法中網(wǎng)絡(luò)性能差的缺陷,構(gòu)造吸引中心具有最大吸引域的神經(jīng)網(wǎng)絡(luò)構(gòu)造性算法,包括全連接網(wǎng)絡(luò)的FP算法和多層反饋網(wǎng)絡(luò)的FP算法。1.深度學(xué)習算法1.6.2新型機器學(xué)習算法生成對抗網(wǎng)絡(luò):生成對抗網(wǎng)絡(luò)是一種深度學(xué)習模型,是近年來復(fù)雜分布上無監(jiān)督學(xué)習最具前景的方法之一。模型通過框架中的生成模型和判別模型的相互博弈來學(xué)習并產(chǎn)生近似真實情況的輸出。在原始生成對抗網(wǎng)絡(luò)理論中,并不要求生成器和判別器都是神經(jīng)網(wǎng)絡(luò),只要是能擬合相應(yīng)生成和判別的函數(shù)即可。但在使用中,一般使用深度神經(jīng)網(wǎng)絡(luò)作為生成器和判別器。一個優(yōu)秀的生成對抗網(wǎng)絡(luò)應(yīng)用需要有良好的訓(xùn)練方法,否則可能由神經(jīng)網(wǎng)絡(luò)模型的自由性導(dǎo)致輸出不理想。循環(huán)神經(jīng)網(wǎng)絡(luò):循環(huán)神經(jīng)網(wǎng)絡(luò)是一類以序列數(shù)據(jù)為輸入,在序列的演進方向進行遞歸且所有節(jié)點(循環(huán)單元)按鏈式連接的遞歸神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)是深度學(xué)習算法之一,其中,雙向循環(huán)神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)是常見的循環(huán)神經(jīng)網(wǎng)絡(luò)。1.深度學(xué)習算法1.6.2新型機器學(xué)習算法強化學(xué)習算法主要依賴一個回報函數(shù)(RewardFunction),若智能Agent在確定一步后,獲得了較好的結(jié)果,則給Agent一些回報(如回報函數(shù)的結(jié)果為正):若得到較差的結(jié)果,則回報函數(shù)的結(jié)果為負。學(xué)習算法:Q-學(xué)習算法是強化學(xué)習算法中基于值的策略算法,是一種典型的與模型無關(guān)的算法。Q表的更新不同于選取動作時所遵循的策略。換句話說,在更新Q表的時候,計算了下一個狀態(tài)的最大價值,但是在取那個最大價值的時候所對應(yīng)的動作不依賴當前策略。2.強化學(xué)習算法1.6.2新型機器學(xué)習算法2.強化學(xué)習算法蒙特卡洛算法:以概率統(tǒng)計理論為基礎(chǔ)的一種方法。由于蒙特卡洛算法能夠比較逼真地描述事物的特點及物理實驗過程,可以解決一些數(shù)值方法難以解決的問題。當所求問題的解是某個事物的概率,或是某個隨機變量的數(shù)學(xué)期望,或是與概率、數(shù)學(xué)期望有關(guān)的量時,可以通過某種實驗的方法得出該事件發(fā)生的頻率,或該隨機變量若干個具體觀察值的算術(shù)平均值,通過它得到問題的解。動態(tài)規(guī)劃算法:動態(tài)規(guī)劃算法是強化學(xué)習算法中的五種常見算法之一,通常用于求解具有某種最優(yōu)性質(zhì)的問題。動態(tài)規(guī)劃算法與分治法類似,其基本思想也是將待求解問題分解成若干個子問題。動態(tài)規(guī)劃算法與其他算法相比,大大減少了計算量,豐富了計算結(jié)果,不僅求出了當前狀態(tài)到目標狀態(tài)的最優(yōu)值,還求出了中間狀態(tài)的最優(yōu)值。這對于很多實際問題來說是很有用的。3.遷移學(xué)習算法遷移學(xué)習算法(TrAdaBoost算法):一種從舊數(shù)據(jù)中提取實例的方法,即將一部分能用的舊數(shù)據(jù)和標簽,結(jié)合新數(shù)據(jù)和標簽(可能是少量的),構(gòu)建出比單純使用新數(shù)據(jù)和標簽訓(xùn)練更精確的模型。層次貝葉斯算法:一種具有結(jié)構(gòu)化層次的統(tǒng)計模型,它可以用來為復(fù)雜的統(tǒng)計問題建立層次模型,從而避免因參數(shù)過多而導(dǎo)致的過擬合問題。在實際情況中,簡單的非層次模型可能并不適合層次數(shù)據(jù):在參數(shù)很少的情況下,它們并不能準確適配大規(guī)模數(shù)據(jù)集,然而,過多的參數(shù)可能會導(dǎo)致過擬合的問題,相反,層次模型有足夠的參數(shù)來擬合數(shù)據(jù),同時使用總體分布將參數(shù)的依賴結(jié)構(gòu)化,從而避免過擬合問題。1.6.2新型機器學(xué)習算法聯(lián)邦平均算法:聯(lián)邦平均算法是一種分布式算法,允許多個用戶同時訓(xùn)練一個機器學(xué)習模型。在訓(xùn)練過程中并不需要上傳任何私有數(shù)據(jù)到服務(wù)器。本地用戶負責訓(xùn)練本地數(shù)據(jù),得到本地模型,中心服務(wù)器負責加權(quán)聚合本地模型,從而得到全局模型,經(jīng)過多輪迭代后,最終得到一個趨近于集中式機器學(xué)習結(jié)果的模型,有效地減少了傳統(tǒng)機器學(xué)習由源數(shù)據(jù)聚合帶來的隱私風險。安全聯(lián)邦線性回歸算法:安全聯(lián)邦線性回歸算法利用同態(tài)加密的方法,在聯(lián)邦國歸模型的訓(xùn)練過程中保護每一個參與方的本地數(shù)據(jù),并通過回歸算法對各方的本地數(shù)據(jù)進行分析和共享。安全聯(lián)邦提升樹算法:安全聯(lián)邦提升樹算法是一種基于決策樹算法的聯(lián)邦學(xué)習算法,它以決策樹為基礎(chǔ)架構(gòu),中心服務(wù)器通過連接多方本地數(shù)據(jù),對本地數(shù)據(jù)進行共享分發(fā),而本地用戶只需要上傳數(shù)據(jù)即可。4.聯(lián)邦學(xué)習算法5.因果學(xué)習算法結(jié)構(gòu)因果模型:結(jié)構(gòu)因果模型是聯(lián)系原因與結(jié)果的一種模型,它結(jié)合了結(jié)構(gòu)方程、虛擬事實模型、概率圖模型(主要是貝葉斯網(wǎng)絡(luò)),并將其應(yīng)用于因果分析。通常,各種常用類型的因果模型都可以看作結(jié)構(gòu)因果模型的子類。多變量結(jié)構(gòu)識別算法:多變量結(jié)構(gòu)識別算法是一種對多變量結(jié)構(gòu)進行識別推理的算法。它包括基于獨立的方法和基于分數(shù)的方法,通過對多變量的關(guān)系識別來達到推理其因果關(guān)系的目的。機器學(xué)習的典型應(yīng)用與發(fā)展趨勢071.7.1機器學(xué)習的典型應(yīng)用機器學(xué)習現(xiàn)己廣泛應(yīng)用于數(shù)據(jù)挖掘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫(yī)學(xué)診斷、檢測信用卡欺詐、證券市場分析、DNA基因序列測序、語音識別、戰(zhàn)略游戲和機器人等領(lǐng)域。機器學(xué)習最成功的應(yīng)用領(lǐng)域是計算機視覺、模式識別、數(shù)據(jù)挖掘等。各類型機器學(xué)習與人工智能的幾個重要分支或研究領(lǐng)域都有著緊密聯(lián)系,如圖1.10所示。1.7.1機器學(xué)習的典型應(yīng)用1)模式識別模式識別是從工業(yè)界發(fā)展起來的,而機器學(xué)習來自計算機學(xué)科,兩者都可以視為人工智能的重要分支,模式識別的主要方法也是機器學(xué)習的主要方法。2)數(shù)據(jù)挖掘數(shù)據(jù)挖掘是指利用機器學(xué)習等方法在數(shù)據(jù)中尋找規(guī)律和知識的一種技術(shù),因此可以認為數(shù)據(jù)挖掘=機器學(xué)習+數(shù)據(jù)庫。1.7.1機器學(xué)習的典型應(yīng)用3)統(tǒng)計學(xué)習統(tǒng)計學(xué)習是與機器學(xué)習高度重疊的學(xué)科。因為機器學(xué)習中的大多數(shù)方法都來自統(tǒng)計學(xué),甚至可以說,統(tǒng)計學(xué)的發(fā)展促進了機器學(xué)習的興盛。兩者的分別在于統(tǒng)計學(xué)重點關(guān)注的是統(tǒng)計模型的發(fā)展與優(yōu)化,側(cè)重于數(shù)學(xué):機器學(xué)習更關(guān)注解決問題,側(cè)重于實踐。4)計算機視覺圖像處理技術(shù)用于將圖像處理為適合進入機器學(xué)習模型的輸入,機器學(xué)習則負責從圖像中識別出相關(guān)模式。對手寫字符、車牌、人臉等的識別都是計算機視覺和模式識別的應(yīng)用。因此,計算機視覺的主要基礎(chǔ)是圖像處理和機器學(xué)習。1.7.1機器學(xué)習的典型應(yīng)用5)自然語言處理自然語言處理技術(shù)主要是讓機器理解人類的語言的一門技術(shù)。在自然語言處理技術(shù)中,大量使用了與編譯原理相關(guān)的技術(shù),如詞法分析、語法分析等。除此之外,在理解這個層面,則使用了語義理解、機器學(xué)習等技術(shù),因此自然語言處理的基礎(chǔ)是文本處理和機器學(xué)習。6)語音識別語音識別是利用自然語言處理、機器學(xué)習等相關(guān)技術(shù)對人類語音進行識別的技術(shù),語音識別的主要基礎(chǔ)是自然語言處理和機器學(xué)習。1.7.2機器學(xué)習的發(fā)展趨勢人工智能的另一個發(fā)展方向是從少量標記數(shù)據(jù)中理解世界。目前,人工智能,特別是深度學(xué)習,需要大量的標記數(shù)據(jù)才能訓(xùn)練,而且數(shù)據(jù)越多,效果越好。但是,人類并不需要大量的示教就能理解世界,我們在沒有大量標記數(shù)據(jù)的情況下便能形成良好的認識。目前的學(xué)習系統(tǒng)不具備這方面的能力,無法通過少量的樣本得出一種簡單的模式。這些系統(tǒng)目前都在使用監(jiān)督學(xué)習的方式,在這個過程中機器是由人類標記的輸入訓(xùn)練的。未來幾年的挑戰(zhàn)是讓機器從原始的、未標記的數(shù)據(jù)(如視頻或文本)中學(xué)習。這就是所謂的無監(jiān)督學(xué)習。人工智能系統(tǒng)目前不具有“常識”。人和動物通過觀察世界,在其中動作,了解其物理機制。部分專家認為無監(jiān)督學(xué)習是通向具有常識的機器的關(guān)鍵。為此,必須重新定義無監(jiān)督學(xué)習的方法,如通過對抗學(xué)習重新定義目標函數(shù)。此外,近幾年來,大模型成了人工智能產(chǎn)學(xué)界刷屏率最高的詞匯。需要更大算力、更大數(shù)據(jù)集的大模型成了當前人工智能發(fā)展的一個重要方向。1.7.2機器學(xué)習的發(fā)展趨勢深度學(xué)習技術(shù)興起的近十幾年間,人工智能模型基本上是針對特定應(yīng)用場景需求進行訓(xùn)練的小模型。小模型用特定領(lǐng)域有標注的數(shù)據(jù)訓(xùn)練,通用性差,換到另外一個應(yīng)用場景中往往不適用,需要重新訓(xùn)練。另外,小模型的訓(xùn)練方式基本是“手工作坊式”,調(diào)參、調(diào)優(yōu)的手動工作太多,需要大量的人工智能工程專業(yè)人員來完成。同時,傳統(tǒng)模型訓(xùn)練需要大規(guī)模標注數(shù)據(jù),如果某些應(yīng)用場景的數(shù)據(jù)量少,訓(xùn)練出的模型精度就會不理想。1.7.2機器學(xué)習的發(fā)展趨勢小模型的這些問題導(dǎo)致當前人工智能研發(fā)的整體成本較高,效率偏低。由于人工智能人才短缺且成本昂貴,對于中小行業(yè)用戶來說,小模型的這些問題阻礙了行業(yè)用戶采用人工智能技術(shù)的腳步,成為人工智能普惠的障礙。而大模型可以解決上述問題,其泛化能力強,可以做到“舉一反三”,同一模型利用少量數(shù)據(jù)進行微調(diào)或不進行微調(diào)就能完成多個場景的任務(wù),中小企業(yè)可以直接調(diào)用,不需要招聘很多大工智能算法的專業(yè)人員就能進行應(yīng)用開發(fā),可以顯著降低中小企業(yè)的研發(fā)門檻,促進入工智能技術(shù)落地。1.7.2機器學(xué)習的發(fā)展趨勢2018年,OpenAI以Transformer為底層架構(gòu)提出了大規(guī)模預(yù)訓(xùn)練模型GPT-1,使人工智能大模型逐漸走進產(chǎn)學(xué)界的世界。同年,谷歌發(fā)布了大規(guī)模預(yù)訓(xùn)練模型BERT,由于在許多自然語言處理任務(wù)中表現(xiàn)出極強的能力,BERT迎來了眾多人工智能從業(yè)者的追捧。緊接著,OpenAI發(fā)布了GPT-2。GPT-2針對GPT-1的一些問題進行了改進,使得數(shù)據(jù)量足夠大,模型足夠復(fù)雜,從而超越了BERT。接著,2020年,OpenAI發(fā)布了GPT-3。這導(dǎo)致人工智能大模型的模型復(fù)雜度和模型處理任務(wù)的能力越來越強,也使得人們逐漸看到了邁向通用人工智能的曙光。以GPT-3為代表的超大規(guī)模預(yù)訓(xùn)練模型不僅以絕對的數(shù)據(jù)和算力優(yōu)勢取代了一些小模型算法,更重要的是,它展示了一條通向通用人工智能的可能的路徑。在此背景下,建設(shè)國內(nèi)的超大規(guī)模預(yù)訓(xùn)練模型和生態(tài)勢在必行。1.7.2機器學(xué)習的發(fā)展趨勢在國外進行人工智能大模型研究的同時,我國也逐漸將目光投向了人工智能大模型。2020年3月,北京智源人工智能研究院發(fā)布了首個以中文為核心的超大規(guī)模預(yù)訓(xùn)練模型——悟道1.0。悟道1.0通過研發(fā)超大規(guī)模信息智能模型和生命模型,推動了電子信息、生物醫(yī)藥等基礎(chǔ)科學(xué)科研范式變革,加速了科學(xué)研究進程。2020年6月,在第三屆北京智源大會中,北京智源人工智能研究院在會上發(fā)布了全球最大的超大規(guī)模智能模型悟道2.0。相較子悟道1.0,悟道2.0更加強大,并且向通用性更強的方向發(fā)展,可以根據(jù)文字生成高精度的圖片,根據(jù)圖像檢索文字,實現(xiàn)圖像和文字的互相檢索。目前,悟道2.0在問答、作詩、配文案、視頻、繪畫、菜譜等多項任務(wù)中正逼近圖靈測試。悟道2.0模型的參數(shù)規(guī)模達到1.75萬億,是GPT-3的10倍,打破了之前由GoogleSwitchTransformer預(yù)訓(xùn)練模型創(chuàng)造的1.6萬

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論