人工智能技術(shù)介紹完整版人工智能概述、圍棋課件_第1頁
人工智能技術(shù)介紹完整版人工智能概述、圍棋課件_第2頁
人工智能技術(shù)介紹完整版人工智能概述、圍棋課件_第3頁
人工智能技術(shù)介紹完整版人工智能概述、圍棋課件_第4頁
人工智能技術(shù)介紹完整版人工智能概述、圍棋課件_第5頁
已閱讀5頁,還剩106頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

人工智能技術(shù)介紹PPT人工智能技術(shù)概述第一節(jié)深度學(xué)習(xí)與智能圍棋第二節(jié)深度學(xué)習(xí)與國際象棋第三節(jié)人工智能3.0第四節(jié)目錄content人工智能的新革命第一節(jié)人工智能技術(shù)簡述深度學(xué)習(xí)算法知識圖譜人工智能將引領(lǐng)人類第四次工業(yè)革命–智能化時間18世紀(jì)末工業(yè)1.0創(chuàng)造了機器工廠的“蒸汽時代”20世紀(jì)初電力廣泛應(yīng)用蒸汽機信息物聯(lián)系統(tǒng)1970年代初今天工業(yè)2.0將人類帶入分工明確、大批量生產(chǎn)的流水線模式和“電氣時代”工業(yè)3.0應(yīng)用電子信息技術(shù),進(jìn)一步提高生產(chǎn)自動化水平自動化、信息化工業(yè)4.0開始應(yīng)用信息物理融合系統(tǒng)(CPS)復(fù)雜度悄悄來臨互聯(lián)網(wǎng)時代正在終結(jié)人工智能機器人交通工具(即無人機、無人駕駛等)VR(虛擬現(xiàn)實)AI將催生“無用階層”嗎?人工/腦力勞動:翻譯、記者...人工/體力勞動:保安、保姆...什么是人工智能(AI)?全面實施戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃,加快人工智能等技術(shù)的研發(fā)和轉(zhuǎn)化,做大做強產(chǎn)業(yè)集群把發(fā)展智能制造作為主攻方向,推進(jìn)國家智能制造示范區(qū)、制造業(yè)創(chuàng)新中心建設(shè)人工智能:國家戰(zhàn)略(2017年政府工作報告)人工智能(ArtificialIntelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器,該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能是對人的意識、思維的信息過程的模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過人的智能。什么是人工智能?人工智能有那些類型?弱人工智能,包含基礎(chǔ)的、特定場景下角色型的任務(wù),如Siri等聊天機器人和AlphaGo等下棋機器人;通用人工智能,包含人類水平的任務(wù),涉及機器的持續(xù)學(xué)習(xí);強人工智能,指比人類更聰明的機器;195619741980198719932006AI的誕生1956達(dá)特矛斯會議,“人工智能”正式誕生孕育期電子計算機機器翻譯與NLP圖靈測試計算機下棋早期神經(jīng)網(wǎng)絡(luò)搜索式推理聊天機器人樂觀思潮所有的AI程序都只是“玩具”運算能力計算復(fù)雜性常識與推理專家系統(tǒng)知識工程五代機神經(jīng)網(wǎng)絡(luò)重生未達(dá)預(yù)期削減投入摩爾定律統(tǒng)計機器學(xué)習(xí)AI廣泛應(yīng)用大數(shù)據(jù)計算能力應(yīng)用增多深度學(xué)習(xí)人工智能2016人工智能發(fā)展歷程人機交互主要運用到的技術(shù)包括機器人學(xué)和模式識別技術(shù),機器人可以模擬人的行為,而模式識別則能使用計算機模擬人類器官對外界的各種感知。知識和數(shù)據(jù)智能處理知識處理時通常使用專家技術(shù),它能運用特定領(lǐng)域中專家提供的專門知識和經(jīng)驗,通過智能推理求和,便可解決只有專家才能解決的問題。數(shù)據(jù)挖掘與分析面臨大數(shù)據(jù)深度挖掘與分析時,通常采用機器學(xué)習(xí),是基于人工神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)。可針對海量數(shù)據(jù)進(jìn)行分析計算,并創(chuàng)建相應(yīng)模型。核心技術(shù)010203人工智能核心技術(shù)是在多層神經(jīng)網(wǎng)絡(luò)發(fā)展的深度學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,被運用于虹膜識別、步態(tài)識別、身份識別等方面。模式識別主要目標(biāo)是讓機器能夠識別、操作人類語言,主要包括信息抽取、機器翻譯、摘要、搜索及人機交互等。自然語言處理在工業(yè)、農(nóng)業(yè)、商務(wù)、科技、教育、服務(wù)等領(lǐng)域被廣泛應(yīng)用,如農(nóng)業(yè)方面的作物病蟲預(yù)測專家系統(tǒng)等。專家系統(tǒng)其兩個核心問題是圖像分類和物體檢測。在圍繞圖像內(nèi)容的信息檢索、廣告投放、用戶分析、商品推薦等互聯(lián)網(wǎng)應(yīng)用在應(yīng)用廣泛。圖像識別四、人工智能的應(yīng)用領(lǐng)域人工智能應(yīng)用領(lǐng)域手機中的AI人工智能相關(guān)技術(shù)剛剛越過曲線高峰(處于狂熱期),是推動透明化身臨其境體驗技術(shù)發(fā)展的主要動力涉及透明化身臨其境體驗的人本技術(shù)(如智能工作空間、互聯(lián)家庭、增強現(xiàn)實、虛擬現(xiàn)實、腦機接口)是拉動另外兩大趨勢的前沿技術(shù)數(shù)字平臺在曲線上處于快速上升期,其中的量子計算和區(qū)塊鏈將在今后5—10年帶來變革性的影響AI處于什么階段?AIRoadmap國人為什么要關(guān)注AI?為什么人類能成為地球的主宰?基因:人和大猩猩的基因,有98.4%都是完全一樣的,只有1.6%有區(qū)別“符號語言”(口頭語言和書面文字):傳遞、保存、共享知識“集體知識”:人類的大腦可以相互共享信息,交換知識人類個體比其他動物沒有多大優(yōu)勢,掌握了符號語言,人類社會的結(jié)構(gòu)發(fā)生了突變,有了一個連接在一起的集體大腦。這種物種之間相互關(guān)聯(lián)、相互作用的方式,才是我們和其他物種的真正區(qū)別腦容量:歷史上的“尼安德特人”和我們的祖先腦容量是一樣的。但后來尼安德特人就沒留下來,只有我們這一支留下來了《時間地圖:大歷史導(dǎo)論》知識和創(chuàng)新是推動人類發(fā)展的動力AI學(xué)科結(jié)構(gòu)AI的幾大門派符號學(xué)派聯(lián)結(jié)學(xué)派行為學(xué)派神經(jīng)網(wǎng)絡(luò)知識表示機器人模擬人的心智模擬腦的結(jié)構(gòu)模擬人的行為聰明的AI有學(xué)識的AI深度學(xué)習(xí)知識圖譜感知識別判斷思考語言推理貝葉斯學(xué)派進(jìn)化學(xué)派類推學(xué)派人工智能產(chǎn)業(yè)生態(tài)的三層基本架構(gòu)基礎(chǔ)資源層:主要是計算平臺和數(shù)據(jù)中心,屬于計算智能;技術(shù)層:通過機器學(xué)習(xí)建模,開發(fā)面向不同領(lǐng)域的算法和技術(shù),包含感知智能和認(rèn)知智能;應(yīng)用層:主要實現(xiàn)人工智能在不同場景下的應(yīng)用?;A(chǔ)資源支撐AI生態(tài)逐步形成:基礎(chǔ)資源+技術(shù)+應(yīng)用人工智能系統(tǒng)的技術(shù)架構(gòu)智能終端智能云平臺人工智能的新革命第一節(jié)人工智能技術(shù)簡述深度學(xué)習(xí)算法知識圖譜推理期知識期機器學(xué)習(xí)期人工智能的三個研究階段1950s1970s1980s基于符號知識表示通過演繹推理技術(shù)基于符號知識表示通過獲取和利用領(lǐng)域知識建立專家系統(tǒng)神經(jīng)網(wǎng)絡(luò)第二個高潮NP(non-deterministicpolynomial-time)難題中獲重大進(jìn)展助力大量現(xiàn)實問題神經(jīng)網(wǎng)絡(luò)第一個高潮期神經(jīng)網(wǎng)絡(luò)以深度學(xué)習(xí)之名再次崛起大幅提升感知智能準(zhǔn)確率201790s中期統(tǒng)計學(xué)習(xí)登場并占據(jù)主流,支持向量機、核方法為代表性技術(shù)提出支持向量、VC維等概念統(tǒng)計學(xué)的研究成果經(jīng)由機器學(xué)習(xí)研究,形成有效的學(xué)習(xí)算法聯(lián)結(jié)學(xué)派對大腦進(jìn)行逆向分析靈感來自于神經(jīng)科學(xué)和物理學(xué)產(chǎn)生的是“黑箱”模型神經(jīng)網(wǎng)絡(luò)可歸置此類符號學(xué)派將學(xué)習(xí)看作逆向演繹并從哲學(xué)、心理學(xué)、邏輯學(xué)中尋求洞見代表包括決策樹和基于邏輯的學(xué)習(xí)機器學(xué)習(xí)&深度學(xué)習(xí)從以“推理”為重點到以“知識”為重點,再到以“學(xué)習(xí)”為重點機器可以自動“學(xué)習(xí)”的算法,即從數(shù)據(jù)中自動分析獲得規(guī)律,并利用規(guī)律對未知數(shù)據(jù)進(jìn)行預(yù)測的算法。目前,機器學(xué)習(xí)=“分類”人工智能>機器學(xué)習(xí)>深度學(xué)習(xí)深度學(xué)習(xí)是使用包含復(fù)雜結(jié)構(gòu)或由多重非線性變換構(gòu)成的多個處理層對數(shù)據(jù)進(jìn)行高層抽象的算法深度學(xué)習(xí)是一種基于對數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法。觀測值(例如一幅圖像)可以使用多種方式來表示,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區(qū)域等。而使用某些特定的表示方法更容易從實例中學(xué)習(xí)任務(wù)(例如,人臉識別或面部表情識別)。深度學(xué)習(xí)的好處是用非監(jiān)督式或半監(jiān)督式的特征學(xué)習(xí)和分層特征提取高效算法來替代手工獲取特征用數(shù)據(jù)優(yōu)化計算機程序的模型參數(shù)通過經(jīng)驗自動改進(jìn)的計算機算法深度學(xué)習(xí)算法簡介:機器學(xué)習(xí)機器學(xué)習(xí)的基本定理模型的出錯率∝推論:模型復(fù)雜-》大樣本

樣本小-》簡化模型

Classlabel(Classification)Vector(Estimation)機器學(xué)習(xí)實施過程特征提取特征1樣本數(shù)據(jù)樣本數(shù)據(jù)樣本數(shù)據(jù)…n預(yù)處理特征樣本集原始樣本集機器學(xué)習(xí)算法訓(xùn)練預(yù)測輸出驗證集評價目標(biāo)特征1…n目標(biāo)特征1…n目標(biāo)特征1…n訓(xùn)練集目標(biāo)特征1…n目標(biāo)特征1…n目標(biāo)特征1…n驗證集目標(biāo)特征1…n目標(biāo)特征1…n目標(biāo)預(yù)測目標(biāo)預(yù)測目標(biāo)預(yù)測目標(biāo)改進(jìn)特征提取特征提取特征1樣本數(shù)據(jù)樣本數(shù)據(jù)樣本數(shù)據(jù)…n特征樣本集原始樣本集目標(biāo)特征1…n目標(biāo)特征1…n目標(biāo)統(tǒng)計分析變換特征運算特征選取是成敗的關(guān)鍵人腦是通過分級的、多層網(wǎng)絡(luò)模型來識別減少數(shù)據(jù)量,保留物體的有用信息低層信息預(yù)處理特征提取識別分類對效果影響極大手動化特征工程非常耗時圖像識別的一般流程人腦識別圖像的過程第一個模型是一個線性模型,低度擬合,不能很好地適應(yīng)訓(xùn)練集;第三個模型是一個四次方的模型,過度擬合,雖然能非常好地適應(yīng)我們的訓(xùn)練集,但在新輸入變量進(jìn)行預(yù)測時可能會效果不好;中間的模型似乎最合適經(jīng)過算法預(yù)測的結(jié)果是一個連續(xù)的值,我們稱這樣的問題為回歸問題。算法能夠?qū)W會如何將數(shù)據(jù)分類到不同的類里,我們稱這樣的問題為分類問題。深度學(xué)習(xí)算法簡介:數(shù)學(xué)基礎(chǔ)當(dāng)感知器用于兩類模式的分類時,相當(dāng)于在高維樣本空間中,用一個超平面將兩類樣本分開神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程就是神經(jīng)網(wǎng)絡(luò)參數(shù)的設(shè)定過程一個神經(jīng)元網(wǎng)絡(luò)結(jié)構(gòu)確定之后,需要對一系列參數(shù)(權(quán)重、閾值等)進(jìn)行有效的設(shè)定。這個過程叫做學(xué)習(xí)或訓(xùn)練過程,此時的方法叫學(xué)習(xí)算法是一個由線性閾值元件組成的單層(或多層)神經(jīng)元的神經(jīng)網(wǎng)絡(luò)當(dāng)輸入的加權(quán)和大于或等于閾值時,輸出為1,否則為0模型假定神經(jīng)元中間的耦合程度(即加權(quán)系數(shù)W)可變,這樣,該模型可以學(xué)習(xí)深度學(xué)習(xí)算法簡介:感知器監(jiān)督學(xué)習(xí)通過已有的訓(xùn)練樣本(即已知數(shù)據(jù)以及其對應(yīng)的輸出)訓(xùn)練得到一個最優(yōu)模型(這個模型屬于某個函數(shù)的集合,最優(yōu)則表示在某個評價準(zhǔn)則下是最佳的),再利用這個模型將所有的輸入映射為相應(yīng)的輸出,對輸出進(jìn)行簡單的判斷從而實現(xiàn)分類的目的,從而也就具有了對未知數(shù)據(jù)進(jìn)行分類的能力各種神經(jīng)網(wǎng)絡(luò)類型LogisticRBMAutoEncoderSparseCodingConvolutional(卷積)強化學(xué)習(xí)類似人類與環(huán)境交互的方式,智能系統(tǒng)從環(huán)境到行為映射的學(xué)習(xí),以使獎勵信號函數(shù)值最大。環(huán)境對產(chǎn)生動作的好壞通過獎勵信號作評價,而不是告訴強化學(xué)習(xí)系統(tǒng)如何去產(chǎn)生正確的動作。強化學(xué)習(xí)不能立即得到標(biāo)記,而只能得到一個反饋,因此可以說強化學(xué)習(xí)是一種具有“延遲標(biāo)記信息”的監(jiān)督學(xué)習(xí)典型案例:AlphaGo深度學(xué)習(xí)的訓(xùn)練方法2006年,GeoffreyHinton在《科學(xué)》上發(fā)表論文提出深度學(xué)習(xí)主要觀點:多隱層的人工神經(jīng)網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習(xí)能力,學(xué)習(xí)得到的特征對數(shù)據(jù)有更本質(zhì)的刻畫,從而有利于可視化或分類深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的難度,可以通過“逐層初始化”(layer-wisepre-training)來有效克服,逐層初始化可通過無監(jiān)督學(xué)習(xí)實現(xiàn)的在著名的ImageNet問題上將錯誤率從26%降低到了15%,并且輸入沒有用到其他任何人工特征,僅僅是圖像的像素遷移學(xué)習(xí)將從擁有大數(shù)據(jù)的源領(lǐng)域上學(xué)習(xí)到的東西應(yīng)用到僅有小數(shù)據(jù)的目標(biāo)領(lǐng)域上去,實現(xiàn)個性化遷移,即舉一反三、觸類旁通。典型案例:斯坦福學(xué)者使用衛(wèi)星圖像獲取的燈光信息來分析非洲大陸的貧窮情況深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法LeNet-5:卷積神經(jīng)網(wǎng)絡(luò)手寫數(shù)字識別的應(yīng)用卷積過程包括:用一個可訓(xùn)練的濾波器fx去卷積一個輸入的圖像,然后加一個偏置bx,得到卷積層Cx。子采樣過程包括:每鄰域四個像素求和變?yōu)橐粋€像素,加權(quán)再增加偏置,通過一個激活函數(shù),產(chǎn)生一個縮小四倍的特征映射圖C1層:輸入圖片大?。?32*32卷積窗大小: 5*5卷積窗種類: 6輸出特征圖數(shù)量:6輸出特征圖大?。?8*28 (32-5+1)神經(jīng)元數(shù)量: 4707[(28*28)*6)]連接數(shù): 12304[(5*5+1)*6]*(28*28)可訓(xùn)練參數(shù): 156[(5*5+1)*6]局部感受-卷積FeatureMap池化原理:根據(jù)圖像局部相關(guān)的原理,圖像某個鄰域內(nèi)只需要一個像素點就能表達(dá)整個區(qū)域的信息常見的方法:最大值池化(max-pooling)L2池化(L2pooling)均值池化(MeanPooling)LeNet-5YannLecun,1989年用美國郵政系統(tǒng)提供的近萬個手寫數(shù)字的樣本來訓(xùn)練神經(jīng)網(wǎng)絡(luò)系統(tǒng),在獨立的測試樣本中,錯誤率只有5%進(jìn)一步運用CNN,開發(fā)出LeNet-5用于讀取銀行支票上的手寫數(shù)字,這個支票識別系統(tǒng)在九十年代末占據(jù)了美國接近20%的市場深度學(xué)習(xí)的訓(xùn)練方法HintoninImageNet比賽140萬圖像,

1000類圖庫1000萬圖像20000類7層CNN準(zhǔn)確率74%->85%深度學(xué)習(xí)的成功應(yīng)用AlphaGo戰(zhàn)勝李世乭圖像識別全面超越人類語音識別接近人類將聲學(xué)模型中混合高斯模型替換為DNN模型獲得30%+相對提升TeslaAutopilot投入商用GoogleTranslate投入商用它把原文例如中文詞先翻成一個詞向量,變成一個數(shù)字向量。它對這個詞向量再編輯,變成一個語義表示的方式。再把它翻譯成它的目標(biāo)語言,例如英文。人工智能的新革命第一節(jié)人工智能技術(shù)簡述深度學(xué)習(xí)算法知識圖譜知識圖譜(KnowledgeGraph)知識圖譜旨在描述真實世界中存在的各種實體或概念及其關(guān)系,一般用三元組表示知識圖譜亦可被看作是一張巨大的圖,節(jié)點表示實體或概念,邊則由屬性或關(guān)系構(gòu)成中國國家美國日本英國北京9,634,057平方公里13.5404億2069.3萬北緯38°56'東經(jīng)116°20'3.1525億華盛頓9,629,091平方公里北緯38°53′西經(jīng)77°02'178平方公里16410平方公里1.26億377835平方公里東京2188平方公里東經(jīng)140°50'北緯35°44'……面積人口首都緯度經(jīng)度面積人口知識圖譜構(gòu)建Web字典,術(shù)語表,百科,書本知識獲取++已有知識庫知識融合知識驗證知識圖譜名稱規(guī)模Yago1千萬實體,35萬類別,1.8億事實,100種屬性,100語言Dbpedia4千萬實體,250類別,5億事實,6000種屬性,F(xiàn)reebase2千5百萬實體,2000主題,1億事實,4000種屬性谷歌知識圖譜5億實體名字,35億條事實NELL3百萬實體名字,300類別500屬性,100萬事實1千5百萬學(xué)習(xí)規(guī)則基于人工規(guī)則的語義理解神話是孫楠和誰合唱的?文法解析知識庫查詢SPARQL查詢語句生成答案生成孫楠和韓紅合唱了神話韓紅歌手6萬歌曲260萬專輯44萬標(biāo)簽2000類param:singer孫楠#param:song神話#predicate:chorusWith神話是孫楠和誰合唱的查詢神話這首歌曲的演唱者,演唱者要包括孫楠,輸出還包括的另外一個演唱者文法規(guī)則模板歌手6萬歌曲260萬專輯44萬標(biāo)簽2000類互聯(lián)網(wǎng)各種音樂相關(guān)信息下載融合知識圖譜的成功應(yīng)用:現(xiàn)代搜索引擎半結(jié)構(gòu)化信息抽取半結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)文本數(shù)據(jù)實體對齊推理補充數(shù)據(jù)異構(gòu)數(shù)據(jù)整合重要度計算實體抽取屬性抽取屬性值決策關(guān)系建立知立方數(shù)據(jù)本體生成系統(tǒng)索引生成檢索系統(tǒng)實體識別本體庫Pattern挖掘標(biāo)簽消岐SPARQL查詢語句排序推理推薦統(tǒng)計Query展現(xiàn)檢索系統(tǒng)索引生成面向知識圖譜的Sogou搜索技術(shù)Gene

OntologyLOD

企業(yè)對知識圖譜根據(jù)內(nèi)部數(shù)據(jù)有大量的業(yè)務(wù)需求從兩方面來建設(shè)知識圖譜體系:

知識實體,算法企業(yè)知識圖譜的建立語義理解智能檢索與問答數(shù)據(jù)關(guān)聯(lián)探索業(yè)務(wù)動態(tài)擴展非結(jié)構(gòu)化數(shù)據(jù)計算機難以理解數(shù)據(jù)使用專業(yè)程度過高多元異構(gòu)數(shù)據(jù)難以融合數(shù)據(jù)模式動態(tài)變遷困難結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)融合自由擴展數(shù)據(jù)模式行業(yè)智能問答業(yè)務(wù)需求技術(shù)方案數(shù)據(jù)挑戰(zhàn)知識圖譜助力企業(yè)商業(yè)智能通用知識圖譜+行業(yè)知識圖譜通用知識圖譜的廣度,行業(yè)知識圖譜的深度,相互補充,形成更加完善的知識圖譜

通用知識圖譜中的知識,可以作為行業(yè)知識圖譜構(gòu)建的基礎(chǔ);而構(gòu)建的行業(yè)知識圖譜,再融合到通用知識圖譜中

通用知識圖譜行業(yè)知識圖譜通用知識圖譜創(chuàng)投專利深度學(xué)習(xí)與智能圍棋第二節(jié)從AlphaGoLee/Master講起蒙特卡洛樹式搜索AlphaGo的實現(xiàn)原理AlphaGoZero01人機大戰(zhàn):深度學(xué)習(xí)算法的標(biāo)志性成果最復(fù)雜(注:狀態(tài)復(fù)雜度與博弈復(fù)雜度)的智力游戲:看似簡單,實為復(fù)雜,具有10的170次方狀態(tài)復(fù)雜空間涉及邏輯推理,形象思維,優(yōu)化選擇等多種人類智能(注:國際象棋只有邏輯推理,沒有形象思維)02接近人類公認(rèn)是人工智能領(lǐng)域長期以來的重大挑戰(zhàn)03標(biāo)志性國際學(xué)術(shù)界曾經(jīng)普遍認(rèn)為解決圍棋問題需要15-20年時間04挑戰(zhàn)為什么做圍棋AI?創(chuàng)新性投入力度業(yè)內(nèi)龍頭

目前技術(shù)優(yōu)勢:起步早,算法新,技術(shù)強,資源雄厚最近一年專注于強化學(xué)習(xí)研究

擬于近期公布新論文和數(shù)據(jù),并從此退出圍棋AI領(lǐng)域GoogleDeepmind簡介深度學(xué)習(xí)與智能圍棋第二節(jié)從AlphaGoLee/Master講起蒙特卡洛樹式搜索AlphaGo的實現(xiàn)原理AlphaGoZero傳統(tǒng)圍棋AI算法—MCTS(蒙特卡洛樹搜索)雙人一人一步雙方信息完備(棋類—完全信息,牌類—不完全信息)零和動態(tài)博弈問題計算機下棋棋類要素的數(shù)字化——恰當(dāng)?shù)臄?shù)據(jù)結(jié)構(gòu)棋盤、棋子、棋規(guī)(著法規(guī)則,勝負(fù)規(guī)則)用著法推演局面——博弈樹展開從有利局面選擇當(dāng)前著法——博弈搜索局面評估——指標(biāo)定義與綜合展開深度為4的博弈樹本方本方本方對方對方Ply1Ply3Ply4Ply2Ply0根節(jié)點為當(dāng)前局面葉節(jié)點為展開終點雙方輪流出手偶數(shù)層為本方奇數(shù)層為對方圍棋落子蒙特卡洛數(shù)學(xué)模型及評估圍棋對弈過程可以看做一個馬爾科夫過程:五元組:{T,S,A(i),P(·|i,a),r(i,a)}T:決策時刻S:狀態(tài)空間,S={i}A(i):可行動集合(可落子點)P(·|i,a):狀態(tài)i下選擇行動a的概率r(i,a):狀態(tài)i下選擇行動a后課獲得的收益從當(dāng)前局面的所有可落子點中隨機(或者給勝率高的點分配更多的計算力)選擇一個點落子重復(fù)以上過程直到勝負(fù)可判斷為止經(jīng)多次模擬后(計算越多越精確),選擇勝率最大的點落子傳統(tǒng)圍棋AI算法—數(shù)學(xué)模型MCTS(蒙特卡洛樹搜索)基本思想與特點:-將可能出現(xiàn)的狀態(tài)轉(zhuǎn)移過程用狀態(tài)樹表示-從初始狀態(tài)開始重復(fù)抽樣,逐步擴展樹中的節(jié)點-某個狀態(tài)再次被訪問時,可以利用已有的結(jié)果,提高了效率-在抽樣過程中可以隨時得到行為的評價選擇-從根節(jié)點出發(fā)自上而下地選擇一個落子點擴展-向選定的點添加一個或多個子節(jié)點模擬-對擴展出的節(jié)點用蒙特卡洛方法進(jìn)行模擬回溯-根據(jù)模擬結(jié)果依次向上更新祖先節(jié)點估計值深度學(xué)習(xí)與智能圍棋第二節(jié)從AlphaGoLee/Master講起蒙特卡洛樹式搜索AlphaGo的實現(xiàn)原理AlphaGoZero13個卷積層,每層192個卷積核,每個卷積核3*3,參數(shù)個數(shù)800萬+GPU3ms/步預(yù)測準(zhǔn)確率57%PolicyNetwork(策略網(wǎng)絡(luò))在每個分支節(jié)點直接判斷形勢與Rollout隨機模擬相結(jié)合,互為補充ValueNetwork(價值網(wǎng)絡(luò))給勝率高的點分配更多的計算力任意時間算法,計算越多越精確1、選取2、展開3、評估4、倒傳MCTS(蒙特卡洛樹搜索)通過隨機模擬走子勝率來判定形勢速度很快(1ms/盤)隨機性與合理性的平衡Rollout(隨機模擬走子)AlphaGo的實現(xiàn)原理控制寬度(250)控制深度(150)基本算法快速模擬圍棋是完全信息博弈,從理論上來說可以通過暴力搜索所有可能的對弈過程來確定最優(yōu)的走法PolicyNetwork策略網(wǎng)絡(luò):落子棋感深度神經(jīng)網(wǎng)絡(luò)的有監(jiān)督學(xué)習(xí),目標(biāo)是獲得在圍棋盤面下的落子棋感學(xué)習(xí)職業(yè)棋手和業(yè)余高段棋手的棋譜(數(shù)十萬份棋譜,上億數(shù)量級的落子方式)把當(dāng)前局面作為輸入,預(yù)測下一步的走棋。它的預(yù)測不只給出最強的一手,而是對棋盤上所有可能的下一著給一個分?jǐn)?shù)用PolicyNetwork作為第一感,將計算力分配到最有希望的選點分枝數(shù)從上百個減少到幾個優(yōu)先計算PolicyNetwork分?jǐn)?shù)高的點,計算力充沛時,適當(dāng)分配到其他分值較低的點PolicyNetwork—輸入特征3×224248×552128×272192×132192×132128×1322048204820482048192×32192×32128×3248×523×112192×32192×32192×132192×132128×132128×27248×5248×552128×321000局部感知域權(quán)重共享特征訓(xùn)練卷積層+池化層模型結(jié)構(gòu)13個卷積層,每層192個3*3卷積核數(shù)百萬個參數(shù)訓(xùn)練數(shù)據(jù)KGS6d以上對局,17萬,職業(yè)對局8萬。訓(xùn)練數(shù)據(jù)量5000萬+訓(xùn)練時間幾十天運算速度GPU,3ms預(yù)測準(zhǔn)確率57%左右互博,自我進(jìn)化Agent通過和環(huán)境s的交互,選擇下一步的動作a,這個動作會影響環(huán)境s,給Agent一個reward,Agent然后繼續(xù)和環(huán)境交互。根據(jù)游戲結(jié)果迭代更新轉(zhuǎn)移概率和評估函數(shù)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與策略網(wǎng)絡(luò)相同訓(xùn)練方法:自我對局目標(biāo):校正價值導(dǎo)向?qū)⒉呗跃W(wǎng)絡(luò)權(quán)值作為初始值,自我對弈更新權(quán)值,從而提升棋力Pros:棋藝更高(win80%ofthegameswithSLpolicynetwork)Cons:走法集中,不適應(yīng)MCTS多搜索范圍的需求強化學(xué)習(xí)(RL)Fast-Rollout快速走子Rollout(隨機模擬走子)通過隨機模擬走子勝率來判定形勢速度快隨機性,合理性的平衡原因:1.策略網(wǎng)絡(luò)的運行速度較慢(3ms)

快速走子在2us2.用來評估盤面。在同等時間下,模擬走子速度快乃至使用隨機走子,雖然單次估值精度低,但可以多模擬幾次算平均值,效果未必不好。提升棋力結(jié)構(gòu):局部特征匹配+線性回歸特征:圍棋專業(yè)知識ValueNetwork:勝負(fù)棋感深度神經(jīng)網(wǎng)絡(luò)的增強型學(xué)習(xí)(DeepMind獨創(chuàng))通過自我博弈,學(xué)習(xí)不同盤面下的勝負(fù)情況(三千萬盤自我對局)獲取在圍棋盤面的勝負(fù)棋感(注:對每一個落子點給一個當(dāng)時的快速的勝負(fù)感(估算),這個勝負(fù)估算并不是根據(jù)分析計算出來的,而是直覺)(通過AlphaGo幾千萬盤的訓(xùn)練學(xué)習(xí)得來的)形勢判斷:-1:白棋必勝<0:白棋優(yōu)勢0:雙方均勢>0:黑棋優(yōu)勢1:黑棋必勝ValueNetwork模型模型結(jié)構(gòu)13個卷積層,每層192個卷積核,每個卷積核3*3數(shù)百萬個參數(shù)訓(xùn)練數(shù)據(jù)PolicyNetwork自我對弈棋譜。3000萬+特定盤面+勝負(fù)結(jié)果訓(xùn)練時間幾十天運算速度GPU,3ms方法:在每個分支節(jié)點,使用ValueNetwork直接判斷形勢與Rollout隨機模擬相結(jié)合,互為補充效果:職業(yè)水平,AlphaGoMCTS在對局中實時搜索Step1:基于策略網(wǎng)絡(luò)落子,可能性大的落子拓展節(jié)點Step2:對未來走勢進(jìn)行評估,同時使用估值網(wǎng)絡(luò)和快速走子,綜合兩者預(yù)測未來走法Step3:評估結(jié)果作為下一步走法的Q值。重新模擬。Step4:結(jié)合下一步走法的Q值和策略網(wǎng)絡(luò)進(jìn)行再一次模擬。如果出現(xiàn)同樣走法,Q值起平均。新分?jǐn)?shù)=調(diào)整后的初始分+0.5*通過模擬(策略網(wǎng)絡(luò)+快速走棋)得到的贏棋概率+0.5*估值網(wǎng)絡(luò)的局面評估分Step5:反復(fù)循環(huán)直到n次,或者timeout,選擇被選擇次數(shù)最多的走法作為下一步Put-Together深度學(xué)習(xí)與智能圍棋第二節(jié)從AlphaGoLee/Master講起蒙特卡洛樹式搜索AlphaGo的實現(xiàn)原理AlphaGoZeroAlphaGoZero第3天,下了490萬局棋,打敗老大老三戰(zhàn)績老三學(xué)棋過程剛開始,隨機下子熱衷于吃子,完全不顧死活發(fā)現(xiàn)了如果先占住棋盤的邊和角,后面占便宜學(xué)會了如何「打劫」、「征子」懂得看「棋形」第21天,敗了老二第40天,完整走過了一個人類棋手學(xué)棋的全過程棋盤/黑子/白子棋子被圍起來就死規(guī)則棋士柯潔10月19日02:22一個純凈、純粹自我學(xué)習(xí)的AlphaGo是最強的...對于AlphaGo的自我進(jìn)步來講...人類太多余了老大AlphaGoLee,2016年3月4:1打敗韓國棋手李世石老二AlphaGoMaster,2017年5月3:0打敗中國棋手柯潔老三AlphaGoZero,2017年10月宣布自學(xué)圍棋40天,打敗所有人AlphaGoZero解析人類經(jīng)驗由于樣本空間大小的限制,往往都收斂于局部最優(yōu)而不自知(或無法發(fā)現(xiàn)),阿法元不再被人類認(rèn)知所局限,而能夠發(fā)現(xiàn)新知識,發(fā)展新策略區(qū)別1:特征提取層采用40個殘差模塊,每個模塊包含2個卷積層。運用殘差模塊提升了網(wǎng)絡(luò)深度,更深的網(wǎng)絡(luò)能更有效地直接從棋盤上提取特征區(qū)別2:同時訓(xùn)練走子策略(policy)網(wǎng)絡(luò)和勝率值(value)網(wǎng)絡(luò)啟示深度學(xué)習(xí)訓(xùn)練過程需要消耗大量人類標(biāo)注樣本,而這對于小樣本應(yīng)用領(lǐng)域(比如醫(yī)療圖像處理)是不可能辦到的。所以減少樣本和人類標(biāo)注的方法非常重要開局和收官和專業(yè)棋手的下法并無區(qū)別,但是中盤難于理解;機器經(jīng)驗與人類經(jīng)驗有很大差別,我們又該如何去選擇和利用呢?智能圍棋與蒙特卡洛樹搜索沒有棋感直覺不行,完全依賴棋感直覺也不行直覺需要通過嚴(yán)格的數(shù)學(xué)模型和計算方法,對棋感直覺進(jìn)行驗證AlphaGo使用蒙特卡洛樹搜索,對落子棋感和勝負(fù)感進(jìn)行計算驗證。蒙特卡洛樹搜索:搜索驗證基于數(shù)學(xué)期望的勝負(fù)評估模型(勝率)基于蒙特卡洛模擬進(jìn)行勝負(fù)結(jié)果采樣(模擬采樣比直覺更可靠)根據(jù)模擬采樣結(jié)果驗證盤面勝負(fù)的數(shù)學(xué)期望可靠程度與采樣規(guī)模相關(guān)(采樣越大,離真理會更近些)蒙特卡洛模擬采樣:勝負(fù)棋感驗證智能圍棋與神經(jīng)網(wǎng)絡(luò)谷歌的AlphaGo是深度學(xué)習(xí)算法的標(biāo)志性成果;深度卷積神經(jīng)網(wǎng)絡(luò)(DeepConvolutionalNeuralNetwork,DCNN),是近年發(fā)展起來,并引起廣泛重視的一種高效識別方法。圍棋算法具有高度的復(fù)雜性和代表性(10808,兩個30年)。由于天文數(shù)字的狀態(tài)空間和搜索空間,蠻力計算無法解決圍棋問題(注:解決國際象棋的IBM深藍(lán)是用蠻力方法,就是靠計算,這種方法在圍棋這么大的計算與搜索空間是無法進(jìn)行的)從圍棋算法可以推廣到深度學(xué)習(xí)應(yīng)用的一般情形。圍棋職業(yè)棋手的解決方法:棋感直覺+搜索驗證AlphaGo的核心方法完全類似于完全職業(yè)棋手的解決方法AlphaGo的優(yōu)勢:完全以勝率為目標(biāo),不受任何其它因素影響深度學(xué)習(xí)與國際象棋第三節(jié)從AlphaGoLee/Master講起蒙特卡洛樹式搜索AlphaGo的實現(xiàn)原理AlphaGoZero

圍棋復(fù)雜度增加8*8格國際象棋的狀態(tài)復(fù)雜度為1046,博弈樹復(fù)雜度為10123。19*19格的圍棋,其狀態(tài)復(fù)雜度已上升到10172,博弈樹復(fù)雜度則達(dá)到驚人的10360,因此也被視為人類在棋類人機對抗中最后的堡壘。國際象棋圍棋人機對抗的嘗試與探索

在很長一段時間里,靜態(tài)方法成了主流研究方向,中山大學(xué)化學(xué)系教授陳志行開發(fā)的圍棋博弈程序“手談”和開源軟件GNUGO在2003年以前能夠在9*9圍棋中達(dá)到人類5-7級水平。

2006年S.Gelly等人提出的UCT算法(UpperConfidenceBoundApplytoTree,上限置信區(qū)間算法),該算法在蒙特卡洛樹搜索中使用UCB公式解決了探索和利用的平衡,并采用隨機模擬對圍棋局面進(jìn)行評價。該程序的勝率竟然比先前最先進(jìn)的蒙特卡羅擴展算法高出了幾乎一倍,但它也僅能在9路圍棋中偶爾戰(zhàn)勝人類職業(yè)棋手,在19路圍棋中還遠(yuǎn)遠(yuǎn)不能與人類抗衡。靜態(tài)方法UCT算法陳志行手談AlphaGo橫空出世這是圍棋歷史上一次史無前例的突破,人工智能程序能在不讓子的情況下,第一次在完整的圍棋競技中擊敗專業(yè)選手。AlphaGo大戰(zhàn)樊麾2016年D.Silver等人在世界頂級科學(xué)雜志《Nature》發(fā)表文章,稱被谷歌公司收購的DeepMind團(tuán)隊開發(fā)出AlphaGo在沒有任何讓子情況下,以5:0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾。AlphaGo系統(tǒng)簡介監(jiān)督、強化學(xué)習(xí)該系統(tǒng)通過對16萬局人類高手棋譜中的3000萬手盤面進(jìn)行監(jiān)督學(xué)習(xí)和強化學(xué)習(xí);策略、價值網(wǎng)絡(luò)使用策略網(wǎng)絡(luò)和估值網(wǎng)絡(luò)實現(xiàn)落子決策和局勢評估;蒙特卡洛算法通過與蒙特卡洛樹搜索算法結(jié)合,極大地改善了搜索決策的質(zhì)量;

異步分布并行算法提出異步分布式并行算法,使其可運行于CPU/GPU集群上。系統(tǒng)AlphaGo所向披靡

2016年3月AlphaGo與李世石進(jìn)行圍棋人機大戰(zhàn),以4比1的總比分獲勝;

2016年末2017年初,它以Master為帳號與中日韓數(shù)十位圍棋高手快棋對決,連續(xù)60局全勝。

2017年5月在中國烏鎮(zhèn)圍棋峰會上,它與柯潔對戰(zhàn),以3比0的總比分獲勝。圍棋界公認(rèn)AlphaGo的棋力已經(jīng)超過人類職業(yè)圍棋頂尖水平,其最新版本自我估分在4500分左右,實力水平大約在13段左右,人類選手中已然無敵。AlphaGo大戰(zhàn)李世石Master大戰(zhàn)聶衛(wèi)平AlphaGo大戰(zhàn)柯潔AlphaGo新技能AlphaGo通過學(xué)習(xí)大量棋譜,以及更大規(guī)模的自我對弈完成學(xué)習(xí),這種深度學(xué)習(xí)的能力使得它能不斷學(xué)習(xí)進(jìn)化。AlphaGo發(fā)現(xiàn)了人類沒有的圍棋著法,初步展示了機器發(fā)現(xiàn)“新事物”的創(chuàng)造性。這意味著它的增強學(xué)習(xí)算法可以從大數(shù)據(jù)中發(fā)現(xiàn)新的規(guī)律和知識,為人類擴展自己的知識體系開辟了新的認(rèn)知通道。AlphaGo展現(xiàn)了曾被認(rèn)為是人類獨有、計算機難以做到的“棋感直覺”這些技術(shù)使得人工智能程序初步具備了既可以考慮局部得失,又可以考慮全局態(tài)勢的能力,從而具備了一種全局性“直覺”能力。深度學(xué)習(xí)發(fā)現(xiàn)新著法棋感知覺新技能AlphaGoZero青出于藍(lán)

學(xué)習(xí)策略整合策略、價值網(wǎng)絡(luò)舍棄快速走子網(wǎng)絡(luò)引入殘差結(jié)構(gòu)2.舍棄快速走子網(wǎng)絡(luò),不再進(jìn)行隨機模擬,而是完全使用神經(jīng)網(wǎng)絡(luò)得到的結(jié)果替換隨機模擬,從而在提升學(xué)習(xí)速率的同時,增強神經(jīng)網(wǎng)絡(luò)估值的準(zhǔn)確性。1.AlphaGoZero將策略網(wǎng)絡(luò)和價值網(wǎng)絡(luò)整合在一起,使用純粹的深度強化學(xué)習(xí)方法進(jìn)行端到端的自我對弈學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)的權(quán)值完全從隨機初始化開始,使用強化學(xué)習(xí)進(jìn)行自我博弈和提升。3.AlphaGoZero神經(jīng)網(wǎng)絡(luò)中還引入了殘差結(jié)構(gòu),可使用更深的神經(jīng)網(wǎng)絡(luò)進(jìn)行特征表征提取,從而能在更加復(fù)雜的棋盤局面中進(jìn)行學(xué)習(xí)。AlphaGoZero青出于藍(lán)

AlphaGo最高需要1920塊CPU和280塊GPU訓(xùn)練,AlphaGoLee用了176塊GPU和48塊TPU,而AlphaGoZero僅僅使用了單機4塊TPU便完成了訓(xùn)練任務(wù)。硬件結(jié)構(gòu)

AlphaGoZero僅用3天的時間便達(dá)到了AlphaGoLee的水平,21天后達(dá)到AlphaGoMaster的水平。AlphaGoZero成功證明了在沒有人類指導(dǎo)和經(jīng)驗的前提下,深度強化學(xué)習(xí)方法在圍棋領(lǐng)域里仍然能夠出色的完成指定的任務(wù),甚至于比有人類經(jīng)驗知識指導(dǎo)時,完成的更加出色。AlphaGo成功秘訣:蒙特卡洛樹搜索在機器博弈中,每步行棋方案的運算時間、堆??臻g都是有限的,只能給出局部最優(yōu)解,因此2006年提出的蒙特卡洛樹搜索就成為隨機搜索算法的首選。應(yīng)用意義它結(jié)合了隨機模擬的一般性和樹搜索的準(zhǔn)確性,近年來在圍棋等完全信息博弈、多人博弈及隨機類博弈難題上取得了成功應(yīng)用。理論上,蒙特卡洛樹搜索可被用在以{狀態(tài),行動}定義并用模擬預(yù)測輸出結(jié)果的任何領(lǐng)域。

它結(jié)合了廣度優(yōu)先搜索和深度優(yōu)先搜索,會較好地集中到“更值得搜索的變化”(雖然不一定準(zhǔn)確),同時可以給出一個同樣不怎么準(zhǔn)確的全局評估結(jié)果,最后隨著搜索樹的自動生長,可以保證在足夠大的運算能力和足夠長的時間后收斂到完美解。AlphaGo成功秘訣:強化學(xué)習(xí)目標(biāo):從一個已經(jīng)標(biāo)記的訓(xùn)練集中進(jìn)行學(xué)習(xí)。機器學(xué)習(xí)有監(jiān)督學(xué)習(xí)SupervisedLearning無監(jiān)督學(xué)習(xí)UnsupervisedLearning強化學(xué)習(xí)ReinforcementLearning目標(biāo):從一堆未標(biāo)記樣本中發(fā)現(xiàn)隱藏的結(jié)構(gòu)。目標(biāo):在當(dāng)前行動和未來狀態(tài)中獲得最大回報。在邊獲得樣例邊學(xué)習(xí)的過程中,不斷迭代“在當(dāng)前模型的情況下,如何選擇下一步的行動才對完善當(dāng)前的模型最有利”的過程直到模型收斂。強化學(xué)習(xí)的廣泛應(yīng)用阿里巴巴公司在雙11推薦場景中,使用了深度強化學(xué)習(xí)與自適應(yīng)在線學(xué)習(xí)建立決策引擎,對海量用戶行為以及百億級商品特征進(jìn)行實時分析,提高人和商品的配對效率,將手機用戶點擊率提升了10-20%。無人駕駛廣告投放強化學(xué)習(xí)在機器博弈以外還有很多應(yīng)用,例如無人駕駛和廣告投放等。

人工智能3.0第四節(jié)AI技術(shù)的新特征AI走向3.0認(rèn)知計算AI3.0面對的挑戰(zhàn)Q1:什么領(lǐng)域AI能夠超過人?(完全信息博弈)充分的數(shù)據(jù):需要有超級大的數(shù)據(jù)量,它不能舉一反三,它要舉多反三(完全信息博弈)信息具有確定性:數(shù)據(jù)是要有標(biāo)注的,不是到網(wǎng)上弄一堆數(shù)據(jù)(完全信息博弈)完全信息:應(yīng)用一定是單一領(lǐng)域,這個領(lǐng)域越垂直、越細(xì)越好。一個人工智能客服的應(yīng)用不可以用來做導(dǎo)游,應(yīng)用單一、一定要非常清晰不跨領(lǐng)域有懂行的專家去選擇有效的神經(jīng)網(wǎng)絡(luò)模型,調(diào)整各種網(wǎng)絡(luò)參數(shù)需要超大計算量,機器容易甩開人類一只烏鴉的啟示圖b:找到了堅果,砸不開。它就發(fā)現(xiàn)一個訣竅,把果子放到路上讓車軋過去圖c:靠近紅綠路燈的路口,車子和人有時候停下了。圖d:選擇了一根正好在斑馬線上方的一根電線蹲下來圖e:把堅果拋到斑馬線上,等車子軋過去,然后等到行人燈亮了日本新喀烏鴉一個完全自主的智能。感知、認(rèn)知、推理、學(xué)習(xí)、和執(zhí)行。遠(yuǎn)遠(yuǎn)超過任何機器人,烏鴉向我們證明了,這個解存在。無大數(shù)據(jù)學(xué)習(xí),無人工標(biāo)注好的訓(xùn)練數(shù)據(jù),沒人教它烏鴉頭不到人腦的1%大小。人腦功耗大約是10-25瓦,它就只有0.1-0.2瓦啟示Q2:AI+還是+AI?在AI技術(shù)成熟之前,這個行業(yè)、產(chǎn)品從未存在過。比如自動駕駛,亞馬遜的Echo智能音箱、蘋果的Siri語音助手。在人工智能技術(shù)未突破前,不存在這樣的產(chǎn)品。因為AI,創(chuàng)造出了一條全新的產(chǎn)業(yè)鏈。AI+行業(yè):從0到1行業(yè)本身一直存在,產(chǎn)業(yè)鏈條成熟;以前完全靠人工,效率比較低,現(xiàn)在加入AI元素后,使得行業(yè)效率有了明顯提高。比如安防、醫(yī)療等領(lǐng)域。行業(yè)數(shù)據(jù)控制比AI技術(shù)更重要,例如醫(yī)療+AI,最重要的是大量準(zhǔn)確的被醫(yī)生標(biāo)注過的數(shù)據(jù)。在國內(nèi),醫(yī)療數(shù)據(jù)拿出來非常困難。行業(yè)+AI:從1到nAI應(yīng)用需要積累足夠的數(shù)據(jù)和經(jīng)過充分的學(xué)習(xí)才兩個起作用當(dāng)一個AI應(yīng)用找到第一批用戶時,他們使用的行為和記錄被后臺記錄下來;開發(fā)者再對這種行為和記錄進(jìn)行迭代的改進(jìn),當(dāng)再把該應(yīng)用投向第二批用戶的時候,其行為已經(jīng)比第一代提升了漣漪效應(yīng)應(yīng)用場景相對閉可控數(shù)據(jù)比較便宜,且容易獲取犯錯誤的影響不太大的場景輔助人類完成重復(fù)性的具體工作,真正能夠提高社會生產(chǎn)力容錯生產(chǎn)力成熟封閉可控數(shù)據(jù)相關(guān)技術(shù)成熟,具備可實現(xiàn)的切入點Q3:什么AI項目容易成功?新特征1:深度學(xué)習(xí)+自我博弈進(jìn)化技術(shù)4與傳統(tǒng)博弈人工知識不同,AlphaGo深度強化學(xué)習(xí)初步具備了“直覺感知(下一步在哪)”,“棋局推理(全局獲勝機會如何)”,和“新穎落子(想人所不敢想)”等能力。將記憶人類棋局和自我博弈積累棋局結(jié)合起來。DeepMind算法減少了40%用于冷卻的電量,即整體用電量效率提升15%2010年全球數(shù)據(jù)中心電力消耗為2355億度,約占全球電力消耗1.3%(美2%,中1.8%)。谷歌公司電力消耗低于全球數(shù)據(jù)中心的1%DeepMind已為谷歌掙錢DeepMind的軟件控制著數(shù)據(jù)中心的風(fēng)扇、制冷系統(tǒng)和窗戶等120個變量,使谷歌的用電效率提升了15%,幾年內(nèi)共為谷歌節(jié)約電費數(shù)億美元。據(jù)ICTResearch統(tǒng)計:2015年我國數(shù)據(jù)中心能耗高達(dá)1000億度,相當(dāng)于整個三峽水電站一年發(fā)電量。5《Science》2016年1月1日發(fā)表“群智之力量(ThePowerofCrowds,Vol.351,issues6268)”的論文認(rèn)為:結(jié)合群體智慧與機器性能來解決快速增長難題。其將群智計算按難易程度分為三種類型:實現(xiàn)任務(wù)分配的

眾包模式(Crowdsourcing)、較復(fù)雜支持工作流模式的群(Complexworkflows)以及最復(fù)雜的協(xié)同求解問題的生態(tài)系統(tǒng)模式(Problemsolvingecosystem).新特征2:基于網(wǎng)絡(luò)的群體智能已經(jīng)萌芽6大規(guī)模個體通過互聯(lián)網(wǎng)構(gòu)架的參與,可以表現(xiàn)出超乎尋常的智慧能力,是解決開放復(fù)雜問題的新途徑

美國普林斯頓大學(xué)Connetome項目開發(fā)了EyeWire游戲,玩家對顯微圖像中單個細(xì)胞及其神經(jīng)元連接按功能進(jìn)行涂色。第一次提供了哺乳動物視網(wǎng)膜的神經(jīng)元結(jié)構(gòu)和組織如何產(chǎn)生檢測運動的功能。145個國家的165000多名科學(xué)家(玩家)參與成功的還有:蘋果AppStore(130萬個應(yīng)用程序)、Wiki百科(4000萬詞條)等等美國普林斯頓大學(xué)Connetome項目通過群體參與來探討大腦結(jié)構(gòu)和功能之間映射的神經(jīng)通路/(繼續(xù))7各種穿戴設(shè)備、人—車共駕、腦控或肌控外骨骼機器人、人機協(xié)同手術(shù)等實現(xiàn)生物智能系統(tǒng)與機器智能系統(tǒng)的緊密耦合。新特征3:人機一體化技術(shù)導(dǎo)向混合智能8自然語言處理視覺計算聽覺感知

精靈寶可夢GO:AR:圖形+視頻谷歌:VR繪畫應(yīng)用TiltBrushFacebook:視頻描述生成

架構(gòu)跨媒體間橋梁新特征4:跨媒體推理已經(jīng)興起在語言、視覺、圖形和聽覺之間語義貫通,是實現(xiàn)聯(lián)想、推理、概括等智能的重要關(guān)鍵9新特征5:無人系統(tǒng)迅速發(fā)展機械手在工業(yè)裝配線上發(fā)展迅速在靈活運動的領(lǐng)域中,無人系統(tǒng)迅猛發(fā)展的速度遠(yuǎn)快于機器人因為人類或類動物的機器人,往往不如對機械進(jìn)行智能化和自主化升級來得高效10人工智能3.0第四節(jié)AI技術(shù)的新特征AI走向3.0認(rèn)知計算AI3.0面對的挑戰(zhàn)我們正在進(jìn)入AI3.0時代人工智能基礎(chǔ)理論和基礎(chǔ)學(xué)科建立的階段,AI的具體學(xué)科,比如語音識別、機器翻譯、自然語言處理、視覺等被建立起來,并形成了人工智能從業(yè)的方法論及學(xué)派AI1.0時代:1945-2005年以2006年谷歌翻譯上線為標(biāo)志的AI2.0時代,人工智能的發(fā)展從學(xué)術(shù)界到谷歌這樣的公司主導(dǎo),從以前的軍用到民用,產(chǎn)品從ToB到大規(guī)模的ToC的過程人工智能技術(shù)被廣泛用于各類智能產(chǎn)品之中算法(深度學(xué)習(xí))+數(shù)據(jù)(大數(shù)據(jù))+基礎(chǔ)設(shè)施(計算能力)AI2.0時代:2006-2016年從軟件到AI芯片,走向軟硬結(jié)合從信息到服務(wù)嶄新的、群雄逐鹿、百花齊放的時代AI3.0時代:2017-20xx年淺層次動因:需求、環(huán)境和技術(shù)社會新需求爆發(fā):智能城市、智能醫(yī)療、智能交通、智能游戲、無人駕駛、智能制造等等AI的基礎(chǔ)和目標(biāo)巨變:大數(shù)據(jù)、多媒體、傳感器網(wǎng)、增強實現(xiàn)(AR)、虛擬實現(xiàn)(VR)等等計算機模擬人的智能人機智能群體智能信息環(huán)境巨變:互聯(lián)網(wǎng)、移動計算、超級計算、穿戴設(shè)備、物聯(lián)網(wǎng)、云計算、網(wǎng)上社區(qū)、萬維網(wǎng)、搜索引擎等等人工智能邁向新一代AI走向3.0的原因分析14PHCPH深層次分析:世界正從原來的二元空間進(jìn)入新的三元空間世界原來是二元空間:人類社會空間(H)和物理空間(P)。但近年來,信息力量的迅速壯大,已長成除P、H兩極之外的新一極:信息空間(C)。15信息來自于人類社會:書籍、交流、媒體、計算機信息開始互聯(lián):互聯(lián)網(wǎng)、移動通訊和搜索信息繞過人類,直接來自于物理世界:傳感器和物聯(lián)網(wǎng)產(chǎn)生大數(shù)據(jù):信息快速膨脹,人類已無法單獨處理從大數(shù)據(jù)必然會走向大知識,并推動人類認(rèn)識與控制能力的大變化近50年來,信息空間成長壯大的歷程從AI落后人類的原因看大知識(智能大數(shù)據(jù))面臨的挑戰(zhàn)強在記憶能力和計算能力,但是自我學(xué)習(xí)、舉一反三的能力還不如5歲孩子面對未知環(huán)境的變化,未知的任務(wù),決策能力很弱AI智能學(xué)習(xí)與創(chuàng)新的能力:理解尤其是對整體環(huán)境的理解能力,可以通過經(jīng)驗來學(xué)習(xí)新事物,獲得新知識,并具備觸類旁通的能力對于信息(不完全信息,模糊信息)的分析和決策能力人類智慧大知識需要結(jié)合大數(shù)據(jù)資源和AI的神經(jīng)網(wǎng)絡(luò)、符號智能、知識挖掘、人機交互等技術(shù)結(jié)合起來,不僅解決可解釋性、通用性問題,而且形成新技術(shù),實現(xiàn)新應(yīng)用技術(shù)融合依靠大數(shù)據(jù)的深度學(xué)習(xí)和增強學(xué)習(xí)是AI當(dāng)前最普遍成功的技術(shù)之一。但是,深度學(xué)習(xí)需要大量的標(biāo)注數(shù)據(jù),又是黑箱算法,其結(jié)果難以解釋,而且只能專用,因為它和人類使用的知識形式差距太大AI技術(shù)現(xiàn)狀從PH到CPH的人類空間演變并未結(jié)束,而正在深化。AI走向3.0正是這種深化演變?yōu)榈囊粋€結(jié)果AI2.0互聯(lián)網(wǎng)多媒體、傳感器人機交互自主裝備大數(shù)據(jù)新一代人工智能自主智能系統(tǒng)群體智能智能大數(shù)據(jù)跨媒體智能人機混合增強智能AI走向3.0認(rèn)知智能能理解會思考感知智能能聽會說、能看會認(rèn)計算智能能存會算新一代AI的技術(shù)方向空間變化帶來了認(rèn)知的新門類、新通道、新計算P物理空間C信息空間H人類社會自然科學(xué)工程技術(shù)多媒體與傳感信息大數(shù)據(jù)自主裝備大數(shù)據(jù)、互聯(lián)網(wǎng)社區(qū)VRAR人機交互學(xué)習(xí)、預(yù)測、創(chuàng)造社會科學(xué)新認(rèn)知17新門類:認(rèn)識復(fù)雜巨系統(tǒng):城市運行系統(tǒng)、環(huán)境生態(tài)系統(tǒng)、健康醫(yī)療系統(tǒng)(科學(xué)+工程+社會+影響)新通道:給自然科學(xué)、工程技術(shù)、社會科學(xué)提供了新途徑、新方法新計算:AI2.0:建立在新老空間的互動CH、CP之上的AI知識表達(dá)神經(jīng)網(wǎng)絡(luò)也可以認(rèn)為是一類新的知識表達(dá),可標(biāo)記為NN+W(權(quán))

——W是數(shù)據(jù)表達(dá)的,可由學(xué)習(xí)自動生成

——NN是結(jié)構(gòu),由軟件或硬件生成AI使用的知識表達(dá)還有另兩類:符號型:可表達(dá)為概念、命題、推理(邏輯、歸納、聯(lián)想……)形象型:可表達(dá)為形象(圖形、動畫、圖像、視頻、聲音……)、結(jié)構(gòu)、情景其中,形象型還可分為兩類:——圖形形象類:圖形、動畫……(人工表達(dá))——圖像形象類:圖像、視頻、聲音……(傳感器表達(dá))23知識表達(dá)面臨的挑戰(zhàn)上表中x處,就是大數(shù)據(jù)智能需對付的挑戰(zhàn)圖像形象類:機器不可理解——模式識別技術(shù)

?

機器不能推理——跨媒體技術(shù)

?NN+W:

人不可理解——跨知識表達(dá)

?

機器不可推理——跨知識推理

?圖形形象類的表達(dá)只用于圖形學(xué),能與其他表達(dá)跨越使用嗎?知識能綜合上述技術(shù)而表達(dá)嗎?知識表達(dá)人可理解機器可理解機器推理符號√√√圖形形象類√√√圖像形象類√××NN+W×√×匯總四種表達(dá)的優(yōu)缺點如右大知識的關(guān)鍵:新知識生成問題求解的目標(biāo)與模式識別的目標(biāo)有較大差異。模式識別目標(biāo):分類(如對、錯)問題求解目標(biāo):方案(如規(guī)劃、處方、設(shè)計等)。往往還需說明方案如何解決問題。——因此,自動生成新知識是問題求解的關(guān)鍵。各種生成新知識的工具:傳統(tǒng)工具:邏輯推理、范例推理(CBR)新工具:自動博弈的(如AlphaGo)、知識圖譜推理(如股權(quán)發(fā)現(xiàn))、綜合推理、統(tǒng)計推理(IBMWatson)新進(jìn)展:MITAILab:自主瀏覽網(wǎng)頁進(jìn)行空白知識填補的能力;DeepMind:開發(fā)新AI技術(shù)利用外部記憶來解決需要邏輯推理才能完成的任務(wù)26人工智能面臨挑戰(zhàn)第四節(jié)AI技術(shù)的新特征AI走向3.0認(rèn)知計算AI3.0面對的挑戰(zhàn)認(rèn)知計算認(rèn)知計算是指一種能夠規(guī)模化學(xué)習(xí)、有目的推理、并與人類自然交互的系統(tǒng)。它們不需要事先精確地編程,而是從它們與我們之間的交互和與環(huán)境之間的互動中學(xué)習(xí)和推理認(rèn)知系統(tǒng)是概率性的。認(rèn)知系統(tǒng)不僅能回答大量的問題,還能對更加復(fù)雜(且有意義)的數(shù)據(jù)提出假說、推理論述和建議認(rèn)知系統(tǒng)還能理解「非結(jié)構(gòu)化」的數(shù)據(jù)(全世界數(shù)據(jù)的80%),這使得它們能夠跟上現(xiàn)代世界巨量、復(fù)雜和不可預(yù)測的信息認(rèn)知計算的成功并不以圖靈測試或模擬人類的能力作為判斷標(biāo)準(zhǔn)。它的標(biāo)準(zhǔn)更加實際,例如投資報酬率、新的市場機會、治療疾病和拯救生命新的「人-機共生」的人機關(guān)系讓人與計算機能夠協(xié)作決策,控制復(fù)雜情況,綜合了機器的數(shù)據(jù)分析、統(tǒng)計推斷能力,以及人類特殊能力,比如自我引導(dǎo)的目標(biāo)、常識和價值觀認(rèn)知的定義認(rèn)知(cognition)是人們推測和判斷客觀事物的心理過程,是在過去的經(jīng)驗及有關(guān)線索進(jìn)行分析的基礎(chǔ)上形成的對信息的理解、分類、歸納、演繹和計算認(rèn)知活動包括思維、語言、定向和意識4部分認(rèn)知反映個體的思維能力,是制定和執(zhí)行護(hù)理計劃的依據(jù)認(rèn)知計算系統(tǒng)WatsonServicesAPICatalog語言類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論