人工智能基礎(chǔ)課程課件_第1頁
人工智能基礎(chǔ)課程課件_第2頁
人工智能基礎(chǔ)課程課件_第3頁
人工智能基礎(chǔ)課程課件_第4頁
人工智能基礎(chǔ)課程課件_第5頁
已閱讀5頁,還剩76頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

人工智能基礎(chǔ)工業(yè)互聯(lián)網(wǎng)學(xué)院

2018年6月集團師級工業(yè)互聯(lián)網(wǎng)培訓(xùn)課程之(高中版)人工智能基礎(chǔ)工業(yè)互聯(lián)網(wǎng)學(xué)院集團師級工業(yè)互聯(lián)網(wǎng)培訓(xùn)課程之(1課程目標(biāo)系統(tǒng)了解人工智能發(fā)展簡史,掌握人工智能的基本思想和理念系統(tǒng)了解人工智能在各行各業(yè)具體應(yīng)用的場景和功能,掌握人工智能基本概念和基礎(chǔ)知識系統(tǒng)掌握人工智能方法和技術(shù)的具體應(yīng)用,能正確理解機器學(xué)習(xí)和強化學(xué)習(xí)的方法課時安排:4H課程對象:集團全體師級干部課程目標(biāo)系統(tǒng)了解人工智能發(fā)展簡史,掌握人工智能的基本思想和理2課程安排基礎(chǔ)篇:人工智能發(fā)展簡史01應(yīng)用篇:構(gòu)建人工智能系統(tǒng)02進階篇:人工智能與機器學(xué)習(xí)03課程安排基礎(chǔ)篇:人工智能發(fā)展簡史01應(yīng)用篇:構(gòu)建人工智能系統(tǒng)301基礎(chǔ)篇:人工智能發(fā)展簡史

“智能+”的未來人工智能的出現(xiàn)及發(fā)展人工智能概述01基礎(chǔ)篇:人工智能發(fā)展簡史“智能+”的未來人工智能4人工智能發(fā)展簡史

在現(xiàn)代社會便利與舒適的生活背后,是一場正在深刻地改變?nèi)藗兩钆c社會的的科技浪潮----人工智能。

十年前仍是科幻小說里的場景,今天已經(jīng)成為我們真實的生活經(jīng)歷。在人工智能浪潮的驅(qū)動下,十年之后我們會生活在什么樣的世界里面呢?前言人工智能發(fā)展簡史 在現(xiàn)代社會便利與舒適的生活背后,是一場正在5“智能+”的未來跨越時空:銘銘的一天場景1場景2場景3場景4場景5思考:在這些未來的生活場景中,人工智能的應(yīng)用有哪些?“智能+”的未來跨越時空:銘銘的一天場景1場景2場景3場景46“智能+”的未來智能+未來

家庭

城市

汽車…….什么是智能?幫你算數(shù)學(xué)?幫你洗衣服?幫你…人工智能學(xué)家

or數(shù)學(xué)家、物理學(xué)家、科學(xué)家跟我們想的是一樣的嗎?知識的表達與推理

智慧

是一種計算過程?“智能+”的未來智能+未來什么是智能?人工智能學(xué)家or數(shù)7“智能+”的未來什么是人工智能?其實,廣義的人工智能,或是人工智能,是很復(fù)雜的Ex:知識定義、知識表達、知識推理“智能+”的未來什么是人工智能?其實,廣義的人工智能,或是人8人工智能的出現(xiàn)及發(fā)展人工智能的橫空出世1950年,艾倫?圖靈(AlanTuring)在他的論文中提出了著名的“圖靈測試”(Turing

Test)被廣泛認為是測試機器智能的重要標(biāo)準(zhǔn)。圖靈測試:一位人類測試員會通過文字與密室里的一臺機器和一個人對話。如果測試員無法分辨與之對話的兩個實體誰是人誰是機器,參與對話的機器就被認為通過圖靈測試。圖靈測試人工智能的出現(xiàn)及發(fā)展人工智能的橫空出世1950年,艾倫?圖靈9人工智能的出現(xiàn)及發(fā)展人工智能的橫空出世1951年,研究生馬文?閔斯基(Marvin

Minsky)建立了世界上第一個神經(jīng)網(wǎng)路機器SNARC(Stochastic

Neural

Analog

Reinforcement

Calculator)。人們第一次模擬了神經(jīng)信號的傳遞,為人工智能奠定了深遠的基礎(chǔ)。馬文?閔斯基人工智能的出現(xiàn)及發(fā)展人工智能的橫空出世1951年,研究生馬文10人工智能的出現(xiàn)及發(fā)展人工智能的橫空出世1955年,艾倫?紐厄爾(Alan

Newell)、赫伯特?西蒙(Herbert

Simon)和克里夫?肖(Cliff

Shaw)建立了“邏輯理論家”計算機程序來模擬人類解決問題的技能,此項工作開創(chuàng)了一種日后被廣泛應(yīng)用的方法:搜索推理(reasoning)。艾倫?紐厄爾赫伯特?西蒙人工智能的出現(xiàn)及發(fā)展人工智能的橫空出世1955年,艾倫?紐厄11人工智能的出現(xiàn)及發(fā)展人工智能的橫空出世1956年,閔斯基、約翰?麥卡錫(JohnMcCarthy)、克勞的?香農(nóng)(Claude

Shannon)和納撒尼爾?羅切斯特(NathanRochester)在美國達特茅斯學(xué)院組織了一次會議,此會議宣告了“人工智能”作為一門新學(xué)科的誕生。2006年,會議五十年后,當(dāng)事人重聚達特茅斯。左起:摩爾,麥卡錫,明斯基,賽弗里奇,所羅門諾夫達特茅斯樓人工智能的出現(xiàn)及發(fā)展人工智能的橫空出世1956年,閔斯基、約12人工智能的出現(xiàn)及發(fā)展人工智能的第一次浪潮(1956-1974)1963年,美國高等研究計劃局投入兩百萬美元給麻省理工學(xué)院,培養(yǎng)了早期的計算機科學(xué)和人工智能人才。1964-1966年,約瑟夫?維森鮑姆(Joseph

Weizenbaum)教授建立了世界上第一個自然語言對話程序ELIZA,可以通過簡單的模式匹配和對話規(guī)則與人聊天。70年代中期,人工智能還是難以滿足社會對這個領(lǐng)域不切實際的期待,因此進入了第一個冬天。人工智能的出現(xiàn)及發(fā)展人工智能的第一次浪潮(1956-197413人工智能的出現(xiàn)及發(fā)展人工智能的第二次浪潮(1980-1987)80年代,由于專家系統(tǒng)和人工神經(jīng)網(wǎng)絡(luò)的新進展,人工智能浪潮再度興起。1980年,卡耐基梅隆大學(xué)為迪吉多公司開發(fā)了一套名為XCON的專家系統(tǒng),這套系統(tǒng)當(dāng)時每年可為迪吉多公司節(jié)省4000萬美元。XCON的巨大價值激發(fā)了工業(yè)界對人工智能尤其專家系統(tǒng)的熱情。1982年,約翰?霍普菲爾德提出了一種新型的網(wǎng)絡(luò)形式,即霍普菲爾德神經(jīng)網(wǎng)絡(luò),其中引入了相關(guān)存儲(associative

memory)的機制。1986年,《通過誤差反向傳播學(xué)習(xí)表示》論文的發(fā)表,使反向傳播算法被廣泛用于人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。80年代后期,由于專家系統(tǒng)開發(fā)與維護的成本高昂,而商業(yè)價值有限,人工智能的發(fā)展再度步入冬天。愛德華?費根鮑姆“專家系統(tǒng)之父”人工智能的出現(xiàn)及發(fā)展人工智能的第二次浪潮(1980-198714人工智能的出現(xiàn)及發(fā)展人工智能的第三次浪潮(2011-現(xiàn)在)21世紀(jì),人類邁入了“大數(shù)據(jù)”時代,此時電腦芯片的計算能力高速增長,人工智能算法也因此取得重大突破。研究人工智能的學(xué)者開始引入不同學(xué)科的數(shù)學(xué)工具,為人工智能打造更堅實的數(shù)學(xué)基礎(chǔ)。在數(shù)學(xué)的驅(qū)動下,一大批新的數(shù)學(xué)模型和算法被發(fā)展起來,逐步被應(yīng)用于解決實際問題,讓科學(xué)家看到了人工智能再度興起的曙光。2012年全球的圖像識別算法競賽ILSVRC(或稱ImageNet挑戰(zhàn)賽)中,多倫多大學(xué)開發(fā)的多層神經(jīng)網(wǎng)絡(luò)Alex

Net取得了冠軍,且大幅超越傳統(tǒng)算法的亞軍,引起了人工智能學(xué)界的震動。從此,多層神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的深度學(xué)習(xí)被推廣到多個應(yīng)用領(lǐng)域。2016年谷歌通過深度學(xué)習(xí)訓(xùn)練的阿爾法狗(AlphaGo)程序戰(zhàn)勝圍棋世界冠軍李世石。人工智能的出現(xiàn)及發(fā)展人工智能的第三次浪潮(2011-現(xiàn)在)215人工智能的出現(xiàn)及發(fā)展西洋棋機器人工智能的出現(xiàn)及發(fā)展西洋棋機器16人工智能概述人工智能的定義人工智能是通過機器來模擬人類認知能力的技術(shù)。人工智能的核心能力:根據(jù)給定的輸入作出判斷或預(yù)測人臉識別:根據(jù)輸入的照片,判斷照片的人是誰。語音識別:根據(jù)人說話的音頻信號,判斷說話內(nèi)容。醫(yī)療診斷:根據(jù)輸入的醫(yī)療影像,判斷疾病的成因和性質(zhì)。電子商務(wù):根據(jù)用戶的購買記錄,預(yù)測他對什么

商品感興趣,而作出相應(yīng)推薦。金融應(yīng)用:根據(jù)一支股票過去的價格和交易信息,

判斷它未來的價格走勢。人工智能概述人工智能的定義人工智能是通過機器來模擬人類認知能17人工智能概述人工智能的應(yīng)用安防智能視頻分析技術(shù)可以代替民警做很多事情實時從視頻中檢測出人和車輛自動找到視頻中異常的行為,并及時發(fā)出帶有具體地點方位信息的警報自動判斷人群的密度和人流的方向,提前發(fā)現(xiàn)過密人群帶來的潛在危險,幫助工作人員引導(dǎo)和管理人流。人工智能概述人工智能的應(yīng)用安防實時從視頻中檢測出人和車輛18人工智能概述人工智能的應(yīng)用醫(yī)療為解決“看病難”的問題提供了新的思路。對醫(yī)學(xué)影像進行自動分析技術(shù)的研究和應(yīng)用,可以為醫(yī)生診斷提供參考信息,有效的減少誤診和漏診。有些新技術(shù)還能通過多張醫(yī)療影像建出人體器官的三維模型,確保醫(yī)生手術(shù)更加精準(zhǔn)。人工智能概述人工智能的應(yīng)用醫(yī)療對醫(yī)學(xué)影像進行自動分析技術(shù)的研19人工智能概述人工智能的應(yīng)用智能客服隨著互聯(lián)網(wǎng)和電子商務(wù)的發(fā)展,我們和商家的交流變得越來越多元,為了因應(yīng)這種挑戰(zhàn),很多企業(yè)開始引入人工智能技術(shù)打造智能客服系統(tǒng)。智能客服可以像人一樣和客戶交流溝通,進行準(zhǔn)確得體且個性化的回應(yīng),提升客戶的體驗。對企業(yè)來說,這樣的系統(tǒng)不僅能夠提高回應(yīng)客戶的效率,還能自動的對客戶的需求和問題進行統(tǒng)計和分析,為之后的決策提供數(shù)據(jù)。人工智能概述人工智能的應(yīng)用智能客服隨著互聯(lián)網(wǎng)和電子商務(wù)的發(fā)展20人工智能概述人工智能的應(yīng)用自動駕駛自動駕駛汽車通過多種傳感器,包括視頻攝像頭、激光雷達、衛(wèi)星定位系統(tǒng)等,對駕駛環(huán)境進行實時感知。智能駕駛系統(tǒng)可以對多種感知信號進行綜合分析,實時規(guī)劃駕駛路線,控制車子的運行。人工智能概述人工智能的應(yīng)用自動駕駛自動駕駛汽車通過多種傳感器21工業(yè)制造系統(tǒng)必須變得更加“聰明”,而人工智能則是提升工業(yè)制造系統(tǒng)的最強動力。人工智能概述人工智能的應(yīng)用工業(yè)制造例如:品質(zhì)監(jiān)控是生產(chǎn)過程中最重要的環(huán)節(jié),傳統(tǒng)生產(chǎn)線上都安排大量的檢測工人用肉眼進行質(zhì)量檢測。這種方式不僅容易漏檢和誤判,更會給工人造成疲勞傷害。因此很多任務(wù)業(yè)產(chǎn)品公司開發(fā)使用人工智能的視覺工具,幫助工廠自動檢測出形態(tài)各異的缺陷。工業(yè)制造系統(tǒng)必須變得更加“聰明”,而人工智能則是提升工業(yè)制造22人工智能概述智能從何而來?

人工智能如何自動做出判斷或預(yù)測專家系統(tǒng):基于人工定義的規(guī)則來回答特定問題(局限性)機器學(xué)習(xí)(machinelearning)

通過學(xué)習(xí)(learning)來獲得進行預(yù)測或判斷的能力,

這樣的方法已經(jīng)成為人工智能的主流方法。人工智能概述智能從何而來?人工智能如何自動做出判斷或預(yù)測23人工智能概述機器學(xué)習(xí)的方法從數(shù)據(jù)中學(xué)習(xí)從已知數(shù)據(jù)去學(xué)習(xí)數(shù)據(jù)中蘊含的規(guī)律或判斷規(guī)則,再把學(xué)到的規(guī)則應(yīng)用到新數(shù)據(jù)并作出判斷或預(yù)測方式監(jiān)督學(xué)習(xí):

要求為每個樣本提供預(yù)測量的真實值2.無監(jiān)督學(xué)習(xí):

不要求為每個樣本提供預(yù)測量的真實值3.半監(jiān)督學(xué)習(xí):

介于監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)之間人工智能概述機器學(xué)習(xí)的方法從數(shù)據(jù)中學(xué)習(xí)監(jiān)督學(xué)習(xí):24人工智能概述機器學(xué)習(xí)的方法在行動中學(xué)習(xí)在機器學(xué)習(xí)的實際應(yīng)用中,還會遇到另一種類型的問題:利用學(xué)習(xí)得到的模型來指導(dǎo)行動。比如下棋,此時關(guān)注的不是某個判斷是否準(zhǔn)確,而是行動過程中能否帶來最大效益,又稱為強化學(xué)習(xí)。強化學(xué)習(xí)模型結(jié)構(gòu):可動態(tài)變化的狀態(tài)(state)可選取的動作(action)可以和決策主體進行交互的環(huán)境(environment)回報(reward)規(guī)則Q-Learning:Agent主體會根據(jù)實際環(huán)境反饋進行調(diào)整人工智能概述機器學(xué)習(xí)的方法在行動中學(xué)習(xí)可動態(tài)變化的狀態(tài)(st25人工智能概述小結(jié)人工智能是研究如何通過機器來模擬人類認知能力的學(xué)科,通過幾十年的努力,人工智能已經(jīng)獲得了長足的發(fā)展,且在多個行業(yè)得到了成功的應(yīng)用。人工智能這一新興科技正在改變我們的世界并影響著我們的生活,但這僅僅只是個開始,人工智能過去的發(fā)展為我們展現(xiàn)了一個令人激動的前景,這個更美好的時代需要我們共同努力去創(chuàng)造。人工智能概述小結(jié)人工智能是研究如何通過機器來模擬人類認知能力2602應(yīng)用篇:構(gòu)建人工智能系統(tǒng)特征與分類器識圖認物析音賞樂看懂視頻02應(yīng)用篇:構(gòu)建人工智能系統(tǒng)特征與分類器識圖認物析音賞27構(gòu)建人工智能系統(tǒng)前言人工智能系統(tǒng)處理的是各種各樣的數(shù)據(jù):圖像、聲音、文字、視頻等等數(shù)據(jù)(Data)是信息的載體分類(Classification)是根據(jù)所給數(shù)據(jù)的不同特點,判斷它屬于哪種類別構(gòu)建人工智能系統(tǒng)前言人工智能系統(tǒng)處理的是各種各樣的數(shù)據(jù):圖像28特征與分類器數(shù)據(jù)類型和相關(guān)應(yīng)用數(shù)據(jù)類型示意圖相關(guān)應(yīng)用圖像(照片、圖畫)詳見第三章基于圖像的人臉辨識、物體分類、場景理解圖像處理、藝術(shù)風(fēng)格轉(zhuǎn)換、圖片生成聲音(語音、音樂)詳見第四章語音識別、機器對話、對話理解聽歌識曲、自動譜曲視頻(影視)詳見第五章視頻分類、內(nèi)容理解、查找檢索視頻總結(jié)、自動生成視頻文字詳見第七章文章聚類、閱讀理解自動生成文章其它數(shù)據(jù)類型詳見第九章等棋譜數(shù)據(jù)在AlphaGo中使用基因測序數(shù)據(jù)輔助疾病的預(yù)測診斷特征與分類器數(shù)據(jù)類型和相關(guān)應(yīng)用數(shù)據(jù)類型示意圖相關(guān)應(yīng)用圖像(照29特征與分類器分類的基本概念和流程例:對鳶尾花的兩個品種進行分類。全世界大約有300個品種,其中,常見的有變色鳶尾(irisversicolor)及山鳶尾(irissetosa)。如何構(gòu)建一個簡單的人工智能系統(tǒng),它能夠像人類一樣區(qū)分變色鳶尾和山鳶尾?特征與分類器分類的基本概念和流程例:對鳶尾花的兩個品種進行分30特征與分類器分類的基本概念和流程分類器(Classifier):能完成分類任務(wù)的人工智能系統(tǒng)構(gòu)建該系統(tǒng)的流程:首先提取鳶尾花的特征然后將這些特征輸入到訓(xùn)練好的分類器中分類器根據(jù)特征做出預(yù)測,輸出鳶尾花的品種特征與分類器分類的基本概念和流程分類器(Classifier31特征與分類器提取特征的方法特征(feature):對事物的某方面的特點進行刻畫的數(shù)字或者屬性特征的質(zhì)量很大程度上決定了分類器最終分類效果的好壞不同類型的數(shù)據(jù),不同的特征提取方法

特征與分類器提取特征的方法特征(feature):對事物的某32特征與分類器分類器定義:分類器是一個由特征向量到預(yù)測類別的函數(shù)

特征與分類器分類器定義:分類器是一個由特征向量到預(yù)測類別的函33特征與分類器訓(xùn)練分類器

讓分類器學(xué)習(xí)得到合適參數(shù)的過程稱為分類器的訓(xùn)練

目的:提升人工智能系統(tǒng)的性能工智能系統(tǒng)是通過什么來進行學(xué)習(xí)呢?

Ans:數(shù)據(jù)

數(shù)據(jù)為人工智能的支柱之一,人工智能系統(tǒng)的訓(xùn)練需要大量的數(shù)據(jù)作為支撐。訓(xùn)練階段使用的數(shù)據(jù)被稱為訓(xùn)練數(shù)據(jù)。測試階段使用的數(shù)據(jù)被稱為測試數(shù)據(jù)。在分類的過程中,訓(xùn)練和測試數(shù)據(jù)需要實際的類別分類。數(shù)據(jù)標(biāo)注的過程是耗時耗力的,數(shù)據(jù)標(biāo)注是需要相關(guān)領(lǐng)域的專業(yè)知識,且標(biāo)注的質(zhì)量會直接影響到訓(xùn)練后人工智能系統(tǒng)性能的好壞。特征與分類器訓(xùn)練分類器讓分類器學(xué)習(xí)得到合適參數(shù)的過程稱為分34特征與分類器訓(xùn)練線性分類器的算法

感知器的訓(xùn)練過程示意圖

感知器(perceptron)是一種訓(xùn)練線性分類器的算法特征與分類器訓(xùn)練線性分類器的算法感知器的訓(xùn)練過程示意圖35特征與分類器訓(xùn)練線性分類器的算法

支持向量機的訓(xùn)練過程示意圖

一般地,一個點距離分類直線的遠近可以表示對分類預(yù)測的確信程度。特征與分類器訓(xùn)練線性分類器的算法支持向量機的訓(xùn)練過程示意圖36特征與分類器訓(xùn)練線性分類器的算法

算法:基于數(shù)據(jù)集來訓(xùn)練分類器的過程,其過程是由一系列判斷和計算的步驟所組成的,稱之為算法(Algorithm)1.感知器2.支持向量機感知器學(xué)習(xí)算法不斷減少對數(shù)據(jù)誤分類的過程

利用被誤分類的訓(xùn)練數(shù)據(jù)調(diào)整現(xiàn)有的分類器的參數(shù),使得調(diào)整后的分類器判斷更準(zhǔn)確。參數(shù)更新的規(guī)則

損失函數(shù)(度量分類器輸出錯誤的數(shù)學(xué)化表示)

優(yōu)化方法(調(diào)整分類器的參數(shù))SVM(support

vector

machine)

是在特征空間上分類間隔最大的分類器,是對兩個類別進行分類。結(jié)論

一個點距離分類直線越遠,分類預(yù)測的可信程度越高特征與分類器訓(xùn)練線性分類器的算法算法:基于數(shù)據(jù)集來訓(xùn)練分類37特征與分類器測試與應(yīng)用

若想知道分類器的分類效果如何,哪一個學(xué)習(xí)算法的分類器效能最好,需透過測試階段來進行驗證測試:評判分類器表現(xiàn)的好壞,選擇最優(yōu)分類器應(yīng)用:分類器在實際情況中的使用

以鳶尾花的例子,測試數(shù)據(jù)中有一朵鳶尾花,它的花瓣長度是1.5厘米,寬度是0.4厘米,其測試樣本的特征向量(1.5,0.4),位于山鳶尾的一側(cè),故此朵鳶尾花為山鳶尾。

特征與分類器測試與應(yīng)用若想知道分類器的分類效果如何,哪一個38特征與分類器多類別分類由圖所示,目前有三個分類器,分別為牡丹、荷花、梅花的分類器,它們只負責(zé)區(qū)分某一個類別的分類。當(dāng)輸入一張圖片的特征向量后,三個分類器都可能夠輸出自己的預(yù)測,綜合三個預(yù)測結(jié)果,最終能夠得到多分類的預(yù)測結(jié)果。若f1輸出為正,f2,f3輸出為負,那可以確定的說類別為牡丹f1,f2,f3的輸出值是通過一個歸一化指數(shù)函數(shù),轉(zhuǎn)他成概率-說明輸入物體屬于某一類的可能性。特征與分類器多類別分類由圖所示,目前有三個分類器,分別為牡丹39特征與分類器二分類的應(yīng)用

感生活中遇到的『是不是問題』都屬于二分類的范疇相機中的人臉檢測癌癥檢測1.首先,一張照片被切成一塊塊圖像塊2.每一圖像塊皆經(jīng)過人臉分類器去判別是否為人臉**人臉分類器是預(yù)先訓(xùn)練好的分類器人臉檢測中出現(xiàn)多的框,擷取不同位子,尺寸的圖像塊,可通過融合技術(shù),將其融合,得至右圖結(jié)果。

判斷生物組織樣本的每一個區(qū)域是否有腫瘤特征與分類器二分類的應(yīng)用感生活中遇到的『是不是問題』都屬于40認圖識物基于手工特征的圖像分類例:銘銘的相冊中有許多圖片。如何設(shè)計一個用于對圖片進行分類的系統(tǒng),它能夠像人類一樣識別照片中的物體是什么類別?問題:計算機眼中的圖片是什么樣子的?認圖識物基于手工特征的圖像分類例:銘銘的相冊中有許多圖片。如41認圖識物計算機眼中的圖像數(shù)字組成的矩陣灰度圖像和彩色圖像彩色圖像(R,G,B)表示顏色行數(shù)與列數(shù)(分辨率)圖像(1280X720X3)在計算機中表示為三階張量認圖識物計算機眼中的圖像數(shù)字組成的矩陣42認圖識物圖像特征概念:能夠區(qū)分照片的特征手工設(shè)計了各種圖像特征:圖像顏色、邊緣、紋理等基本性質(zhì)計算機如何提取圖片特征圖像在計算機中可以表示成三階張量,對圖像特征的提取即對該三階張量進行運算的過程其中非常重要的一種運算是卷積卷積運算示例認圖識物圖像特征概念:能夠區(qū)分照片的特征卷積運算示例43認圖識物基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類深度神經(jīng)網(wǎng)絡(luò)分類系統(tǒng)由多個順序連接的層組成每一層以前一層提出的特征輸入,對其進行特定形式的變換由簡單到復(fù)雜,由低級到高級深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)

例:AlexNet神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖認圖識物基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類深度神經(jīng)網(wǎng)絡(luò)分類系統(tǒng)例44認圖識物基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)卷積層:深度神經(jīng)網(wǎng)絡(luò)處理圖像時十分常用的一種層,當(dāng)以卷積層為主體時,稱為卷積神經(jīng)網(wǎng)絡(luò)。全連接層:全連接層完成對特征向量的變換歸一化指數(shù)層:完成多類線性分類器中的歸一化指數(shù)函數(shù)計算,一般是分類網(wǎng)絡(luò)的最后一層,輸出為圖像屬于各個類別的概率。非線性激活層:保留特征每次變換的效果池化層:在幾個卷基層之后插入,降低特征圖的分辨率人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練反向傳播算法過擬合:在訓(xùn)練數(shù)據(jù)上表現(xiàn)良好,在未知數(shù)據(jù)上表現(xiàn)差。

欠擬合:在訓(xùn)練數(shù)據(jù)和未知數(shù)據(jù)上表現(xiàn)都很差。

梯度消失:優(yōu)化過程失去指導(dǎo),無法找到一個較好的解。認圖識物基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)過擬合45認圖識物圖像分類在日常生活中的應(yīng)用豐富的“刷臉”應(yīng)用場景人臉識別技術(shù)助力安防例如:人臉檢測跟蹤認圖識物圖像分類在日常生活中的應(yīng)用豐富的“刷臉”應(yīng)用場景例46析音賞樂聲音的數(shù)字化人耳聽音聲波由耳廓收集之后經(jīng)一系列結(jié)構(gòu)的傳導(dǎo)到達耳蝸,耳蝸內(nèi)豐富的聽覺感受器,可將聲音傳導(dǎo)到聽神經(jīng),最后引起聽覺。頻率是聲音的重要特征,代表了發(fā)聲物體在一秒內(nèi)振動的次數(shù),單位是赫茲。計算機聽音析音賞樂聲音的數(shù)字化人耳聽音47析音賞樂聲音的數(shù)字化計算機如何“理解”聲音頻譜三要素響度:最直觀的樂音要素,代表聲音的強弱,可由波形的幅度表示音調(diào):表示人聽到的聲音調(diào)子的高低,可用頻譜來描述音色:即不同的樂器演奏或者不同的人來演唱所產(chǎn)生不同的聽覺效果。頻譜圖中峰值之間的比例不同反映了聲音音色的不同吉他與鋼琴的波形與頻譜析音賞樂聲音的數(shù)字化計算機如何“理解”聲音吉他與鋼琴的波形與48析音賞樂音樂風(fēng)格的分類音樂風(fēng)格分類流程經(jīng)典的聲學(xué)特征:梅爾頻率倒譜系數(shù)MFCC(Mel-FrequencyCepstralCoefficients)特征的維數(shù)很低比頻譜更加有效,可以刻畫出頻譜的形狀可以描畫出不同頻率聲音的能量高低,還可以表達出聲音的一個重要特征:共振峰。析音賞樂音樂風(fēng)格的分類音樂風(fēng)格分類流程49析音賞樂音樂風(fēng)格的分類聲學(xué)特征提取過程提取MFCC特征利用深度學(xué)習(xí)方法完成分類(神經(jīng)網(wǎng)絡(luò))析音賞樂音樂風(fēng)格的分類聲學(xué)特征提取過程50析音賞樂語音識別技術(shù)語音識別的應(yīng)用語音識別(speech

recognition)

把人說的話轉(zhuǎn)化為文字或者機器可以理解的指令,從而實現(xiàn)人與機器的交流語音識別的流程分幀:把一段語音分成若干小段聲學(xué)模型:把每一幀識別為一個狀態(tài),把狀態(tài)組合成音素(聲母及韻母)語言模型:從同音字中挑選出正確的文字,將文字組成意義明確的語句析音賞樂語音識別技術(shù)語音識別的應(yīng)用51析音賞樂樂曲檢索技術(shù)樂曲檢索的流程窗口掃描:在樂曲上按照時間順序依次截取和音樂片段長度一致的段落計算距離:計算片段和所截段落的特征并計算它們的距離,片段與樂曲的距離即為上述距離的最小值檢索結(jié)果:與音樂片段距離最小的樂曲即為檢索的結(jié)果析音賞樂樂曲檢索技術(shù)樂曲檢索的流程52Single

FrameVideo看懂視頻從圖像到視頻視頻理解技術(shù)VideoUnderstanding計算機視覺領(lǐng)域的熱門方向之一應(yīng)用領(lǐng)域:視頻內(nèi)容分析、視頻監(jiān)控、人機交互、智能機器人等視頻:多個圖像依時間序列堆迭SingleFrameVideo看懂視頻從圖像到視頻視頻理53看懂視頻視頻行為識別行為(Action)執(zhí)行某一任務(wù)所發(fā)生一連串的動作,例如:投籃、跳水……行為識別(Action

Recognition):計算器分析視頻數(shù)據(jù),辨別出用戶行為的過程運動是判斷行為類別的重要特征行為識別的挑戰(zhàn)距離、光影、角度等因素都會影響計算器識別視頻行為的精準(zhǔn)度困難點行為類別差異過大(例:不同的人做出的刮胡子動作不盡相同)行為定義不明背景差異過大(例:看電視的行為,角度、人數(shù)、位置)看懂視頻視頻行為識別行為(Action)54看懂視頻運動的刻畫:光流光流(opticalflow)描述三維的運動點投影到二維圖像之后相應(yīng)的投影點位置讓計算機從序列化的圖像中得到人體的運動特征光流直方圖特征HOF(HistogramsofOpticalFlow)對視頻中的光流信息進行統(tǒng)計,表示出視頻中物體的運動信息看懂視頻運動的刻畫:光流光流(opticalflow)55看懂視頻運動的刻畫:光流視頻行為識別透過光流信息

該點再下一影格的位置

取得位移量

得到向量

得出軌跡看懂視頻運動的刻畫:光流視頻行為識別56看懂視頻基于深度學(xué)習(xí)的視頻行為識別雙流卷積神經(jīng)網(wǎng)絡(luò)(two-stream

CNN)靜態(tài)信息

物體的外觀動態(tài)信息

視頻序列中物體的動態(tài)信息用兩個不同的網(wǎng)絡(luò)實現(xiàn)同時處理靜態(tài)與動態(tài)訊息,非常適用于短視頻(10秒)看懂視頻基于深度學(xué)習(xí)的視頻行為識別雙流卷積神經(jīng)網(wǎng)絡(luò)(two-57看懂視頻基于深度學(xué)習(xí)的視頻行為識別時序分段網(wǎng)絡(luò)(temporal

segment

networks)適用于長視頻(幾分鐘)稀疏時間采樣(sparse

temporal

sampling)對于時間長度不同的數(shù)據(jù),根據(jù)時間先后分成固定的段落就像班上每個同學(xué)提交同一份作品,選最好的當(dāng)代表,也可以是大家分工不同部分一同完成看懂視頻基于深度學(xué)習(xí)的視頻行為識別時序分段網(wǎng)絡(luò)(tempor58構(gòu)建人工智能系統(tǒng)小結(jié)分類過程三階段特征提取、分類器的訓(xùn)練及測試應(yīng)用特征提取是由數(shù)據(jù)到特征向量的過程,是傳統(tǒng)分類方法中的重點分類器-感知器和支持向量機訓(xùn)練算法圖像、聲音、視頻等的不同特征提取方法人工智能系統(tǒng)實現(xiàn)圖像、聲音、視頻的智能分類與識別的過程構(gòu)建人工智能系統(tǒng)小結(jié)分類過程三階段5903進階篇:人工智能與機器學(xué)習(xí)讓人工智能更智能無監(jiān)督機器學(xué)習(xí)的方法阿爾法狗背后的秘密03進階篇:人工智能與機器學(xué)習(xí)讓人工智能更智能無監(jiān)督機器60讓人工智能更智能監(jiān)督學(xué)習(xí)需要訓(xùn)練數(shù)據(jù)的標(biāo)注信息的學(xué)習(xí)過程,就是監(jiān)督學(xué)習(xí)如:分類器從數(shù)據(jù)中學(xué)會了區(qū)分鳶尾花的品種如:對圖像、音頻和視頻的分類,都需要類別的標(biāo)注信息,都屬于監(jiān)督學(xué)習(xí)沒有類別的標(biāo)注信息供人工智能參考時,怎么辦?無監(jiān)督學(xué)習(xí)沒有標(biāo)注信息的學(xué)習(xí)過程無類別信息指導(dǎo)很難判斷哪一些鳶尾花是相同品種監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)“計算機能不能自動將照片整理好?”讓人工智能更智能監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)“計算機能不能自動61讓人工智能更智能“計算機能不能自動將照片整理好?”聚類(clustering)通過分析數(shù)據(jù)在特征空間的聚集情況,可以將一組數(shù)據(jù)分成不同的類。旨在把一群樣本分為多個集合,使得同一個集合內(nèi)的元素盡量“相似”或者“相近”是一種無監(jiān)督學(xué)習(xí)過程不需要數(shù)據(jù)的類別標(biāo)注不需要預(yù)先定義類別讓人工智能像真正的科學(xué)家一樣,自己發(fā)掘規(guī)律。讓人工智能更智能“計算機能不能自動將照片整理好?”聚類(cl62無監(jiān)督機器學(xué)習(xí)的方法K均值聚類算法問題的提出我們希望人工智能在不知道鳶尾花品種的前提下將這N朵鳶尾花分為K類,使得同一類樣本的特征相似程度高,而不同類樣本的特征相似程度低。算法主要思路先從任意一組劃分出發(fā),通過調(diào)整,逐步達成上述目標(biāo)算法步驟1.先計算鳶尾花的聚類中心2.針對矛盾樣本進行調(diào)整3.K均值聚類結(jié)果4.重復(fù)第2、3步驟,直到聚類中心與劃分方式不再發(fā)生變化無監(jiān)督機器學(xué)習(xí)的方法K均值聚類算法問題的提出63無監(jiān)督機器學(xué)習(xí)的方法K均值聚類算法聚類算法示例(鳶尾花分類問題)1.先計算鳶尾花的聚類中心2.針對矛盾樣本進行調(diào)整3.K均值聚類結(jié)果無監(jiān)督機器學(xué)習(xí)的方法K均值聚類算法聚類算法示例(鳶尾花分類問64無監(jiān)督機器學(xué)習(xí)的方法K均值聚類算法相冊中的人臉聚類只要我們能對照片中的人臉提取特征,用特征空間里的特征點表示每一張人臉,就能使用K均值算法將“相似”的人臉聚集起來了無監(jiān)督機器學(xué)習(xí)的方法K均值聚類算法相冊中的人臉聚類65無監(jiān)督機器學(xué)習(xí)的方法K均值聚類算法K值的確定----手肘法聚類數(shù)量過大會導(dǎo)致照片劃分得過細,這樣就失去了實用性,需要在平均距離與聚類數(shù)量之間取得平衡如圖,在K=3的時候,曲線產(chǎn)生了一個明顯的拐點,拐點后隨著K的增加平均距離減少得非常慢,因此K=3是個合適的選擇。(elbowmethod)無監(jiān)督機器學(xué)習(xí)的方法K均值聚類算法K值的確定----手肘法(66無監(jiān)督機器學(xué)習(xí)的方法主題模型與潛在語義分析技術(shù)潛在語義分析技術(shù)Latentsemanticanalysis針對文本數(shù)據(jù)“多主題”的特點而設(shè)計計算機可以借助該技術(shù),從海量的文本數(shù)據(jù)中自動發(fā)掘潛在的主題,進而完成對文本內(nèi)容的概括和提煉相關(guān)專有名詞語料庫(corpus):海量的文本數(shù)據(jù)文檔(document):語料庫中獨立的文本主題:文檔的中心思想或主要內(nèi)容無監(jiān)督機器學(xué)習(xí)的方法主題模型與潛在語義分析技術(shù)潛在語義分析技67無監(jiān)督機器學(xué)習(xí)的方法主題模型與潛在語義分析技術(shù)文本的特征詞袋模型

詞袋模型(bag-of-words

model)是用于描述文本的一個簡單的數(shù)學(xué)模型,常用文本特征提取方式之一。詞袋模型將一篇文文件看作是一個“裝有若干詞語的袋子”,只考慮詞語在文檔中出現(xiàn)的次數(shù),而忽略詞語的順序以及句子的結(jié)構(gòu)。利用詞袋模型構(gòu)建文本特征的基本流程無監(jiān)督機器學(xué)習(xí)的方法主題模型與潛在語義分析技術(shù)文本的特征68無監(jiān)督機器學(xué)習(xí)的方法主題模型與潛在語義分析技術(shù)文本的特征中文分詞

對中文文本進行詞袋構(gòu)建之前,我們還需要藉助額外的手段拆分詞語,這項技術(shù)稱為中文分詞。中文分詞方法大多基于匹配和統(tǒng)計學(xué)方法。停止詞與低頻詞停止詞:是文檔常出現(xiàn)的,構(gòu)成中文句子的基本字詞,對區(qū)分不同文文件的主題沒有任何幫助(不攜帶任何主題信息的高頻詞)低頻詞:通常是一些不常用的專有名詞,只出現(xiàn)于特定的文章中(比如姓名),不能代表某一主題。詞頻率與逆文檔頻率反映一個詞語對于一篇文檔的重要性的兩個指標(biāo)一個詞語在一篇文文件中出現(xiàn)的頻率即為詞頻率(team

frequency)借助逆文檔頻率(inversedocumentfrequency)來修正每個詞語在每篇文檔中的重要性無監(jiān)督機器學(xué)習(xí)的方法主題模型與潛在語義分析技術(shù)文本的特征69無監(jiān)督機器學(xué)習(xí)的方法主題模型與潛在語義分析技術(shù)發(fā)掘文本中潛在的主題主題模型(topic

model)是描述語料庫及其中潛在主題的一類數(shù)學(xué)模型將文文檔詞頻、主題比重、主題詞頻三者的關(guān)系表示為:D

=

WT,這個等式建立了語料庫與潛在主題之間的關(guān)系,是主題模型的核心。通過主題模型,我們建立了語料庫與其中潛在主題之間的關(guān)系無監(jiān)督機器學(xué)習(xí)的方法主題模型與潛在語義分析技術(shù)發(fā)掘文本中潛在70無監(jiān)督機器學(xué)習(xí)的方法生成對抗網(wǎng)絡(luò)概述generativeadversarialnetwork,GAN由“生成”、“對抗”和“網(wǎng)路”三個詞語構(gòu)成。其中“生成”是指它是一個生成模型(generativemodel),即它可以隨機生成觀測數(shù)據(jù)生成對抗網(wǎng)絡(luò)由生成網(wǎng)絡(luò)(generativenetwork)和判別網(wǎng)絡(luò)(discriminativenetwork)兩部分構(gòu)成生成網(wǎng)絡(luò):用于生成數(shù)據(jù)判別網(wǎng)絡(luò):用來分辨數(shù)據(jù)是真還是假基本思想:通過生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)之間的相互“對抗”來學(xué)習(xí)無監(jiān)督機器學(xué)習(xí)的方法生成對抗網(wǎng)絡(luò)概述71無監(jiān)督機器學(xué)習(xí)的方法生成對抗網(wǎng)絡(luò)數(shù)據(jù)空間與數(shù)據(jù)分布數(shù)據(jù)空間(dataspace)是數(shù)據(jù)所在的空間假定輸入圖片的分辨率為128x128,此時的數(shù)據(jù)空間就是所有形狀為128x128x3的張量的集合。此時每張圖片都是此空間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論