版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
AI遇見應用興趣引領未來人工智能基礎與應用
項目一初探人工智能人工智能基礎與應用課件全文共246頁,當前為第1頁。目錄教學目標教學要求內容概覽相關知識1.1.1機器能思考嗎? 1.1.2人工智能的發(fā)展歷程1.1.3人工智能的產業(yè)結構1.1.4人工智能砸了誰的飯碗練習與思考 人工智能基礎與應用
項目一初探人工智能人工智能基礎與應用課件全文共246頁,當前為第2頁。1.掌握人工智能發(fā)展以及與其他新技術的關系2.了解人工智能的發(fā)展歷程3.了解人工智能的產業(yè)結構、代表企業(yè)及人才培養(yǎng)要求4.思考人工智能可能替代哪些崗位、催生哪些就業(yè)機會【教學目標】人工智能基礎與應用課件全文共246頁,當前為第3頁。1.知識點AI發(fā)展歷程AI產業(yè)結構人工智能訓練師2.技能點理解人工智能的發(fā)展目標及與其他新技術的相互關系3.重難點通過本單元的學習,重點了解人工智能的產業(yè)結構、具體應用及對應的人才培養(yǎng)層次;難點是拓展學習人工智能訓練師誕生的職業(yè)背景,理解其崗位能力要求和數據標注及訓練的重要性?!窘虒W要求】人工智能基礎與應用課件全文共246頁,當前為第4頁?!緝热莞庞[】人工智能產業(yè)的基礎人工智能產業(yè)的核心人工智能產業(yè)的延伸項目一初探人工智能1.1.3人工智能的產業(yè)結構基礎支撐層(基礎層)技術驅動層(技術層)場景應用層(應用層)1.1.4人工智能砸了誰的飯碗你的職業(yè)未來會消失嗎?“人工智能訓練師”——你準備好了嗎?1.1.2人工智能的發(fā)展歷程1950s-1980s:AI起步期1980s-1990s:專家系統(tǒng)推廣1.1.1機器能思考嗎人工智能是什么?使機器具備以下能力:能聽、會說、能看、能思考、會學習、會行動、能應變人工智能發(fā)展階段第一層次:計算智能第二層次:感知智能第三層次:認知智能2000s-至今:深度學習-AI新熱潮計算硬件(AI芯片、傳感器等)其他支撐技術(大數據、云計算和5G)數據算法和平臺感知智能:圖像識別、生物識別、語音識別等行業(yè)應用場景(如“AI+”制造、交通、安防、醫(yī)療、物流、零售等)AI消費級終端產品(如智能汽車、機器人、無人機、可穿戴設備等)認知智能:機器學習、智能問答、知識圖譜等培養(yǎng)目標:持續(xù)訓練機器更“懂”人,通“人”性,更好地為人服務能力劃分:智能產品應用、數據分析、業(yè)務理解、智能訓練人工智能替代職業(yè)的概率排名及特點高端研究型人才研究型、應用型人才應用型、技術技能型人才人才需求非技術類“新職位”,“人工智能+專業(yè)應用”的新崗位人工智能基礎與應用課件全文共246頁,當前為第5頁?!霸啤薄拔铩薄按蟆薄爸恰蔽锫?lián)網:對接真實的物理世界,獲取海量數據;云計算:為海量數據提供強大的承載能力;大數據:對海量數據進行挖掘和分析,實現數據到信息的轉換;人工智能:對數據進行學習,對信息進行理解,最終實現數據到知識和智能的轉換。如果用人體來比喻,物聯(lián)網是人體的神經網絡,大數據是流動的血液,云計算是心臟,人工智能則是掌控的大腦?!鞠嚓P知識】人工智能基礎與應用課件全文共246頁,當前為第6頁。艾智訊AI小課堂:一起來了解“云”“物”“大”“智”
【相關知識】(點擊播放視頻?)人工智能基礎與應用課件全文共246頁,當前為第7頁。人工智能是什么?人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能與人類智能相似的方式做出反應的智能機器。概括來說,就是研究如何使機器具備以下能力:能聽(語音識別、機器翻譯等);會說(語音合成、人機對話等);能看(圖像識別、文字識別);能思考(人機對弈、定理證明等);會學習(機器學習、知識表示等);會行動(機器人、自定駕駛汽車等);能應變(認知智能、自主行動)。一、機器能思考嗎?人工智能基礎與應用課件全文共246頁,當前為第8頁。人工智能的研究領域包括語音識別、圖像識別、機器學習、深度學習、自然語言處理、知識圖譜、腦機互動等等。一、機器能思考嗎?
人工智能擬人能力圖人工智能基礎與應用課件全文共246頁,當前為第9頁。人工智能的智能水平人工智能像“人”一樣,其智能水平也在逐步發(fā)展,從低到高可劃分為計算智能、感知智能、認知智能三個階段。第一層次:計算智能——機器像人類一樣會計算、傳遞信息,例如神經網絡、遺傳算法等,各種棋類游戲、專家系統(tǒng)體現的就是計算智能。第二層次:感知智能——機器能聽會說、能看會認,像語音助手、人臉識別、看圖搜圖和無人駕駛等。第三層次:認知智能——機器能理解會思考,主動采取行動,這是人工智能領域專家們正在努力的方向,比如微軟小冰就具有非常初級的理解語意的能力。一、機器能思考嗎?人工智能基礎與應用課件全文共246頁,當前為第10頁。人工智能的智能水平三種智能水平的行業(yè)應用特點:第一種類型,信息完全輸入的狀況。在這種狀況下,機器得到輸入,就可以充分準確的得到相應的輸出。像實時語音轉寫,人臉識別、圖像識別等技術,“輸入”即可以得到“輸出”,在這一領域機器將來可以完全替代人工。第二種類型,是僅僅有輸入還不夠,還需要知識積累,需要思維判斷的工作。這一領域是人和機器耦合的,比如機器人可以回答孩子的問題,教孩子知識,和孩子玩耍,但不能完全代替父母陪伴孩子、和孩子實時交流等。這種場景下:機器無法完全替代人工,而是輔助人,人機耦合進行工作。第三種類型,沒有信息輸入,而是主要靠創(chuàng)意,靠想象力的工作。今天的機器可以作圖、作曲、寫詩,但更多還是模仿,讓機器具備思考的能力、主動創(chuàng)作的能力目前還很難做到。這是人工智能發(fā)展的未來趨勢之一,因此需要創(chuàng)意和想象力的工作是機器無法取代的。
一、機器能思考嗎?人工智能基礎與應用課件全文共246頁,當前為第11頁。人工智能的發(fā)展歷程可分為三段時期、6個階段。第一階段:人工智能起步期1956—1980s1956達特茅斯會議標志AI誕生1957神經網絡Perceptron被羅森布拉特發(fā)明;1964年,首臺聊天機器人誕生1970受限于計算能力,人工智能進入第一個寒冬第二階段:專家系統(tǒng)推廣1980s—1990s1980卡耐基梅隆大學推進第一個名為XCON的專家系統(tǒng),具有一套強大的知識庫和推理能力,可以模擬人類專家來解決特定領域問題,從此,機器學習開始興起20世紀80年代中-90年代中,專家系統(tǒng)應用有限,且經常在常識性問題上出錯,人工智能迎來第二個寒冬二、人工智能的發(fā)展歷程人工智能基礎與應用課件全文共246頁,當前為第12頁。第三階段:深度學習2000s—至今1997IBM的“深藍”戰(zhàn)勝國際象棋冠軍,成為人工智能史上的一個重要里程碑2006Hinton提出“深度學習”的神經網絡2012Google無人駕駛汽車上路,人工智能迎來爆發(fā)式增長的新高潮近十年來,隨著大數據、云計算、物聯(lián)網等信息技術的發(fā)展,以深度神經網絡為代表的人工智能技術飛速發(fā)展,大幅跨越了科學與應用之間的“技術鴻溝”,實現了從“不能用、不好用”到“可以用”的技術突破??傮w趨勢:人工智能的發(fā)展歷程曲折起伏,高峰與低谷交替出現。未來隨著人工智能核心技術的突破,將不斷改善提升現有的局限性,向各行各業(yè)快速滲透融合,這是人工智能驅動第四次技術革命的最主要表現方式。二、人工智能的發(fā)展歷程人工智能基礎與應用課件全文共246頁,當前為第13頁。人工智能的產業(yè)鏈劃分概覽三、人工智能的產業(yè)結構人工智能基礎與應用課件全文共246頁,當前為第14頁。基礎支撐層(基礎層)——人工智能產業(yè)的基礎主要是研發(fā)硬件及軟件,為人工智能提供數據及算力支撐。主要包括物質基礎:即計算硬件(AI芯片、傳感器)、計算系統(tǒng)技術(大數據、云計算和5G通信)、數據(數據采集、標注和分析)和算法模型。傳感器負責收集數據,AI芯片(GPU、FPGA、ASIC等)負責運算,算法模型負責訓練數據。三、人工智能的產業(yè)結構人工智能基礎與應用課件全文共246頁,當前為第15頁。技術驅動層(技術層)——人工智能產業(yè)的核心主要包括圖像識別、文字識別、語音識別、生物識別等應用技術,主要用于讓機器完成對外部世界的探測,即看懂、聽懂、讀懂世界,進而才能夠做出分析判斷、采取行動,讓更復雜層面的智慧決策、自主行動成為可能。三、人工智能的產業(yè)結構人工智能基礎與應用課件全文共246頁,當前為第16頁。場景應用層(應用層)——人工智能產業(yè)的延伸,專注行業(yè)應用主要面向AI與傳統(tǒng)產業(yè)的深度融合,實現不同行業(yè)應用場景的解決方案(如“AI+”制造、家居、金融、教育、交通、安防、醫(yī)療、物流、零售等領域)和AI消費級終端產品(如智能汽車、智能機器人、智能無人機、智能家居設備、可穿戴設備等)。三、人工智能的產業(yè)結構人工智能基礎與應用課件全文共246頁,當前為第17頁。三、人工智能的產業(yè)結構人工智能產業(yè)結構圖人工智能基礎與應用課件全文共246頁,當前為第18頁。三、人工智能的產業(yè)結構人工智能應用正在以場景化、碎片化的方式涌現預計2030年,我國人工智能核心產業(yè)規(guī)模超過1萬億元,帶動相關產業(yè)規(guī)模超過10萬億元!——國務院《新一代人工智能發(fā)展規(guī)劃》人工智能基礎與應用課件全文共246頁,當前為第19頁。三、人工智能的產業(yè)結構中國人工智能產業(yè)結構概覽中國人工智能企業(yè)多集中在應用層,技術層和基礎層企業(yè)占比相對較小;從技術類型分布來看,涉及機器學習、大數據、云計算和機器人技術的企業(yè)較多,整體分布相對均勻。在應用技術方面,以語音識別、機器視覺為代表的人工智能技術快速成熟,已達到規(guī)?;a業(yè)實用水平。人工智能基礎與應用課件全文共246頁,當前為第20頁。三、人工智能的產業(yè)結構中國人工智能產業(yè)結構概覽全球科技競爭進入敏感時期,產品出口、系統(tǒng)軟件采購、芯片進口等多方面都可能面臨挑戰(zhàn),這對以應用開發(fā)見長、基礎層支撐積累較淺的國內企業(yè)帶來壓力,但同時也形成了倒逼產業(yè)鏈上游企業(yè)發(fā)展的動力。人工智能基礎與應用課件全文共246頁,當前為第21頁。三、人工智能的產業(yè)結構人工智能產業(yè)的人才需求結構AI產業(yè)鏈分為:基礎層、技術層、應用層。AI產業(yè)鏈以算力驅動,場景為王。未來各行各業(yè)的應用需要大量的技術技能型人才認識人工智能、參與到場境訓練與應用中。人工智能基礎與應用課件全文共246頁,當前為第22頁。三、人工智能的產業(yè)結構動力市場的變化勞動者面臨職業(yè)替代風險對人才培養(yǎng)模式和體系提出了變革要求“物信融合”時代教育面臨的挑戰(zhàn)AI、5G、VR等新技術勢不可擋,未來的教育教學模式如何變革?技術真的能奏效嗎?教學方法和教學內容如何提升?如何讓所有從事和參與教育的人享受教育生活,讓以教師為中心的學習向以學生為中心的學習轉變,享受學習過程,讓所有的人真正成為他自己。人工智能時代的到來倒逼未來教育的發(fā)展,同時技術更迭與教育倫理需做好有效銜接和平衡。技術驅動——未來已來010203“物信融合”背景下教育發(fā)展面臨的挑戰(zhàn):人工智能基礎與應用課件全文共246頁,當前為第23頁。三、人工智能的產業(yè)結構2019政府工作報告:“打造工業(yè)互聯(lián)網平臺,拓展‘智能+’,為制造業(yè)轉型升級賦能”“深化大數據、人工智能等研發(fā)應用,培育新一代信息技術、高端裝備、生物醫(yī)藥、新能源汽車、新材料等新興產業(yè)集群,壯大數字經濟。”《高等學校人工智能創(chuàng)新行動計劃》教技〔2018〕3號1.加快人工智能領域學科建設。2.加強人工智能領域專業(yè)建設。推進“新工科”建設,到2020年建設100個“人工智能+X”復合特色專業(yè)。3.加強人工智能領域人才培養(yǎng)。4.構建人工智能多層次教育體系。教育部:人才先行人工智能(AI)政策支持情況政策導向人工智能(AI)技術的應用,加大對人工智能人才(技術應用)的培養(yǎng)力度勢在必行。《新一代人工智能發(fā)展規(guī)劃》國發(fā)〔2017〕35號第一步,到2020年人工智能總體技術和應用與世界先進水平同步,人工智能產業(yè)成為新的重要經濟增長點。第二步,到2025年人工智能基礎理論實現重大突破,部分技術與應用達到世界領先水平。第三步,到2030年人工智能理論、技術與應用總體達到世界領先水平,成為世界主要人工智能創(chuàng)新中心。國務院:戰(zhàn)略布局《促進新一代人工智能產業(yè)發(fā)展三年行動計劃(2018-2020年)》工信部科[2017]315號——人工智能重點產品規(guī)?;l(fā)展,智能網聯(lián)汽車技術水平大幅提升,智能服務機器人實現規(guī)?;瘧??!斯ぶ悄苷w核心基礎能力顯著增強,智能傳感器技術產品實現突破——智能制造深化發(fā)展,復雜環(huán)境識別、新型人機交互等人工智能技術在關鍵技術裝備中加快集成應用。工信部:積極部署人工智能基礎與應用課件全文共246頁,當前為第24頁。四、人工智能砸了誰的飯碗你的職業(yè)未來會消失嗎?人工智能的本質:是將人們從簡單、機械的勞動中解放出來,有效地提高效率與質量、節(jié)約時間,降低人力與業(yè)務成本。從社會分工來看,最先被取代的是很多簡單的工作、易于自動化的內部工作。如:依靠訓練即可掌握的技能;重復性勞動,熟練即可的工作;。典型的如生產工、裝配工、流水線作業(yè)等。非自動化工作,如:創(chuàng)意、設計、發(fā)明、溝通協(xié)調等,對勞動力的需求將會上升,并在企業(yè)內外部創(chuàng)造出一些新的工作機會。從本質上說,人工智能將帶來的是一種勞動力的轉型,將改變人們的工作性質,重塑未來的勞動力。人工智能基礎與應用課件全文共246頁,當前為第25頁。四、人工智能砸了誰的飯碗你的職業(yè)未來會消失嗎?(數據來源:牛津大學、麥肯錫、普華永道、創(chuàng)新工場研究報告)人工智能替代職業(yè)的概率排名情況人工智能基礎與應用課件全文共246頁,當前為第26頁。四、人工智能砸了誰的飯碗什么是“人工智能訓練師”?2020年3月,人社部向社會發(fā)布了未來緊需的16個新職業(yè),其中人工智能訓練師名列其中,這是人工智能的第一個非技術類新職位,更是一個面向行業(yè)應用的新崗位?!叭斯ぶ悄苡柧殠煛?,是阿里巴巴率先提出,被形象的稱為“機器人飼養(yǎng)員”。其目的就是讓AI更“懂”人,通“人”性,更好地為人們服務。具體定義:是指使用智能訓練軟件,在人工智能產品實際使用過程中進行數據庫管理、算法參數設置、人機交互設計、性能測試跟蹤及其他輔助作業(yè)的人員。人工智能基礎與應用課件全文共246頁,當前為第27頁。四、人工智能砸了誰的飯碗人工智能訓練師產業(yè)的背景行業(yè)背景:隨著人工智能技術的不斷變革,人工智能正在加快與各行各業(yè)深度融合,加快產業(yè)智能化進程。AI+傳統(tǒng)產業(yè)已是大勢所趨,未來對人才培養(yǎng)的倒逼、企業(yè)崗位的變化以及職業(yè)能力的要求將出現巨大改變。崗位需求:人工智能的應用需要大量數據的支撐,而在各行各業(yè)獲取到的原始數據無法直接用于模型訓練,這需要專業(yè)的標注和加工后才能使用,但如果標注人員不懂行業(yè)具體的應用場境,對數據的理解和標注質量差異很大,將導致整體標注工作的效率和效果都不夠理想。因此,“人工智能訓練師”應運而生,這不是一個人工智能技術職位,而是“人工智能+專業(yè)應用”的新崗位。人工智能基礎與應用課件全文共246頁,當前為第28頁。四、人工智能砸了誰的飯碗人工智能訓練師需要具備什么能力?人工智能訓練師從智能產品應用、數據分析、業(yè)務理解、智能訓練等維度劃分五個等級,包括:(1)標注和加工圖片、文字、語音等業(yè)務的原始數據;(2)設計人工智能產品的交互流程和應用解決方案;(3)分析提煉專業(yè)領域特征,訓練和評測人工智能產品相關算法、功能和性能;(4)監(jiān)控、分析、管理人工智能產品應用數據;(5)調整、優(yōu)化人工智能產品參數和配置。其核心目標就是通過分析需求和相關數據,完成數據標注規(guī)則的制定,最終實現提高數據標注工作的質量和效率,讓智能更懂人類,更好地為人類服務。人工智能基礎與應用課件全文共246頁,當前為第29頁?!揪毩暸c思考】選擇題:1.人工智能的智能水平從低到高怎么發(fā)展?A.認知智能—感知智能—計算智能B.感知智能—計算智能—認知智能C.計算智能—認知智能—感知智能D.認知智能—計算智能—感知智能2.人工智能的其他支撐技術包括哪些?(多選題)A.云計算B.大數據C.物聯(lián)網D.5G通信3.以下哪項不屬于人工智能的技術驅動層內容?A.圖像識別B.語音識別C.AI芯片D.知識圖譜人工智能基礎與應用課件全文共246頁,當前為第30頁?!揪毩暸c思考】選擇題:4.以下哪項內容不屬于人工智能的應用層范圍?A.AI+金融B.AI+無人駕駛C.AI+教育D.智能芯片5.以下哪項是人工智能未來可替代的職業(yè)?(多選題)A.財務類人員B.流水線工人C.電話銷售員D.心理學家判斷題:1.人工智能的發(fā)展是曲折起伏的,有低谷也有高潮,一直沿著這種趨勢不斷前進。2.人工智能訓練師要求具備人工智能技術背景,是一個人工智能技術崗位。人工智能基礎與應用課件全文共246頁,當前為第31頁?!揪毩暸c思考】討論題:1.讓學生想一想,人工智能從會學習、會行動到能思考、能應變,兩種不同的智能水平可能帶來的人類工作、生活的巨大變化,我們和機器怎么協(xié)同共處?2.讓學生結合自己所學的專業(yè),查閱相關行業(yè)資料,思考該行業(yè)未來需要人工智能訓練師嗎?在哪些具體工作領域有需求?人工智能基礎與應用課件全文共246頁,當前為第32頁?!揪毩暸c思考】客觀題答案選擇題:1.C2.ABCD3.C4.D5.ABC判斷題:1.對2.錯(是一個非人工智能技術類職位)人工智能基礎與應用課件全文共246頁,當前為第33頁。人工智能基礎與應用
項目一初探人工智能AI遇見應用興趣引領未來人工智能基礎與應用課件全文共246頁,當前為第34頁。AI遇見應用興趣引領未來人工智能基礎與應用
項目二認知人工智能
的基礎支撐人工智能基礎與應用課件全文共246頁,當前為第35頁。目錄教學目標教學要求內容概覽相關知識2.1.1人工智能的核心驅動力 2.1.2人工智能的其他支撐技術 2.1.3了解人工智能的數據服務
練習與思考 人工智能基礎與應用
項目二認知人工智能的基礎支撐人工智能基礎與應用課件全文共246頁,當前為第36頁。1.學習人工智能的核心驅動力——算力、算法、數據,以及相互間的關系2.概要了解人工智能的其他支撐技術——物聯(lián)網、云計算、5G及相互間的賦能3.數據作為AI算法“燃料”的重要性以及采集、標注及分析的基本流程【教學目標】人工智能基礎與應用課件全文共246頁,當前為第37頁。1.知識點人工智能芯片的分類及特點認知物聯(lián)網和AIoT,以及云計算、5G的概念及應用人工智能數據服務的采集、標注及統(tǒng)計分析2.重難點通過本單元的學習,厘清機器學習、深度學習之間的關系及重點應用領域;了解AIoT這一高頻詞的出現背景,思考人工智能技術與物聯(lián)網在實際行業(yè)應用中的落地融合;深刻理解數據、算法模型及場境應用的流程及相互關系,由此學習人工智能數據服務的相關內容?!窘虒W要求】人工智能基礎與應用課件全文共246頁,當前為第38頁?!緝热莞庞[】燃料加速器發(fā)動機項目二認知人工智能的基礎支撐2.1.3了解人工智能的數據服務數據采集數據標注數據分析2.1.2人工智能的其他支撐技術物聯(lián)網和AIoTAIoT“萬物智聯(lián)”云計算2.1.1人工智能的核心驅動力算力人工智能的基礎硬件層,為算法提供基礎計算能力涵蓋:GPU、CPU、FPGA和各種各樣的ASIC專用芯片物聯(lián)網“萬物互聯(lián)”5G提供快速安全的云計算與數據存儲服務,讓用戶可以使用網絡上的龐大計算資源與數據中心性能目標被監(jiān)測的各種物理量、影音圖文信息、生產生活記錄等通過數據標注員借助標記工具,對人工智能學習數據進行加工的一種行為典型分析步驟:探索性數據分析、模型選定分析、推斷分析數據標注的類型:圖像標注、語音標注、文本標注、視頻標注等數據算法數據來源大數據特點與人工智能的關系規(guī)模性、高速性、多樣性、價值稀疏性相互促進,大數據要求AI不斷提高計算能力,同時也在不斷訓練著AI機器學習深度學習讓機器像人一樣的學習和思考——從已知數據中獲得規(guī)律,并對未知進行預測學習方式分類:監(jiān)督學習、無監(jiān)督學習和強化學習讓算法自動從數據中獲取特征,而不是像機器學習人為提取特征主要應用方向圖像識別:圖像分類、物體檢測、圖像分割、圖像回歸語音識別:語音識別、聲紋識別、語音合成自然語言處理:情感分析、神經機器翻譯、自然語言推理典型應用場景在線視頻、4K/8K業(yè)務、車聯(lián)網、無人駕駛、遠程醫(yī)療、智慧城市等圖像、聲音等媒體數據;動作、姿態(tài)等行為數據;位置、天氣等環(huán)境數據實現物體與物體、環(huán)境與狀態(tài)信息之間實時共享AI+IoT,人工智能技術與物聯(lián)網在實際行業(yè)應用中的落地融合與人工智能的關系人工智能的基礎計算平臺,人工智能的能力集成到千萬應用中的便捷途徑高數據速率、減少延遲、節(jié)省能源、降低成本、提高系統(tǒng)容量和大規(guī)模設備連接人工智能基礎與應用課件全文共246頁,當前為第39頁。人工智能的核心驅動力人工智能的核心驅動力包括:大數據、算法、算力。大數據可以比作人工智能的燃料,算法是發(fā)動機,算力則是支撐發(fā)動機高速運轉的加速器。三者相輔相成,數據量的上漲、運算力的提升和深度學習算法的出現才能極大地促進人工智能行業(yè)的發(fā)展。【相關知識】人工智能三要素人工智能基礎與應用課件全文共246頁,當前為第40頁。大數據——這是讓計算機獲得智能的鑰匙,具有三大特征:體量大、多維度、全面性;算法——如深度學習、機器學習等,就是讓計算機通過大量的數據具備學習能力;算力——每個聰明的人工智能系統(tǒng)背后都有一套強大的硬件系統(tǒng),用于計算處理大數據和執(zhí)行先進算法的能力。一、人工智能的核心驅動力人工智能基礎與應用課件全文共246頁,當前為第41頁。(一)人工智能的“加速器”——算力什么是算力?算力是人工智能的基礎硬件層,為算法提供基礎計算能力。涵蓋:GPU、CPU、FPGA和各種各樣的ASIC專用芯片。芯片的發(fā)展歷程?傳統(tǒng)計算機芯片為CPU,但這種傳統(tǒng)計算架構無法支撐深度學習的大規(guī)模并行計算需求。GPU(圖像處理器)作為應對圖像處理需求而出現的芯片,其海量數據并行運算的能力與深度學習需求不謀而合,因此,被最先引入深度學習。GPU的優(yōu)點:讓并行計算成為可能,對數據處理規(guī)模、數據運算速度帶來了指數級的增長。和使用傳統(tǒng)雙核CPU在運算速度上的差距最大會達到近七十倍,解決了制約計算機視覺發(fā)展的主要瓶頸。一、人工智能的核心驅動力人工智能基礎與應用課件全文共246頁,當前為第42頁。(一)人工智能的“加速器”——算力人工智能芯片的發(fā)展路徑兩種發(fā)展路徑:一種是延續(xù)傳統(tǒng)計算架構,加速硬件計算能力,主要以3種類型的芯片為代表,即GPU、FPGA、ASIC,但CPU依舊發(fā)揮著不可替代的作用;另一種是采用類腦神經結構來提升計算能力,以IBMTrueNorth芯片為代表。一、人工智能的核心驅動力種類傳統(tǒng)芯片類腦芯片CPUGPUDSPFPGAASIC特征邏輯控制、串行運算等通用計算3D圖像處理、密集型并行運算實現各種數字信號處理算法半定制IC、可編程芯片計算能力和效率可根據算法需要定制模擬人腦進行異步、并行和分布式信息處理領域云端/終端推理云端訓練端側推理云端/終端推理訓練&推理端側推理企業(yè)英特爾英偉達ImaginationCEVA
中星微Xilinx
深鑒科技谷歌
寒武紀IBM傳統(tǒng)芯片及類腦芯片硬件信息比較人工智能基礎與應用課件全文共246頁,當前為第43頁。什么是算法模型?算法是人工智能的發(fā)動機,有了算法,有了被訓練的數據,經過多次訓練,經過模型評估和算法人員不斷調整后,會獲得訓練模型。有了好的算法模型,人工智能業(yè)務要求的基礎功能才能得以實現。一、人工智能的核心驅動力(二)人工智能的“發(fā)動機”——算法人工智能基礎與應用課件全文共246頁,當前為第44頁。人工智能的算法理論人工智能、機器學習和深度學習的關系:人工智能是目標,機器學習是重要實現手段之一,深度學習則源于機器學習的一個技術方向——人工神經網絡。一、人工智能的核心驅動力(二)人工智能的“發(fā)動機”——算法人工智能基礎與應用課件全文共246頁,當前為第45頁。什么是機器學習?讓計算機具有像人一樣的學習和思考能力,即從已知數據中獲得規(guī)律,并利用規(guī)律對未知數據進行預測的技術。在這整個過程中,最關鍵的是數據。一、人工智能的核心驅動力(二)人工智能的“發(fā)動機”——算法機器學習的分類3種學習方式的分類:監(jiān)督學習、無監(jiān)督學習和強化學習。監(jiān)督學習(SupervisedLearning):簡單理解為“跟老師學”,即在有老師的環(huán)境下,學生從老師那里獲得做對或做錯的反饋。其學習結果為函數,以概率函數、代數函數或人工神經網絡為函數模型無監(jiān)督學習(UnsupervisedLearning):簡單理解為“自學標評”,即沒有老師的環(huán)境下,學生自己學習,一般有既定標準評價,或者無評價。采用聚類方法,學習結果為類別。強化學習(ReinforcementLearning):簡單理解為“自學自評”,即沒有老師的環(huán)境下,學生對問題答案自我評價,以統(tǒng)計和動態(tài)規(guī)劃技術為指導的一種學習方法。人工智能基礎與應用課件全文共246頁,當前為第46頁。什么是機器學習?——什么是監(jiān)督學習這是最簡單、最直接的一種機器學習方式。類似高考前所做的練習題是有標準答案的,在做題的過程中,我們可以通過對照答案,來分析問題找出方法。一、人工智能的核心驅動力(二)人工智能的“發(fā)動機”——算法人工智能基礎與應用課件全文共246頁,當前為第47頁。什么是機器學習?——什么是非監(jiān)督學習也稱為無監(jiān)督學習,就是所做的練習題沒有標準答案,換句話說,你也不知道自己做的是否正確,沒有參照。由于這種方式能夠幫助克服很多實際應用中獲取監(jiān)督數據的困難,因此一直是人工智能發(fā)展的一個重要研究方向。一、人工智能的核心驅動力(二)人工智能的“發(fā)動機”——算法人工智能基礎與應用課件全文共246頁,當前為第48頁。什么是機器學習?——什么是強化學習這是一種非常強大的學習方式,其目標就是要獲得一個策略去指導行動。比如在圍棋博弈中,這個策略可以根據盤面形勢指導每一步應該在哪里落子;在股票交易中,這個策略會告訴我們應該在什么時候買入、什么時候賣出。具體案例:2016年擊敗圍棋世界冠軍李世石九段的阿爾法狗,其令世人震驚的博弈能力就是通過強化學習訓練出來的。一、人工智能的核心驅動力(二)人工智能的“發(fā)動機”——算法人工智能基礎與應用課件全文共246頁,當前為第49頁。什么是深度學習?這是機器學習比較熱門的一個方向,其本身是神經網絡算法的衍生。深度學習是讓算法自動從數據中獲取特征,而不是像從前的機器學習方法,人為的去提取特征。深度學習通過構建一個多層的表示學習結構,使用一系列非線性變換操作,從原始數據中提取簡單的特征進行組合,從而獲得更高層、更抽象的表示。一、人工智能的核心驅動力(二)人工智能的“發(fā)動機”——算法人工智能基礎與應用課件全文共246頁,當前為第50頁。機器學習和深度學習的差異其最大的不同在于深度學習不需要人為的做特征工程,而是可以通過算法直接獲取特征。這使機器學習向“全自動數據分析”又前進了一步。一、人工智能的核心驅動力(二)人工智能的“發(fā)動機”——算法人工智能基礎與應用課件全文共246頁,當前為第51頁。什么是深度學習?——深度學習的主要應用方向1.圖像處理領域圖像分類(物體識別):整幅圖像的分類或識別。物體檢測:檢測圖像中物體的位置進而識別物體。圖像分割:對圖像中的特定物體按邊緣進行分割。圖像回歸:預測圖像中物體組成部分的坐標。一、人工智能的核心驅動力(二)人工智能的“發(fā)動機”——算法2.語音識別領域語音識別:將語音識別為文字。聲紋識別:識別是哪個人的聲音。語音合成:根據文字合成特定人的語音。人工智能基礎與應用課件全文共246頁,當前為第52頁。什么是深度學習?——深度學習的主要應用方向3.自然語言處理領域語言模型:根據前一個單詞預測下一個單詞。情感分析:分析文本體現的情感(正負向、正負中或多態(tài)度類型)。神經機器翻譯:基于統(tǒng)計語言模型的多語種互譯。神經自動摘要:根據文本自動生成摘要。機器閱讀理解:通過閱讀文本回答問題、完成選擇題或完型填空。自然語言推理:根據一句話(前提)推理出另一句話(結論)。一、人工智能的核心驅動力(二)人工智能的“發(fā)動機”——算法人工智能基礎與應用課件全文共246頁,當前為第53頁。認識數據對人工智能的重要性數據集的豐富性和大規(guī)模性對算法訓練尤為重要。實現精準視覺識別的第一步,就是獲取海量而優(yōu)質的應用場景數據。以人臉識別為例,訓練該算法模型的圖片數據量至少應為百萬級別。大數據的來源社交網絡用戶數據·科學儀器獲取數據·移動通信記錄數據傳感器檢測數據·飛機飛行記錄數據醫(yī)療數據:放射影像數據,疾病數據·商務數據:刷卡消費數據,網購交易數據信息量越來越大、維度越來越多,從圖像、聲音等媒體數據,到動作、姿態(tài)、軌跡等人類行為數據,再到地理位置、天氣等環(huán)境數據……一、人工智能的核心驅動力(三)人工智能的“燃料”——數據人工智能基礎與應用課件全文共246頁,當前為第54頁。大數據的特點規(guī)模性(Volume,耗費大量存儲、計算資源);高速性(Velocity,增長迅速、急需實時處理);多樣性(Variety,來源廣泛、形式多樣);價值稀疏性(Value,價值總量大、知識密度低)。大數據與人工智能的關系一方面,大數據要求人工智能不斷提高其計算能力;另一方面,大數據也在不斷地訓練著人工智能,使結果更加精準。一、人工智能的核心驅動力(三)人工智能的“燃料”——數據人工智能基礎與應用課件全文共246頁,當前為第55頁。沒有數據的人工智能是無法前行的。情景驅動的人工智能應用,對企業(yè)的數據處理能力提出迫切要求。企業(yè)不僅需要采集數據,還需要利用深度學習將這些數據轉化為人工智能的“知識”。在每一個轉化環(huán)節(jié),都需要能讀懂和識別數據背后信息的“AI+專業(yè)”應用人才。一、人工智能的核心驅動力總結人工智能基礎與應用課件全文共246頁,當前為第56頁。什么是物聯(lián)網?狹義:指通過信息傳感設備按約定的協(xié)議把任何物品與互聯(lián)網連接起來進行信息交換,以實現智能化識別、定位、跟蹤、監(jiān)控和管理的一種網絡。這些傳感設備包括:射頻識別(RFID)、紅外線感應器、全球定位系統(tǒng)、激光掃描器、氣體感應器等。廣義:打造“物物相連的互聯(lián)網”,指通過多種信息技術的結合,實現物體與物體之間、環(huán)境以及狀態(tài)信息之間實時的共享,以及智能化的收集、傳遞、處理、執(zhí)行。二、人工智能的其他支撐技術(一)認知物聯(lián)網和AIoT人工智能基礎與應用課件全文共246頁,當前為第57頁。物聯(lián)網與人工智能有什么關系?什么是AIoT?“AIoT”即“AI+IoT”,指的是人工智能技術與物聯(lián)網在實際行業(yè)應用中的落地融合。物聯(lián)網的最終目的是要解決具體場景的實際應用,賦予物聯(lián)網一個“大腦”;AI通過對歷史和實時數據的深度學習,能夠更準確的判斷用戶習慣,使設備做出符合用戶預期的行為,變得更加智能。人工智能也需要物聯(lián)網這個重要的平臺來完成落地應用。AI的數據只有IoT能夠源源不斷的提供,IoT提供的海量龐雜的數據可以讓AI快速的獲取知識,不斷訓練。二、人工智能的其他支撐技術(一)認知物聯(lián)網和AIoT人工智能基礎與應用課件全文共246頁,當前為第58頁。物聯(lián)網與人工智能有什么關系?什么是AIoT?二、人工智能的其他支撐技術(一)認知物聯(lián)網和AIoT因此只有兩者結合才能發(fā)揮出更大的作用,把應用邊界不斷拓展,這也是產業(yè)互聯(lián)網發(fā)展的核心訴求之一。人工智能基礎與應用課件全文共246頁,當前為第59頁。什么是云計算二、人工智能的其他支撐技術(二)了解云計算從廣義上說,計算資源的共享池叫做“云”。其實質是一個網絡,云計算把許多計算資源集合起來,通過軟件實現自動化管理,只需要很少的人參與,就能讓資源被快速提供。核心概念就是以互聯(lián)網為中心,在網站上提供快速且安全的云計算服務與數據存儲,讓每一個使用互聯(lián)網的人都可以使用網絡上的龐大計算資源與數據中心。人工智能基礎與應用課件全文共246頁,當前為第60頁。云計算的特點和應用二、人工智能的其他支撐技術(二)了解云計算計算能力作為一種商品,可以無限擴展,只要按使用量付費就可以;可以在互聯(lián)網上流通,可以方便地取用,且價格較為低廉。較為簡單的云計算技術服務,包括最為常見的網絡搜索引擎和網絡郵箱。其他的如存儲云、醫(yī)療云、金融云、教育云等等,也已廣泛地應用在行業(yè)及生活中。人工智能基礎與應用課件全文共246頁,當前為第61頁。云計算與人工智能的關系二、人工智能的其他支撐技術(二)了解云計算云計算不僅是人工智能的基礎計算平臺,也是人工智能的能力集成到千萬應用中的便捷途徑。作為IT基礎設施,它是人工智能與大數據之間的橋梁。人工智能的自我學習需要海量數據用于訓練。而云計算支撐了人工智能和大數據這些計算存儲密集型任務,它是幫助獲得海量真實大數據的重要方式。人工智能基礎與應用課件全文共246頁,當前為第62頁。什么是5G?二、人工智能的其他支撐技術(三)走近第五代移動通信技術(5G)5G:第五代移動通信系統(tǒng),也是繼1G、2G、3G和4G系統(tǒng)之后的延伸。1G:語音通話,20世紀80年代;2G:消息傳遞,20世紀90年代;3G:多媒體、文本、互聯(lián)網,20世紀90年代末至21世紀初;4G:實時數據,包括車載導航、視頻共享,2008年推出。從模擬通信到數字通信,從文字傳輸、圖像傳輸又到視頻傳輸,移動通信技術極大地改變了我們的生活。而前四代移動通信網絡技術,只是專注于移動通信,而5G在此基礎上還包括了工業(yè)互聯(lián)網和人工智能等諸多應用場景。人工智能基礎與應用課件全文共246頁,當前為第63頁。
5G的特點二、人工智能的其他支撐技術(三)走近第五代移動通信技術(5G)其性能目標是高數據速率、減少延遲、節(jié)省能源、降低成本、提高系統(tǒng)容量和大規(guī)模設備連接。5G的到來,更高的速率、更大的帶寬、更低的延遲成為可能。人工智能基礎與應用課件全文共246頁,當前為第64頁。
5G能實現什么場景?二、人工智能的其他支撐技術(三)走近第五代移動通信技術(5G)國際電信聯(lián)盟無線電通信局定義了5G的三大典型應用場境:增強型移動寬帶:主要面向虛擬現實(VR)/增強現實(AR),以及在線視頻4K/8K等高帶寬需求業(yè)務;超可靠低時延通信:主要面向車聯(lián)網與自動駕駛、遠程外科手術、智能電網、無人機等時延敏感的業(yè)務;海量大規(guī)模連接物聯(lián)網:主要面向智慧城市、智能交通等高連接密度需求的業(yè)務。人工智能基礎與應用課件全文共246頁,當前為第65頁。什么是人工智能數據服務?三、了解人工智能的數據服務即:為AI算法訓練及優(yōu)化提供的數據采集、清洗、信息抽取、標注等服務,這對于人工智能縱深到細分行業(yè)和場境應用至關重要。人工智能基礎與應用課件全文共246頁,當前為第66頁。三、了解人工智能的數據服務人工智能數據服務包括以下步驟:1.數據采集又稱數據獲取。被采集數據可以是被監(jiān)測的各種物理量,如溫度、濕度、水位等,也可以是各類影音圖文信息。2.數據標注包括:語音標注、圖像標注、文本標注、視頻標注等種類。標記的基本形式有:標注畫框、3D畫框、文本轉錄、圖像打點、目標物體輪廓線等。3.數據分析指用適當的統(tǒng)計方法對收集來的大量數據進行分析,提取有用信息和形成結論。通常包含以下三個步驟:探索性數據分析——模型選定分析——推斷分析人工智能基礎與應用課件全文共246頁,當前為第67頁。三、了解人工智能的數據服務人工智能數據服務——什么是圖像標注?圖像標注和視頻標注可統(tǒng)一稱為圖像標注,因為視頻也是由圖像連續(xù)播放組成,1秒鐘的視頻包含25幀圖像,每1幀都是1張圖像?,F實應用場景:人臉識別以及自動駕駛車輛識別等。圖形的數據標注需要相對復雜的過程。圖像包括形態(tài)、目標點、結構劃分等,數據標注人員需要對不同的目標標記物用不同的顏色進行輪廓標記,然后對相應的輪廓打標簽,用標簽來概述輪廓內的內容,以便讓模型能夠識別圖像的不同標記物。人工智能基礎與應用課件全文共246頁,當前為第68頁。三、了解人工智能的數據服務人工智能數據服務是深度學習技術催生出來的新職業(yè),而數據標注員從事的是人工智能時代的信息處理工作。當技術的進步大幅提升了數據處理的效率,人的作用將從原來的重復勞動變成監(jiān)督和輔助機器學習,職業(yè)要求和內涵也將發(fā)生重大變化。未來展望:隨著算法需求越來越旺盛,由機器持續(xù)學習人工標注,提升預標注和自動標注能力對人工的替代率將成趨勢。當技術大幅進步,數據標注師如何變成人工智能訓練師,新技術在取代人力的同時也帶來了新的職業(yè)路徑和新的職業(yè)要求??偨Y人工智能基礎與應用課件全文共246頁,當前為第69頁?!揪毩暸c思考】選擇題:1.人工智能的核心驅動力包括以下哪些要素?(多選題)A.算法B.數據C.算力D.物聯(lián)網2.以下哪個要素被稱為人工智能的發(fā)動機?A.算力B.數據C.云計算D.算法3.人工智能與機器學習、深度學習的包含關系是什么?A.人工智能>深度學習>機器學習B.深度學習>機器學習>人工智能C.機器學習>深度學習>人工智能D.人工智能>機器學習>深度學習人工智能基礎與應用課件全文共246頁,當前為第70頁。【練習與思考】選擇題:4.機器學習的分類方式有以下哪些?(多選題)A.監(jiān)督學習B.強化學習C.深度學習D.無監(jiān)督學習5.5G能實現以下哪些性能目標?(多選題)A.減少延遲B.降低成本C.實現大規(guī)模設備連接D.高數據速率6.以下哪些應用場境屬于5G的典型應用?(多選題)A.無人駕駛B.車聯(lián)網C.在線視頻D.8K業(yè)務7.大數據有哪些特點?(多選題)A.多樣性B.高速性C.規(guī)模性D.價值稀疏性人工智能基礎與應用課件全文共246頁,當前為第71頁?!揪毩暸c思考】選擇題:8.人工智能的數據服務包括哪些步驟?(多選題)A.數據標注B.數據采集C.數據分析D.數據清洗判斷題:1.作為組成人工智能的核心驅動力之一,算力被比作人工智能的燃料。2.算力涵蓋GPU、CPU、FPGA和各種各樣的ASIC專用芯片。3.深度學習的主要應用方向包括了圖像識別、語音識別、自然語言處理等。人工智能基礎與應用課件全文共246頁,當前為第72頁?!揪毩暸c思考】討論題:1.小組合作任務:將班級學生分成若干個小組,各小組就生活中的實際案例進行數據采集、并完成標注及分析,最終輸出專題報告。2.深度學習和傳統(tǒng)機器學習相比,具有哪些優(yōu)勢?互聯(lián)網時代,網購已經深入千家萬戶,結合本節(jié)學習內容思考深度學習在京東、美團、淘寶等網購平臺有哪些用武之地?人工智能基礎與應用課件全文共246頁,當前為第73頁?!揪毩暸c思考】客觀題答案選擇題:1.ABC2.D3.B4.ABD5.ABCD6.ABCD7.ABCD8.ABC判斷題:1.錯2.對3.對人工智能基礎與應用課件全文共246頁,當前為第74頁。人工智能基礎與應用
項目二認知人工智能的基礎支撐AI遇見應用興趣引領未來人工智能基礎與應用課件全文共246頁,當前為第75頁。AI遇見應用興趣引領未來人工智能基礎與應用
項目三認知人工智能
的應用技術人工智能基礎與應用課件全文共246頁,當前為第76頁。人工智能基礎與應用課件全文共246頁,當前為第77頁。任務一視覺智能——機器如何識字、看人人工智能基礎與應用
項目三認知人工智能的應用技術人工智能基礎與應用課件全文共246頁,當前為第78頁。目錄教學目標教學要求內容概覽相關知識3.1.1圖像識別技術的原理及應用 3.1.2人臉識別技術及應用 3.1.3OCR文字識別技術及應用練習與思考 人工智能基礎與應用
項目三認知人工智能的應用技術任務一視覺智能——機器如何識字、看人人工智能基礎與應用課件全文共246頁,當前為第79頁。1.掌握圖像識別、人臉識別、文字識別的含義2.理解圖像識別、人臉識別、文字識別的原理、技術流程、應用及發(fā)展趨勢3.進行圖像識別、人臉識別、文字識別的實訓【教學目標】人工智能基礎與應用課件全文共246頁,當前為第80頁。1.知識點圖像識別、視頻識別、人臉識別、行為識別、文字識別的概念和技術流程2.技能點掌握圖像識別、人臉識別、文字識別的實訓操作3.重難點通過本項目的學習,重點理解視覺智能包括哪些應用技術,過去的計算機視覺和現在的視覺智能有什么區(qū)別和聯(lián)系,思考在生活和行業(yè)方面有哪些具體應用?從“看得見”到“看得清楚、看得明白”之間,需要我們怎么去訓練機器?同時,結合每個任務后的實訓項目進一步思考,嘗試拓展更多實訓任務。【教學要求】人工智能基礎與應用課件全文共246頁,當前為第81頁。【內容概覽】任務一視覺智能——機器如何識字、看人3.1.3OCR文字識別技術及應用什么是OCR識別OCR識別的智能化OCR識別的應用3.1.2人臉識別技術及應用是圖像識別的一個應用場景,也叫做人像識別、面部識別,即基于人的臉部特征信息進行身份識別3.1.1圖像識別技術及應用什么是圖像識別?技術流程:人臉圖像采集及檢測、人臉圖像預處理、人臉圖像特征提取以及匹配與識別基于深度學習技術,將圖片上的文字、符號智能識別出來并變?yōu)榭删庉嫷奈谋緝?yōu)點:識別效率和準確率高、識別圖像質量寬容度高通用文字識別、卡證文字識別、票據文字識別、場景文字識別、其他文字識別(圖片數字、印章檢測、表格文字、圖片二維碼等)識別流程:圖像輸入、圖像預處理、版面分析、字符切割、字符特征提取、字符識別、后處理校正圖像識別的技術流程圖像識別的應用信息的獲取、預處理、特征抽取和選擇、分類器設計和分類決策應用領域:公共安全、生物、工業(yè)、農業(yè)、交通、醫(yī)療等延展介紹:視頻識別及視頻中的行為識別圖像處理:圖像采集、圖像增強、圖像復原、圖像編碼與壓縮、圖像分割圖像識別:統(tǒng)計法、模板匹配法和神經網絡法等人工智能基礎與應用課件全文共246頁,當前為第82頁?!鞠嚓P知識】計算機視覺應用場景人工智能基礎與應用課件全文共246頁,當前為第83頁。圖像識別是人工智能行業(yè)應用的一個重要方向,也是機器學習最熱門的領域之一。其目的是為了讓計算機代替人類去處理大量的物理信息,解決人類無法識別或者識別率特別低的信息。圖像識別的發(fā)展經歷三個階段:文字識別、數字圖像處理與識別、物體識別。圖像識別通過分類并提取重要特征并排除多余的信息來識別圖像。圖像的內容通常是用圖像特征進行描述,包括:顏色特征、紋理特征、形狀特征及局部特征點等。一、圖像識別技術的原理及應用(一)什么是圖像識別?人工智能基礎與應用課件全文共246頁,當前為第84頁。
圖像識別過程圖像識別過程分為圖像處理和圖像識別兩個部分。一、圖像識別技術的原理及應用(一)什么是圖像識別?人工智能基礎與應用課件全文共246頁,當前為第85頁。
圖像識別過程1.圖像處理分為模擬圖像處理和數字圖像處理。其目的是去除干擾、噪聲,將原始圖像進行特征提取,主要包括圖像采集、圖像增強、圖像復原、圖像編碼與壓縮和圖像分割。一、圖像識別技術的原理及應用(一)什么是圖像識別?環(huán)節(jié)內容圖像采集主要借助于攝像機、掃描儀、數碼相機等設備經過采樣數字化得到的圖像,也包括一些動態(tài)圖像,并可以將其轉為數字圖像,與文字、圖形、聲音一起存儲。圖像提取是將一個圖像變換為適合計算機處理的形式的第一步。圖像增強為突出圖像中想抓取的部分,必須對圖像進行改善,以緩解圖像在成像、采集、傳輸等過程中,質量或多或少造成的退化。通過圖像增強,減少圖像中的干擾和噪聲,改變原來圖像的亮度、色彩分布、對比度等參數,為后期的圖像分析和圖像理解奠定基礎。圖像復原為提取比較清晰的圖像,減少在獲取圖像時環(huán)境噪聲的影響、運動造成的圖像模糊、光線的強弱等原因使得圖像模糊,需要對圖像進行恢復。主要采用濾波方法,從降質的圖像恢復原始圖。另一種特殊技術是圖像重建,該技術是從物體橫剖面的一組投影數據建立圖像。圖像編碼與壓縮為快速方便地在網絡環(huán)境下傳輸圖像或視頻,必須對圖像進行編碼和壓縮。如靜態(tài)圖像壓縮標準JPEG,針對圖像的分辨率、色彩等進行規(guī)范。由于視頻可被看作是一幅幅不同的但有緊密相關的靜態(tài)圖像的時間序列,因此動態(tài)視頻的單幀圖像壓縮可以應用靜態(tài)圖像的壓縮標準。圖像編碼壓縮技術可以緩解數據量和存儲器容量問題、提高圖像傳輸速度、縮短處理時間。圖像分割技術圖像分割是把圖像分成一些互不重疊而又具有各自特征的子區(qū)域,每一區(qū)域是像素的一個連續(xù)集,這里的特性可以是圖像的顏色、形狀、灰度和紋理等。圖像分割對圖像中的目標、背景進行標記、定位,然后把目標從背景中分離出來。目前,圖像分割的方法主要有基于區(qū)域特征的分割方法、基于相關匹配的分割方法和基于邊界特征的分割方法。在實際的圖像中需根據景物條件的不同選擇適合的圖像分割方法。圖像分割為進一步的圖像識別、分析和理解奠定了基礎。人工智能基礎與應用課件全文共246頁,當前為第86頁。
圖像識別過程2.圖像識別將經過處理的圖像進行特征提取和分類,這就是圖像識別。通常有幾種常用的識別方法:統(tǒng)計法、模板匹配法和神經網絡法。統(tǒng)計法——該方法是對研究的圖像進行大量的統(tǒng)計分析,找出其中的規(guī)律并提取反映圖像本質特點的特征來進行圖像識別。缺點:當特征數量激增,給特征提取造成困難,分類也難以實現。模板匹配法——即把已知物體的模板與圖像中所有未知物體進行比較,如果某一未知物體與該模板匹配,則該物體被檢測出來,并被認為是與模板相同的物體。缺點:雖然簡單方便,但應用有很大的限制,識別率過多地依賴于已知物體的模板,如果已知物體的模板產生變形,會導致錯誤的識別。一、圖像識別技術的原理及應用(一)什么是圖像識別?人工智能基礎與應用課件全文共246頁,當前為第87頁。
圖像識別過程2.圖像識別神經網絡法——指用神經網絡算法對圖像進行識別的方法。目前深度學習模型已應用于一般圖像的識別和理解,不僅大大提升了圖像識別的準確性,也避免了抽取人工特征時的時間消耗。什么是神經網絡?神經網絡側重于模擬和實現人的認知過程中的感知過程、形象思維、分布式記憶和自學習自組織過程。神經網絡的特征:具有容錯性強、獨特的聯(lián)想記憶及自組織、自適應和自學習能力,特別適合處理信息模糊或不精確問題。一、圖像識別技術的原理及應用(一)什么是圖像識別?舉例:垃圾郵件的判斷人工智能基礎與應用課件全文共246頁,當前為第88頁。圖像識別的技術流程分以下幾步:信息的獲取、預處理、特征抽取和選擇、分類器設計和分類決策。一、圖像識別技術的原理及應用(二)圖像識別的技術流程信息獲取通過傳感器,將光或聲音等信息轉化為電信息。即獲取研究對象的基本信息并通過某種方法將其轉變?yōu)闄C器能夠認識的信息。預處理指圖像處理中的去噪、平滑、變換等的操作,從而加強圖像的重要特征。特征抽取和選擇特征抽?。豪媚撤N方法,研究各式各樣的圖像,獲取圖像所具有的本身特征特征選擇:從抽取的特征中,選擇對本次識別有用的特征分類器設計通過訓練而得到一種識別規(guī)則,通過此識別規(guī)則可以得到一種特征分類,使圖像識別技術能夠得到高識別率。分類決策在特征空間中對被識別對象進行分類,從而更好地識別所研究的對象具體屬于哪一類。人工智能基礎與應用課件全文共246頁,當前為第89頁。視頻監(jiān)控、人臉檢測和識別等都是圖像識別最廣泛的應用。從場境上,公共安全、生物、工業(yè)、農業(yè)、交通、醫(yī)療等均有廣泛應用。存在的局限:圖像識別技術在應用上還只是起著導盲犬性質的指引作用,需要通過人工添加標簽或注釋,幫助機器來理解圖片。未來的技術將朝著能夠具有人一樣的視覺、能夠理解圖像內容的人工智能發(fā)展。一、圖像識別技術的原理及應用(三)圖像識別的應用人工智能基礎與應用課件全文共246頁,當前為第90頁。視頻識別及視頻中的行為識別是圖像識別技術的重要應用。視頻就是由圖像連續(xù)播放形成的(1秒鐘的視頻包含25幀圖像,每1幀都是1張圖像),視頻識別中一個重要內容是視頻理解,主要包括:視頻結構化分析:即是對視頻進行幀、超幀、鏡頭、場景、故事等分割,從而在多個層次上進行處理和表達。目標檢測和跟蹤:如車輛跟蹤,多是應用在交通安防領域。人物識別:識別出視頻中出現的人物。動作識別:識別出視頻中人物的動作。視頻中的行為識別是計算機視覺研究中的重要領域,將人的活動進行拆分并進行識別。一、圖像識別技術的原理及應用(三)圖像識別的應用人工智能基礎與應用課件全文共246頁,當前為第91頁。
什么是人臉識別?人臉識別是圖像識別的一個應用場景,通常也叫做人像識別、面部識別。人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術,用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部的一系列相關技術。人臉識別技術的主要流程人臉圖像采集及檢測人臉圖像預處理人臉圖像特征提取匹配與識別。二、人臉識別技術及應用人工智能基礎與應用課件全文共246頁,當前為第92頁。人臉識別技術的主要流程(1)人臉圖像采集及檢測人臉圖像采集:通過攝像鏡頭采集,比如靜態(tài)圖像、動態(tài)圖像、不同的位置、不同表情等方面都可以得到很好的采集。人臉檢測:主要用于人臉識別的預處理,即在圖像中準確標定出人臉的位置、大小和特征。其目的就是把其中有用的信息挑出來,并利用這些特征實現檢測。(2)人臉圖像預處理基于人臉檢測結果,對圖像進行處理并最終服務于特征提取的過程。包括人臉對準,人臉圖像的光線補償,灰度變換、直方圖均衡化、歸一化(取得尺寸一致,灰度取值范圍相同的標準化人臉圖像),中值濾波(圖片的平滑操作以消除噪聲)以及銳化等。二、人臉識別技術及應用人工智能基礎與應用課件全文共246頁,當前為第93頁。人臉識別技術的主要流程(3)人臉圖像特征提取也稱人臉表征,是對人臉進行特征建模的過程??墒褂玫奶卣魍ǔ7譃橐曈X特征、像素統(tǒng)計特征、人臉圖像變換系數特征、人臉圖像代數特征等。(4)匹配與識別提取的人臉特征值數據與數據庫中存貯的特征模板進行搜索匹配,通過設定一個閾值,將相似度與這一閾值進行比較,來對人臉的身份信息進行判斷。二、人臉識別技術及應用人工智能基礎與應用課件全文共246頁,當前為第94頁。人臉識別技術的應用范圍企業(yè)、住宅安全和管理:如人臉識別門禁考勤系統(tǒng),人臉識別防盜門等電子護照及身份證公安、司法和刑偵自助服務信息安全:如計算機登錄、電子政務和電子商務等其他類似常見技術還有指紋識別、手掌幾何學識別、虹膜和視網膜識別等,也廣泛地應用于身份認證等場境,比如簽證應用、身份識別、打卡應用等。二、人臉識別技術及應用人工智能基礎與應用課件全文共246頁,當前為第95頁。OCR,全稱OpticalCharacterRecognition,光學字符識別。利用該識別技術,OCR文字識別可以代替人工錄入,將圖片上的文字、符號識別出來并變?yōu)榭删庉嫷奈谋?。人工智能時代的OCR,又被稱為文字識別技術,它是基于深度學習技術,將紙張、圖片等載體上的文字內容,智能識別成為可編輯的文本。三、OCR文字識別技術及應用(一)什么是OCR識別?人工智能基礎與應用課件全文共246頁,當前為第96頁。1.智能OCR的優(yōu)點為什么會出現智能OCR?——深度學習技術進入視覺識別領域,一種全新的基于深度學習的OCR流程被提出來。優(yōu)點:從單字識別進化到整行識別,文字識別準確率大幅提升;極大提升對識別圖像質量的寬容度,可以有效識別光照不均、圖像模糊、復雜背景等低質量圖像;無需掃描儀或高拍儀、手機、平板等移動設備拍攝的照片,都可以用于識別。甚至,手寫字體的識別不再是“噩夢”。三、OCR文字識別技術及應用(二)AI時代,OCR識別的蛻變人工智能基礎與應用課件全文共246頁,當前為第97頁。
2.OCR技術的識別流程三、OCR文字識別技術及應用(二)AI時代,OCR識別的蛻變序號步驟步驟內容1圖像輸入采集所要識別的圖像,比如名片、身份證、護照、行駛證、駕駛證、公文、文檔等等2圖像預處理包含二值化、去噪、傾斜度矯正等3版面分析對將要識別的文檔分段、分行處理4字符切割定位出字符串的邊界,然后分別對字符串進行單個切割5字符特征提取提取字符特征,為識別提供依據6字符識別將當前字符提取的特征向量與特征模板庫進行模板粗分類和模板細匹配,識別出字符7版面回復將識別結果按照原來的版面排班,輸出Word或pdf格式的文檔8后處理校正根據特定的語言上下文的關系,對識別結果進行較正人工智能基礎與應用課件全文共246頁,當前為第98頁。OCR識別:包含通用文字識別、卡證文字識別、票據文字識別、場景文字識別、以及其他文字(圖片數字、印章檢測、表格文字、圖片二維碼等)識別等幾大類型場景的識別。三、OCR文字識別技術及應用(三)OCR識別的應用人工智能基礎與應用課件全文共246頁,當前為第99頁。
OCR識別的應用場境智能OCR技術的身影已逐漸覆蓋到智慧城市、智慧金融、智能交通、智慧醫(yī)療等越來越多的領域,如:網絡信息安全企業(yè)根據網絡爬蟲網絡圖片,對照片上的文字識別剖析,進而判斷其是不是帶有特殊顏色信息內容;圖書館藏書的電子化,提高了效率和準確度;物流行業(yè),通過手寫體文字識別技術,自動識別出運單的收寄件人電話號碼和地址等字段,大幅提升運單信息錄入效率和物流資源的調度匹配能力;身份證的管理和識別、發(fā)票識別、出生證明識別、不動產登記識別等等。三、OCR文字識別技術及應用(三)OCR識別的應用人工智能基礎與應用課件全文共246頁,當前為第100頁?!揪毩暸c思考】選擇題:1.以下哪些方法屬于圖像識別的方法?(多選題)A.模板匹配法B.神經網絡法C.統(tǒng)計法D.知識圖譜2.以下哪個流程屬于圖像識別的正確流程?A.特征抽取選擇—分類決策—信息預處理B.信息預處理—分類決策—特征抽取選擇C.信息預處理—特征抽取選擇—分類決策D.分類決策—特征抽取選擇—信息預處理3.人臉識別包含以下哪些流程?(多選題)A.人臉圖像采集及檢測B.人臉圖像特征提取C.人臉圖像預處理D.人臉圖像匹配與識別人工智能基礎與應用課件全文共246頁,當前為第101頁?!揪毩暸c思考】選擇題:4.以下哪些均屬于人物身份確認的常見技術?(多選題)A.指紋識別B.人臉識別C.手掌幾何學識別D.虹膜和視網膜識別5.人工智能OCR識別帶來哪些優(yōu)點?(多選題)A.識別效率提升B.識別的圖像質量寬容度低C.識別的準確率高D.手寫字體也很容易識別人工智能基礎與應用課件全文共246頁,當前為第102頁。【練習與思考】選擇題:6.OCR識別可應用于以下哪些場境?(多選題)A.文字識別B.票據識別C.圖片二維碼識別D.圖片數字判斷題:1.神經網絡算法的提升對于人工智能技術的應用有著重要推動作用。2.視頻識別是圖像識別技術的重要應用之一。3.OCR識別不能用于印章檢測的識別。人工智能基礎與應用課件全文共246頁,當前為第103頁。【練習與思考】討論題:1.談一談,列舉你身邊的圖像識別、人臉識別、文字識別應用案例,試想還有哪些改進或創(chuàng)新之處。2.想一想,視覺智能相關技術在哪些方面已超越人類,進而影響到了傳統(tǒng)的就業(yè)崗位,又在哪些方面現階段甚至很長一段時間內還不能代替人類的角色?人工智能基礎與應用課件全文共246頁,當前為第104頁?!揪毩暸c思考】客觀題答案選擇題:1.ABC2.C3.ABCD4.ABCD5.ACD6.ABCD判斷題:1.對
2.對3.錯人工智能基礎與應用課件全文共246頁,當前為第105頁。任務二聽覺智能——機器如何“聞聲識人”人工智能基礎與應用
項目三認知人工智能的應用技術人工智能基礎與應用課件全文共246頁,當前為第106頁。目錄教學目標教學要求內容概覽相關知識3.2.1什么是語音識別技術? 3.2.2語音識別技術的應用 3.2.3聲紋識別:讓語音識別更加隱秘練習與思考 人工智能基礎與應用
項目三認知人工智能的應用技術任務二聽覺智能——機器如何“聞聲識人”人工智能基礎與應用課件全文共246頁,當前為第107頁。1.理解并掌握語音識別技術的含義及應用領域2.了解聲紋識別與語音識別的區(qū)別與聯(lián)系3.進行語音識別的項目實訓【教學目標】人工智能基礎與應用課件全文共246頁,當前為第108頁。1.知識點語音識別語音特征提取人機對話系統(tǒng)的角色演進聲紋識別2.技能點掌握語音識別為文本、文本識別為語音的雙向實訓操作3.重難點本任務的重點是理解語音識別、聲紋識別技術的含義、應用領域及相互間的區(qū)別和聯(lián)系,語音如何轉變成文本的技術和流程。難點是通過本任務的學習,深度思考語音識別、語義理解、自然語言生成這樣一個人機對話系統(tǒng)的演進過程。【教學要求】人工智能基礎與應用課件全文共246頁,當前為第109頁?!緝热莞庞[】任務二聽覺智能——機器如何“聞聲識人”3.2.3聲紋識別打造“專屬語音管家”,是未來智能語音識別領域的重點方向不僅會捕捉語音內容,還會根據音波特點、生理特征等參數,自動識別說話人的身份3.2.2語音識別技術的應用語音輸入3.2.1什么是語音識別技術?目標就是讓機器通過識別和理解把語音信號轉變?yōu)橄鄳奈谋净蛎钫Z音控制語音識別技術:特征提取技術、模式匹配準則及模型訓練技術語音識別任務:孤立詞識別、連續(xù)語音識別、關鍵詞識別語音對話將語音識別成文字,提升用戶的效率,如微信語音轉換文字等通過語音控制設備,進行相關操作,如智能音箱、智能汽車系統(tǒng)等根據用戶的語音實現交流與對話,對語義理解要求較高。如訂票系統(tǒng)、銀行服務等語音識別流程:輸入——編碼——解碼——輸出人工智能基礎與應用課件全文共246頁,當前為第110頁?!鞠嚓P知識】人工智能基礎與應用課件全文共246頁,當前為第111頁。
語音識別技術語音識別技術就是讓機器通過識別和理解過程把語音信號轉變?yōu)橄鄳奈谋净蛎畹募夹g。根據識別的對象不同,語音識別任務大體可分為3類,即孤立詞識別、連續(xù)語音識別和關鍵詞識別。一、什么是語音識別技術?人工智能基礎與應用課件全文共246頁,當前為第112頁。
語音識別流程語音識別技術主要包括特征提取技術、模式匹配準則及模型訓練技術三方面。其識別流程為:信號處理:聲音信號是連續(xù)的模擬信號,為了保證音頻不失真影響識別,要進行降噪和過濾處理,保證讓計算機識別的是過濾后的語音信息;信號表征:對語音的內容信息根據聲學特征進行提取,并盡量對數據進行壓縮,特征提取完成之后,就進入了特征識別、字符生成環(huán)節(jié);模式識別:從每一幀中找出當前說的音素,由多個音素組成單詞,再由單詞組成文本句子。通過聲學模型識別音素、語言模型和詞匯模型識別單詞和句子。這樣,只要模型中涵蓋足夠的語料,即語音的大數據集,就能解決各種語音識別問題。整個流程下來,語音就能識別成文本了。一、什么是語音識別技術?人工智能基礎與應用課件全文共246頁,當前為第113頁。
語音識別技術應用領域概括起來,智能語音識別主要應用于三個領域,這也是語音識別商業(yè)化發(fā)展的主要方向:1.語音輸入系統(tǒng)將語音識別成文字,提升用戶的效率,如微信語音轉換文字、訊飛輸入法等。2.語音控制系統(tǒng)通過語音控制設備
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024個人的簡單借款合同
- 國際貿易協(xié)議樣本
- 廠房租賃合同范例
- 特色農產品胡柚購銷合同法律問題探討
- 共同投資開設武術館協(xié)議
- 標準入職協(xié)議書范例
- 旅行社與導游勞動合同范本
- 2023年高考地理第一次模擬考試卷-(湖南A卷)(全解全析)
- 房地產代理合同模板
- 2024年建筑渣土運輸合同范文
- 安陽師范學院校級教學團隊推薦表
- 收款確認單(新)(共4頁)
- 企業(yè)中層管理人員素質測評(附答案)
- 國民經濟動員中心申報材料
- 流式細胞術報告單解讀
- 社區(qū)衛(wèi)生服務中心公共衛(wèi)生績效考核及獎金分配制度
- 外貿_詢盤的分析與回復(精)
- 數獨骨灰級100題
- 基于HTML5技術的動漫宣傳介紹網站的設計與實現
- 江蘇省電力公司配電網管理規(guī)范實施細則
- 中山紀念堂英文導游詞
評論
0/150
提交評論