




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
人工智能和認知物理學ArtificialIntelligenceandCognitivePhysics李德毅11月25日1第1頁認知科學——研究人類怎樣獲取知識和使用知識
數(shù)據(jù)挖掘——讓機器模擬人智能從數(shù)據(jù)中發(fā)現(xiàn)知識2第2頁目錄人工智能50年發(fā)展回憶20世紀物理學成就不確定性認知原子模型數(shù)據(jù)場和勢函數(shù)認知場中知識發(fā)現(xiàn)3第3頁一、人工智能50年發(fā)展回憶人工智能興起智能鑒定原則人工智能研究不一樣樣切入點人工智能研究目旳4第4頁人工智能自誕生之日起就引起人們無限漂亮想象和憧憬;已經(jīng)成為學科交叉發(fā)展中一盞明燈,光輝四射;但其理論起伏跌宕,也存在爭議和誤解。5第5頁人工智能興起數(shù)學家和邏輯學家;認知學家和心理學家;神經(jīng)生理學家;計算機科學家1956年著名“達特茅斯(Dartmouth)會議”標志人工智能學科誕生,它從一開始就是交叉學科產(chǎn)物。與會者有:
6第6頁人工智能興起達特茅斯會議上,明斯基(MarvinMinsky)神經(jīng)網(wǎng)絡模擬器、麥卡錫(JohnMccarthy)搜索法、以及西蒙(HerbertSimon)和紐厄爾(AllenNewell)“邏輯理論家”是會議3個亮點。分別討論怎樣穿過迷宮,怎樣搜索推理和怎樣證明數(shù)學定理。這是初期人們期待人工智能。7第7頁人工智能經(jīng)典著作由費根鮑姆主編《ComputersandThought》被認為是世界上第一本人工智能經(jīng)典專著,含21篇著名論文,1963年出版。80年代出版1-4卷《TheHandbookofArtificialIntelligence》是人工智能杠鼎之作。8第8頁人工智能研究杰出人物20世紀40位圖靈獎獲得者中有6名人工智能學者,可見人工智能學科影響之深遠。1969年:馬文·明斯基1971年:約翰·麥卡錫1975年:赫伯特·西蒙和艾倫·紐厄爾1994年:愛德華·費根鮑姆和勞伊·雷迪9第9頁智能鑒定原則圖靈(Turing)測試:假如機器在與人隔離房間回答人提出問題,且人無法判斷回答問題是機器還是人時,則應當認為機器已經(jīng)具有人智能。10第10頁猴子摘香蕉11第11頁梵塔游戲
初始柱替代柱目柱12第12頁計算機下棋:1997年IBM“深藍”計算機以2勝3平1負戰(zhàn)績戰(zhàn)勝國際象棋冠軍卡斯帕羅夫,“深藍”計算速度為200萬棋步/秒,采用啟發(fā)式搜索措施;在與下棋領(lǐng)域具有類似性質(zhì)和類似復雜性問題上,計算機具有有智能。13第13頁計算機下棋:卡斯帕羅夫自1990年稱霸國際象棋棋壇,年舉行國際世界象棋冠軍比賽中,克拉莫尼克以8:6領(lǐng)先卡斯帕羅夫。“深藍”計算機能否打敗克拉莫尼克?也就是說,“深藍”計算機智能能否“與時俱進”?14第14頁追求智能三步曲1)??!真了不起!2)??!是這樣啊!3)?。∵@也算智能嗎?4)又回到第一步。
15第15頁人工智能研究對象不確定非線性不完全變構(gòu)造多變量分布式16第16頁人工智能應用人工智能實際應用越來越普遍。智能機器人、智能控制、智能網(wǎng)絡、智能、智能數(shù)據(jù)庫、智能管理、智能小區(qū)、智能交通、甚至智能經(jīng)濟等等不絕于耳,知識就是力量。17第17頁人工智能研究切入點先后出現(xiàn)了3個主流學派:符號主義措施--邏輯學派聯(lián)結(jié)主義措施--仿生學派行為主義措施--控制論學派
18第18頁符號主義學派(西蒙和紐厄爾為代表)物理符號系統(tǒng)假說(physicalsymbolsystemhypothesis)。由一組稱為符號實體構(gòu)成系統(tǒng),這些符號可作為組份出目前另一符號實體中。任何時候系統(tǒng)內(nèi)部均有一組符號構(gòu)造,以及作用在這些符號構(gòu)造上生成其他符號構(gòu)造一組過程。任一物理符號系統(tǒng)假如是有智能,則必能執(zhí)行對符號輸入、輸出、寄存、復制、條件轉(zhuǎn)移和建立符號構(gòu)造這樣6種操作。反之,能執(zhí)行這6種操作任何系統(tǒng),也就一定可以體現(xiàn)出智能。19第19頁符號主義學派認知基元是符號,智能行為通過符號操作來實現(xiàn),以美國科學家Robinson提出歸結(jié)原理為基礎,以Lisp和Prolog語言為代表;著重問題求解中啟發(fā)式搜索和推理過程,在邏輯思維模擬方面獲得成功,如自動定理證明和專家系統(tǒng);歸結(jié)原理不也許成為所有數(shù)學分支證明基礎,問題求解和邏輯推理本質(zhì)僅僅是演譯。20第20頁聯(lián)結(jié)主義學派(J.J.Hopfield為代表)人思維基元是神經(jīng)元,把智能理解為互相聯(lián)結(jié)神經(jīng)元競爭與協(xié)作成果,以人工神經(jīng)網(wǎng)絡為代表,其中,反向傳播網(wǎng)絡模型(BP)和Hopfield網(wǎng)絡模型更為突出;著重構(gòu)造模擬,研究神經(jīng)元特性、神經(jīng)元網(wǎng)絡拓樸、學習規(guī)則、網(wǎng)絡非線性動力學性質(zhì)和自適應協(xié)同行為。21第21頁遺傳算法和進化計算:1975年,JohnHolland提出遺傳算法(GeneticAlgorithm),模仿生物染色體中基因選擇(selection)、交叉(crossover)和變異(mutation)自然進化過程,通過個體構(gòu)造重組,形成一代代新群體(populations),最終收斂于近似優(yōu)化解。用于處理多變量、非線性、不確定、甚至混沌大搜索空間有約束優(yōu)化問題;22第22頁麻將原理:剛發(fā)到手牌就“和”了概率是非常非常小。不管開始手中牌有多壞,通過一次次摸牌、選擇、淘汰,可以逐漸迫近到最優(yōu)解。這相稱進化中變異和選擇原理。麻將魅力在于可以在容忍時間內(nèi)讓牌“和”了。遺傳算法和進化計算收斂性問題。23第23頁行為主義學派(R.A.Brooks為代表)控制論研究導致機器人和智能控制,機器人是“感知--行為”模式,是沒有知識智能(iwk,iwr),強調(diào)直覺和反饋重要性;智能行為體現(xiàn)在系統(tǒng)與環(huán)境交互之中,功能、構(gòu)造和智能行為不可分割。90年代起智能Agent成為新熱點。它是一種自治、具有自發(fā)行為、體現(xiàn)交互性和環(huán)境適應性新型智能機模型,具有移動性、推理、規(guī)劃、學習和適應能力。24第24頁行為主義學派反饋是控制論基石,沒有反饋就沒有智能。根據(jù)目旳與實際行為之間誤差來消除此誤差控制方略。PID控制是控制論對付不確定性最基本手段。強調(diào)智能系統(tǒng)與環(huán)境交互,從運行環(huán)境中獲取信息(感知),通過自己動作對環(huán)境施加影響。25第25頁目前,以實際問題驅(qū)感人工智能研究成為主流。人工智能不再是陽春白雪,尤其是數(shù)據(jù)挖掘技術(shù),要以機器再現(xiàn)人類認識過程方式,為認知科學提供了一種新實體模型和實在形式。26第26頁研究熱點模式識別智能檢索專家系統(tǒng)自然語言理解知識工程數(shù)據(jù)挖掘智能控制智能機器人27第27頁人工智能三次大躍進第一次:智能系統(tǒng)替代人完畢部分邏輯推理工作,如專家系統(tǒng)。
第二次:智能系統(tǒng)可以和環(huán)境交互,從運行環(huán)境中獲取信息,替代人完畢包括不確定性在內(nèi)部分思維工作,通過自身動作,對環(huán)境施加影響,并適應環(huán)境變化。如智能機器人。
第三次:智能系統(tǒng)具有類人認知和思維能力,可以發(fā)現(xiàn)新知識,去完畢面臨任務,如基于數(shù)據(jù)挖掘系統(tǒng)。28第28頁人工智能目旳:程序==智能?計算==思維?計算機==電腦?目旳:以機器方式再現(xiàn)人智能29第29頁二、20世紀物理學成就物質(zhì)層次構(gòu)造和原子物理模型場理論和四種互相作用30第30頁物質(zhì)層次構(gòu)造和原子物理模型可以把物質(zhì)構(gòu)成層次當作一種個等級,眼前物體當作是宏觀,天體當作是宇觀,把分子和原子作為界標,比它們小物質(zhì)可以稱之為微觀。原子這個層次十分重要。原子模型提出與演進,從開爾文模型、湯姆孫模型、勒納德模型、長岡模型、尼克爾森模型直到盧瑟福原子有核構(gòu)造模型,以及原子核模型,都表明構(gòu)思物質(zhì)構(gòu)成模型是一種普遍有效科學措施。原子物理模型成為人類認識世界五個里程碑之一。31第31頁物理學中勢場場可視為一種充斥能量空間。例如,將一種位于無窮遠處電荷移至電場中需要消耗能量。場在某點P(r)處單位作功能力被稱為該點勢,記為(r)。勢函數(shù)(r)是一種有關(guān)場點位置標量函數(shù),它在場空間中構(gòu)成一種標量場,即勢場。32第32頁梯度、散度與旋度梯度是描述標量場變化特性矢量函數(shù),它可以將一種標量場轉(zhuǎn)換為矢量場,也可以通過引入一種輔助標量函數(shù)來分析簡化矢量場。散度、旋度是描述矢量場兩個固有特性:源密度和旋渦密度物理量。在最一般狀況下,一種矢量場總可以被看作由一種有源場和一種旋渦場疊合構(gòu)成,如電磁場。因此一種含義不明矢量場只有當弄清它兩個分量各自奉獻和物理本質(zhì)后,即已知它散度和旋度后才算明確。33第33頁梯度場與旋度場、散度場梯度場=有勢場=有源場=保守場=無旋場34第34頁電場和引力場勢函數(shù)電場勢函數(shù)引力場勢函數(shù)從靜電場和引力場勢函數(shù)計算中可以發(fā)現(xiàn),兩種場物理機制雖然各不相似,但在數(shù)學形態(tài)上卻非常相似,即空間區(qū)域中不一樣樣物質(zhì)粒子互相作用數(shù)學本質(zhì)是相似或相近。35第35頁物理學中四種互相作用牛頓萬有引力定律(引力反比于距離平方)認為在多質(zhì)點系中存在兩兩互相作用引力場和引力勢能。庫倫定律(電力反比于距離平方)認為電荷之間通過電場互相作用,用電場線和等勢線可使電場分布形象化。具有相等電勢點構(gòu)成等勢面。36第36頁物理學中四種互相作用核物理認為,核子之間、核子與介子之間,通過夸克間互換膠子實現(xiàn)強互相作用。這就是力程甚短核力。按照普適費米理論,弱互相作用是一種點作用,不包括到任何場。后來人們發(fā)現(xiàn)這一觀點有問題。1984年若貝爾獎被授予魯比亞(CarloRubbia)和范得米爾(SimonVanderMeer)以表揚他們發(fā)現(xiàn)弱作用場量子W+ˉ和Z杰出奉獻。37第37頁物理學大統(tǒng)一理論假如以強互相作用強度為1話,電磁互相作用強度,其值約為10-2;弱互相作用約為10-13∽10-19;引力互相作用最弱,約為10-39。物理學家一直企圖將這四種互相作用進行統(tǒng)一。愛因斯坦努力了,沒有獲得成果。真正獲得進展是量子場論。量子電動力學解釋了電磁互相作用;量子色動力學解釋了強互相作用,又將弱互相作用與電磁互相作用進行統(tǒng)一,即溫伯格-薩拉姆電弱統(tǒng)一理論。大統(tǒng)一理論到目前還缺乏試驗驗證。38第38頁三、不確定性認知原子模型人類思維基本單元云模型及其數(shù)字特性正向云發(fā)生器和逆向云發(fā)生器持續(xù)數(shù)據(jù)離散化(概念化)概念粒度、概念空間和泛概念樹39第39頁人類思維活動層次性生命科學可還原成不一樣樣層次:如腦生物化學層次和神經(jīng)構(gòu)造層次。認知活動也許對應著一定生理上化學、電學變化。不過,目前生命科學還不能在思維活動與亞細胞化學、電學層次活動建立確切關(guān)系。如:一種概念怎樣以生物學形式寄存,它與其他概念發(fā)生聯(lián)絡生物學過程是什么。也不能決定什么樣神經(jīng)構(gòu)造可以決定著哪些認知模式發(fā)生。40第40頁人類思維活動層次性目前從腦生物化學層次和神經(jīng)構(gòu)造層次研究認知活動尚有困難。再說,如同我們不能從最基礎硅芯片活動來推測計算機網(wǎng)絡上電子郵件行為同樣,我們又怎么可以設想從分析單個離子、神經(jīng)元、突觸性質(zhì)就可以推斷人腦認知和思維活動呢?系統(tǒng)論有關(guān)系統(tǒng)整體特性不是由低層元素加和而成原理對還原論提出質(zhì)疑。因此,人工智能研究目前需要找到一種合適層次和單元,向上模擬人類認知和思維活動。41第41頁人類思維活動工具自然語言使人類獲得一種強有力思維工具,這是不爭事實,起到展現(xiàn)和保留思維對象及組織思維過程作用。它是其他多種形式化系統(tǒng)(語言)基礎,派生出像計算機語言這樣特殊語言,也派生出包括多種專業(yè)理論專門化語言,如數(shù)學語言。這些符號構(gòu)成形式系統(tǒng),又成為新一級形式化。42第42頁數(shù)學漢語
外語
自然語言符號語言自然語言和符號語言43第43頁人類思維活動工具自然語言中語言值表達概念,最基本語言值代表最基本概念,成為思維原子模型。同步,概念具有層次性。44第44頁概念—人類思維基本單元客觀世界包括物理對象,主觀世界從認知單元和它指向物理對象開始,反應了主客觀內(nèi)外聯(lián)絡特性。任何思維活動都是指向一定對象,通過對象存在到主觀意識自身存在。概念作為外部事物在主觀認知中對應物成為思維活動基本單元。不過概念不是孤立,它同外部背景有著種種聯(lián)絡,是演變和流動過程。因此,概念必然具有不確定性,甚至包括盲目性和散漫性。45第45頁概念形成:學習和記憶原則特性是概念一種構(gòu)成部分,是用來確認某一詳細樣例屬于該類別必要或充足條件。原型在概念中占有尤其地位。模糊邊界和不清晰樣例是概念普遍狀況。在一種概括性更高而詳細性更低組織水平上,下位概念作為一種樣例被使用,形成基本水平、下位水平和上位水平層次構(gòu)造(basiclever/subordinatelevel/superordinatelever)。概念形成是一再反復學習和記憶過程。46第46頁困擾人工智能認知模型怎樣表達用自然語言表述定性知識?怎樣反應自然語言中不確定性,尤其是模糊性和隨機性?怎樣實現(xiàn)定性和定量知識之間互相轉(zhuǎn)換?怎樣體現(xiàn)語言思索中軟推理能力?47第47頁知識表達人工智能要以機器為載體模仿以人腦為載體人思維活動——智能,必須找到在人腦和機器兩種載體之間建立聯(lián)絡手段,而這個任務正是由形式化來擔當。知識表達形式化在人工智能中居于措施論重要地位。48第48頁認知模型(CognitiveModeling) 云由許許多多云滴構(gòu)成,每一種云滴就是這個定性概念映射到數(shù)域空間一種點,即一次反應量樣例實現(xiàn)。這種實現(xiàn)帶有不確定性,模型同步給出這個點可以代表該定性概念確實定程度。49第49頁云圖可視化措施一給出云滴在數(shù)域(一維、二維或多維)位置,用一種點表達一種云滴;同步,用該點輝度表達出這個云滴可以代表概念確實定度。50第50頁“靠近坐標原點左右”10000個量化云滴。任何一種云滴都可以在一定程度上代表這個概念。51第51頁云圖可視化措施二用數(shù)域里一種圈或球表達一種云滴,其中心反應云滴在數(shù)域位置;同步,圈或球大小表達出這個云滴可以代表概念確實定度。52第52頁-3-2-1123-3-2-1123“靠近坐標點左右”200個量化云滴。任何一種云滴都可以在一定程度上代表這個概念。53第53頁云圖可視化措施三用N+1維表達,N維空間點表達云滴在數(shù)域位置,另一維表達這個云滴可以代表概念確實定度。54第54頁不一樣數(shù)值代表語言值“20km左右”確定程度55第55頁不一樣樣數(shù)值代表平面上點“靠近中心”確實定程度56第56頁期望值:在數(shù)域空間最可以代表這個定性概念點,反應了云滴群重心位置。云數(shù)字特性雙重性ExEnHe熵首先反應了在數(shù)域空間可被概念接受范圍,即模糊度,是定性概念亦此亦彼性度量;另一方面還反應了在數(shù)域空間點可以代表這個概念概率,表達定性概念云滴出現(xiàn)隨機性。熵揭示了模糊性和隨機性關(guān)聯(lián)性。超熵是熵不確定度量,即熵熵,反應了在數(shù)域空間代表該語言值所有點不確定度凝聚性,即云滴凝聚度。57第57頁正態(tài)云發(fā)生器實現(xiàn)算法1.生成以En為期望值,He為方差一種正態(tài)隨機數(shù)En’;2.生成以Ex為期望值,En’為方差一種正態(tài)隨機數(shù)x;3.計算4.使(x,y)成為論域中一種云滴;5.反復環(huán)節(jié)1~4直至規(guī)定數(shù)目旳云滴產(chǎn)生。58第58頁逆向云發(fā)生器算法1由Ex=求得Ex;2對每一對(xi,yi),由求出Eni;3由En=求得En;4求Eni均方差得到He;59第59頁云模型多種形態(tài)正態(tài)云
云其他多維云60第60頁例子:射擊評判射手乙射手甲射手丙評判人員:記錄學家、模糊學家、云理論研究者61第61頁射擊評判記錄學家用概率值表達射擊效果;模糊學家用從屬度表達射擊效果;裁判用總環(huán)數(shù)(模糊+記錄)表達射擊效果;人們用定性語言評價射擊效果,云措施用3個數(shù)字特性表達定性概念。62第62頁云評價措施略偏左上,比較離散,不穩(wěn)定略偏右下,射點集中,較穩(wěn)定射點靠近靶心,比較離散,不穩(wěn)定63第63頁原始靶標還原10發(fā)彈著點還原100發(fā)彈著點64第64頁誤解:云措施是模糊措施╳云措施沒有僅僅停留在哲學上思辯,也不能簡樸地說是概率措施或模糊措施,通過云模型實現(xiàn)定性概念和定量數(shù)據(jù)之間轉(zhuǎn)換是一種十分嚴格數(shù)學措施,使得定性和定量之間轉(zhuǎn)換變得十分清晰、詳細和可操作,同步又反應了轉(zhuǎn)換過程不確定性。65第65頁持續(xù)數(shù)據(jù)離散化對持續(xù)數(shù)據(jù),首先求得各數(shù)據(jù)點頻數(shù),對其分布進行云變換,使之成為若干個大小不一樣樣云疊加,每個云代表一種離散、定性概念。數(shù)據(jù)轉(zhuǎn)換為概念。66第66頁原始數(shù)據(jù)分布擬合成果云變換持續(xù)數(shù)據(jù)離散化:云變換67第67頁概念粒度在人意識活動中,思維推進是與概念轉(zhuǎn)移和提高相聯(lián)絡。轉(zhuǎn)移和提高跨度和途徑也是多樣,我們可以把在一定層次上思維模式看作是為原始思維活動拍攝一張快照。反應概念對應客觀事物粒度。概念粒度可以用云模型中熵度量。68第68頁概念空間概念空間是指同一類概念數(shù)域。例如,當討論語言變量—年齡這個范圍內(nèi)不一樣樣語言值時,如10歲左右、少年、青少年、中年、晚年等等概念,常常要明確它們在數(shù)域上所體現(xiàn)出內(nèi)涵和外延,以及互相之間等價(相似)關(guān)系或從屬(包括)關(guān)系。因此,不一樣樣信息粒度之間概念在概念空間會形成層次構(gòu)造。69第69頁概念層次構(gòu)造當討論語言變量—年齡這個范圍內(nèi)不一樣樣語言值(概念)時,常常要明確這些概念是大概念還是小概念,粗概念還是細概念,以及互相之間等價(相似)關(guān)系或從屬(包括)關(guān)系。因此,不一樣樣信息粒度之間概念在概念空間會形成層次構(gòu)造,或者說是泛概念樹構(gòu)造。70第70頁不一樣樣年齡人泛概念樹少年未成年人幼兒青年中年嬰幼兒兒童小學生中青年中學生大學生全部成年人青壯年老年…...71第71頁用云表達泛概念樹微觀層中觀層宏觀層年齡72第72頁泛概念樹可動態(tài)生成不一樣樣層次概念體現(xiàn)了定性概念隨機性和模糊性體現(xiàn)不一樣樣層次概念間多從屬關(guān)系反應了數(shù)據(jù)實際分布狀況泛概念樹爬升和跳躍73第73頁四、數(shù)據(jù)場和勢函數(shù)客體間互相作用和數(shù)據(jù)場勢函數(shù)及其確定準則用數(shù)據(jù)場思想進行特性提取和模式識別74第74頁數(shù)據(jù)場引入學科交叉滲透是目前科學發(fā)展總趨勢,對客觀世界認識和描述,不管是力學、熱物理、電磁學和近代物理,從粒子到宇宙在不一樣樣尺度上均有場作用。那么,人自身認知和思維過程,從數(shù)據(jù)到信息到知識,與否也可以用場來描述?75第75頁物理場舉例在一種質(zhì)量為M質(zhì)點產(chǎn)生引力場中,任一場點r處勢可以描述為:假如空間中存在多種質(zhì)點,則r處勢等于每個質(zhì)點單獨產(chǎn)生勢疊加,即76第76頁數(shù)據(jù)與數(shù)據(jù)場受物理場啟發(fā),可將物質(zhì)粒子間互相作用及其場描述措施擴展至抽象數(shù)據(jù)空間。數(shù)據(jù)空間中每個對象都相稱于一種質(zhì)點或核子,在其周圍產(chǎn)生一種球形對稱作用場,位于場內(nèi)所有對象都將受到其他對象聯(lián)合作用,從而在整個數(shù)據(jù)空間上形成一種場,我們稱之為數(shù)據(jù)場。正如引力場、核力場可以用勢函數(shù)描述,我們也引入勢函數(shù)來描述數(shù)據(jù)場性質(zhì)。77第77頁確定勢函數(shù)形態(tài)準則勢函數(shù)具有各向同性,即對稱性;勢函數(shù)是定義在數(shù)域空間上持續(xù)函數(shù);勢函數(shù)值隨離開場源距離增大而下降;表達勢函數(shù)持續(xù)函數(shù),應當光滑,即可微。78第78頁可選勢函數(shù)形態(tài)擬引力場勢函數(shù):擬核力場勢函數(shù):其中,為以場源坐標為原點時場點徑向半徑;參數(shù)k為一種正整數(shù),用于調(diào)整勢函數(shù)衰減特性;參數(shù)b∈(0,+∞),用于控制對象作用范圍,稱為影響因子;參數(shù)a相稱于質(zhì)點或核子質(zhì)量代表數(shù)據(jù)場強度。79第79頁兩種勢函數(shù)形態(tài)比較擬引力場勢函數(shù)擬核力場勢函數(shù)80第80頁數(shù)據(jù)場勢函數(shù)定義已知數(shù)據(jù)空間中對象集及其產(chǎn)生數(shù)據(jù)場,則任一場點y處勢函數(shù)可以定義為所有對象在該點處產(chǎn)生單位勢值疊加:其中,為場點y與對象xi間距離;81第81頁數(shù)據(jù)場可視化二維數(shù)據(jù)空間中一種數(shù)據(jù)集及其產(chǎn)生數(shù)據(jù)場等勢線圖82第82頁數(shù)據(jù)場擴展自然語言中基本語言值是定性概念,由于每個定性概念都可以用一種數(shù)值型集合來表達其內(nèi)涵和外延,即對應著一種定量數(shù)據(jù)子空間,稱為概念空間。概念和概念之間也可以通過場互相作用,形成概念間泛層次樹,又稱上、下位詞表。人類思維過程中對象,對應著一種定量數(shù)據(jù)空間,反應對象多種屬性,稱為特性空間。對象和對象之間也通過場互相作用,形成知識。概念空間和特性空間中場統(tǒng)稱為數(shù)據(jù)場。83第83頁我們將云滴確實定度視為場源質(zhì)量,顯然,確定度高云滴具有較強作用場。右圖中每個云滴位置坐標和確定度為:A(10,12,0.6)B(10,10,1)C(13,11,0.3)8910111213141589101112131415ABC不一樣樣確定度三個云滴形成數(shù)據(jù)場等勢線圖84第84頁用數(shù)據(jù)場思想進行特性提取和模式識別85第85頁ABCDEFGHIJ預處理后人臉圖像每幅圖象原始尺寸為256x256個像素點,256級灰度86第86頁灰度數(shù)據(jù)集映射成為數(shù)據(jù)場及勢局部極值ABCDEFGHIJ87第87頁8.6917308.41101913.612820J11.80192811.14101913.912718I12.45182911.8391814.082716H11.71182912.66101913.202619G10.96182812.80101913.142619F11.92182912.39101913.052619E11.25183012.05101812.812618D11.10182912.55101912.692619C10.92182911.88101913.292519B11.21193012.13101912.632619AVPYXVPYXVPYXThethirdfeatureThesecondfeatureThefirstfeatureNamefeature數(shù)據(jù)場極值成為邏輯特性88第88頁二次生成數(shù)據(jù)場進行模式識別Ifwepickupanextremelocalmaximumpotentialvalueanditspositionasthemostimportantfeatureforeachfaceimage,thefacialfeaturedatafieldforthetenfaceimagesmaybe,onceagain,illustratedbyanewisopotentiallines.89第89頁Faceidentificationwiththefirstfeature
ABCDEFGHIJ90第90頁IsopotentiallinesshowthesimilaritiesandoutliersforthetenimagesACEFGBDIHJABCDEFGHIJ91第91頁FaceRecognitionusingFacialMainFeatureDataFieldWemayalsopickupNlocalmaximumpotentialvaluesandtheirpositionsasthemainfeaturesforeachfacepicture,themainfeaturedataarecalculatedbyThemainfeaturedatafieldforthetenfacepictureisillustratedonceagainbyequalpotentiallines.and92第92頁用多種特性值融合后識別成果ABCDEFGHIJ93第93頁Faceidentification:discoveringsimilaritiesanddiscriminationBCGEDFAHIJABCDEFGHIJ94第94頁用數(shù)據(jù)場措施看IRIS數(shù)據(jù)分類95第95頁IRIS原始數(shù)據(jù)集2.15.43.16.9Virginica1.84.83.06.0Virginica…………Virginica2.55.73.36.7Virginica2.35.93.26.8Virginica…………Versicolour1.54.93.16.9Versicolour1.54.53.26.4Versicolour1.44.73.27.0Versicolour…………Setosa
0.21.43.65.0Setosa
0.21.33.24.7Setosa
0.21.43.04.9Setosa
0.21.43.55.1Setosa
花片寬度花瓣長度萼片寬度萼片長度類型96第96頁數(shù)據(jù)預處理對iris數(shù)據(jù)中萼片屬性和花瓣屬性分別做降維處理,得到新屬性:花瓣張角=arctg(花瓣寬度/花瓣長度);萼片張角=arctg(萼片寬度/萼片長度);97第97頁處理后數(shù)據(jù)集0.33930.4704Virginica0.40270.5016Virginica……Virginica0.41330.4577Virginica0.37170.4398Virginica……Versicolour0.29710.4223Versicolour0.32180.4636Versicolour0.28950.4288Versicolour……Setosa0.13260.5930Setosa0.15260.5978Setosa
0.14190.5494Setosa
0.14190.6015Setosa
花瓣張角萼片張角類型98第98頁預處理后數(shù)據(jù)分布99第99頁從數(shù)據(jù)場平面分布看分類成果100第100頁從數(shù)據(jù)場立體分布看分類成果12.376019.00029.99463.4336101第101頁五、認知場中知識發(fā)現(xiàn)數(shù)據(jù)挖掘與知識發(fā)現(xiàn)發(fā)現(xiàn)實狀況態(tài)空間類譜圖102第102頁數(shù)據(jù)挖掘與知識發(fā)現(xiàn)
DataMiningandKnowledgeDiscovery從大量、不完全、有噪聲、模糊、隨機實際應用數(shù)據(jù)中,提取隱含在其中、人們事先不懂得、但又是潛在有用信息和知識過程。103第103頁從數(shù)據(jù)中發(fā)現(xiàn)知識難點大量甚至海量數(shù)據(jù)中,存在有數(shù)據(jù)誤差、畸變、丟失或過度重疊,以歸納為主知識發(fā)現(xiàn)過程,實際上是建立在或多或少病態(tài)數(shù)據(jù)之上;由種種案例數(shù)據(jù)反推對象性質(zhì)可認為是逆向思維,人們在命題、措施或成果三個方面會獲得更多目旳選擇。104第104頁數(shù)據(jù)挖掘數(shù)據(jù)選擇預處理挖掘和發(fā)現(xiàn)知識解釋和驗證第105頁SelectionPreprocessingTransformationDataMiningInterpretation/EvaluationTragetDataProcessedDataTransformedDataPatternsKnowledgeDMKD系統(tǒng)基本構(gòu)成106第106頁發(fā)現(xiàn)什么樣知識?關(guān)聯(lián)知識聚類知識序列知識
分類知識預測知識相似時間序列第107頁數(shù)據(jù)挖掘工具歸納演繹聯(lián)想類比證偽第108頁數(shù)據(jù)挖掘與知識發(fā)現(xiàn)
DataMiningandKnowledgeDiscovery特定問題或特定環(huán)境下數(shù)據(jù),是一種原始、混亂、不成形自然狀態(tài)積累,但又是一種可以從中生長出秩序和規(guī)則源泉。怎樣透過表觀上千頭萬緒、混亂無規(guī),去挖掘蘊含其中規(guī)則性、有序性、有關(guān)性和離群性,這就是知識發(fā)現(xiàn)。109第109頁DMKD本質(zhì)什么是數(shù)據(jù)?什么是信息?什么是知識?本質(zhì)是歸納,是由微觀到中觀到宏觀抽象.瓶頸是數(shù)據(jù)、信息和知識表達不確定性問題.110第110頁發(fā)現(xiàn)實狀況態(tài)空間抽象程度AMTO111第111頁發(fā)現(xiàn)實狀況態(tài)空間特性空間對象通過場發(fā)生互相作用。如同物理學中粒子之間通過場(場量子)形成強力、電磁力、弱力或引力互相作用同樣。對象在特性空間互相作用形成場構(gòu)造反應了對象普遍知識(廣義知識)。伴隨描述對象粒度(熵)越來越大,形成普遍知識越來越宏觀。發(fā)現(xiàn)了知識上升到抽象級別更高層次。20世紀物理學發(fā)展是簡化歸納。數(shù)據(jù)挖掘本質(zhì)也是簡化歸納。112第112頁人類認知過程是對復雜對象關(guān)系中觀、宏觀知識發(fā)現(xiàn)過程,是對象所在特性空間微觀數(shù)據(jù)通過用自然語言表述不一樣樣抽象度概念非線性互相作用下涌現(xiàn)(突現(xiàn))自組織特性。113第113頁發(fā)現(xiàn)實狀況態(tài)空間==(特性空間|概念粒度)
114第114頁數(shù)據(jù)挖掘過程,實際上是從不一樣樣抽象度上認識數(shù)據(jù)。所謂微觀、中觀、宏觀,就是可視化稱謂。因此,數(shù)據(jù)挖掘需要各級視圖支持。115第115頁伴隨抽象度提高:描述每個屬性中概念粒度越來越大;特性空間對象之間關(guān)系越來越普遍;發(fā)現(xiàn)知識逐漸由微觀走向中觀、宏觀;整個歸納過程形成發(fā)現(xiàn)實狀況態(tài)空間不停轉(zhuǎn)換。116第116頁對象屬性選用形成不一樣樣視圖,好比是從不一樣樣角度投射到客體不一樣樣光柱,它們各有所見不及之處,但也各自照亮了不一樣樣景象。117第117頁從不一樣樣距離觀測客體群,各有所見之景象。通過推拉鏡頭,可以變化觀測距離,形成不一樣樣粒度視圖。118第118頁特性空間當我們討論一種客體(對象、事物、案例、記錄等)具有不一樣樣屬性或特性時,常常用特性空間作為討論問題范圍,N個屬性或特性,構(gòu)成N維空間。這時,這個客體成為特性空間一種點。特性空間任何一點勢可認為是所有客體在這一點勢疊加。119第119頁特性空間聚類和類譜圖當我們進行數(shù)據(jù)挖掘時,將數(shù)據(jù)庫中一條記錄按照其N個屬性,把這條記錄映射到特性空間中一種特定點上,成千上萬記錄在特性空間是成千上萬個點,整體上展現(xiàn)出抱團特性,可以通過嵌套等勢線(面)--自然拓撲構(gòu)造,形成自然聚類和類譜圖。120第120頁分類和聚類研究基礎性分類和聚類,乃是人類社會活動、生產(chǎn)活動以及科研活動中最基本、最重要活動之一。分類和聚類研究基礎性決定了其應用普遍性。121第121頁場措施發(fā)現(xiàn)聚類知識姓名工齡(月)工資(千元)A3030B5030C4070D6070E7050122第122頁304050607080工齡304050607080工資ABCDE特性空間5個對象自然聚類123第123頁5個對象構(gòu)成泛類譜系圖ABCDE124第124頁特性空間3000個對象自然聚類
ABC304050607080工齡304050607080工資ABCDE125第125頁和老式聚類措施比較:一般,人們用N個客體中N1個樣本作為訓練集去形成聚類成果,用N-N1個樣本作為測試集去驗證聚類效果。實際上,這就宣布了只有這N1個樣本才對聚類有奉獻,若N=100,極端地設想N1=2或N1=98,必然會有不一樣樣成果。怎樣確定N1并選用那些樣本為N1,成為一種大問題,也暴露出這種措施缺陷。126第126頁和老式聚類措施比較:從極微觀上看,這N個客體各自均有體現(xiàn)自身價值不一樣樣特性,差異是絕對旳,最嚴最細分法應當是N類。從極宏觀上看,這N個客體既然被用若干特性放到一起比較,闡明具有可比性,可以統(tǒng)屬一類。在發(fā)現(xiàn)實狀況態(tài)空間不一樣樣概念層次上聚類,以及聚類相對性,就是我們聚類觀。127第127頁知識就是不一樣樣層次上“規(guī)則+例外”128第128頁304050607080工齡304050607080工資清除例外后聚類圖AC304050607080工齡304050607080工資129第129頁304050607080工齡304050607080工資304050607080工齡304050607080工資3000個對象中類和離群相對性130第130頁信息粒度粒度(Granularity)原本是一種物理學概念,是指“微粒大小平均度量”,在這里被借用作為對概念抽象度度量。把概念可視化。概念粒度用云熵來度量。概念在定量空間位置用云期望值來標定。131第131頁信息粒度人類智能一種公認特點是人們可以從極不相似粒度上觀測和分析同一問題,各有各用處。人們不僅可以在同一粒度世界上進行問題求解,并且可以很快地從一種粒度世界跳到另一種粒度世界,來回自如;甚至具有同步處理不一樣樣粒度世界能力。這正是人類問題求解強有力體現(xiàn)。132第132頁觀測距離:境界決定了認知高度從較細粒度世界躍升到較粗粒度世界,是對信息或知識抽象,可以使問題簡化,數(shù)據(jù)處理量大大減少,這一過程稱為數(shù)據(jù)簡約或歸約。換句話說,用粗粒度觀測和分析信息,就是增長觀測距離,忽視細微差異,尋找共性。共性常常比個性更深刻,可以求得宏觀把握。133第133頁觀測距離:境界決定了認知高度反過來,縮短觀測距離,用細粒度觀測和分析信息,發(fā)現(xiàn)紛繁復雜表象,更精確地區(qū)分差異,個性要比共性豐富,不過不能完全進入共性之中。通過概念提高,就是增長觀測距離,可以發(fā)現(xiàn)更普遍知識。134第134頁拉鏡頭—發(fā)現(xiàn)特性空間宏觀知識:屬性方向和宏元組方向概括性加大;知識模板物理尺寸減小。從較細粒度躍升到較粗粒度世界,是對數(shù)據(jù)抽象,簡化問題,減少數(shù)據(jù)量,這一過程稱為數(shù)據(jù)歸約。忽視細微差異,尋找共性。共性常常比個性更深刻。135第135頁推鏡頭—發(fā)現(xiàn)特性空間微觀知識:在發(fā)現(xiàn)空間某個抽象層次上,縮短觀測距離,用較細粒度觀測和分析信息,發(fā)現(xiàn)紛繁復雜表象,更精確地區(qū)分差異;個性要比共性豐富,不過不能完全進入共性之中。136第136頁發(fā)現(xiàn)方略和措施發(fā)現(xiàn)是微觀和宏觀之間跳躍,是信息粒度變化,或者說是觀測距離不一樣樣;綜合運用歸納、類比、聯(lián)想,并結(jié)合證偽和演繹,形成五大手段;以云模型作為定性定量轉(zhuǎn)換和知識表達工具。詳細發(fā)現(xiàn)措施可以是多種多樣。137第137頁知識發(fā)現(xiàn)機理數(shù)據(jù)挖掘揭示了人類由個別到一般、從詳細到抽象“數(shù)據(jù)—概念—規(guī)則”認知規(guī)律。概念是認知基元;數(shù)據(jù)是形成概念要素;規(guī)則是在不一樣樣概念層次上客體之間關(guān)聯(lián);不一樣樣抽象度知識,實際上是不一樣樣概念層次上“規(guī)則加例外”而已;境界決定了認知高度。認知物理學用計算機詳細實現(xiàn)了這一規(guī)律發(fā)現(xiàn)過程。138第138頁從數(shù)據(jù)開采角度看專家系統(tǒng):專家系統(tǒng)是正向方式認識世界,以演繹為主;數(shù)據(jù)開采是逆向方式認識世界,以歸納為主。通過數(shù)據(jù)開采來發(fā)現(xiàn)知識過程,就是構(gòu)造專家系統(tǒng)、生成知識庫過程。139第139頁TheExperimentalDatabase140第140頁MiningAssociationRulesApriorialgorithmCloudbasedgeneralizationaspreprocessing2Dclouds:location1Dclouds:elevation,roaddensity,distancetothesea,averageineMinimumSupport:6%MinimumConfidence:75%Miningassociationatmultipleconceptlevels141第141頁DiscoveredAssociationRulesfor“averageine”Rule1:Iflocationis“southeast”,roaddensityis“high”,anddistancetotheseais“close”,thenaverageineis“high”.Rule2:Iflocationis
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三年級上美術(shù)教學設計-幸福樂園-湘美版
- 2024年五年級數(shù)學上冊 五 多邊形面積的計算 2三角形的面積教學設計 西師大版
- 20陀螺教學設計-2024-2025學年四年級上冊語文統(tǒng)編版
- Module 10 教學設計 2023-2024學年外研版七年級英語下冊
- 關(guān)系營銷企業(yè)內(nèi)部關(guān)系
- 競憑幼兒園園長述職報告
- 2024-2025學年高中生物 第1章 第4節(jié) 基因工程的發(fā)展前景教學設計 浙科版選修3
- 2024六年級語文下冊 第二單元 習作:寫作品梗概教學設計 新人教版
- 七年級英語下冊 Module 3 Making plans Unit 1 What are you going to do at the weekends第1課時教學設計(新版)外研版
- 2024-2025學年高中化學 第一章 第二節(jié) 原子結(jié)構(gòu)與元素的性質(zhì) 第2課時 元素周期律(一)教學設計 新人教版選修3
- 朱玉賢《現(xiàn)代分子生物學》(第5版)配套題庫【考研真題+章節(jié)題庫】
- 9《屈原列傳》課件 2023-2024學年統(tǒng)編版高中語文選擇性必修中冊
- 南方城市文遺運營計劃書【旅游】【文旅IP】【非遺文化】
- 京津冀地區(qū)農(nóng)業(yè)減污降碳增效協(xié)同:時空演變及影響因素研究
- 《遺傳病的治療》課件
- 《MATLAB編程及應用》全套教學課件
- 《銷售技巧培訓》課件
- 過敏性疾病(過敏性鼻炎)
- 2023年肉牛標準化規(guī)模養(yǎng)殖生產(chǎn)技術(shù)規(guī)范
- 2024年有關(guān)業(yè)主大會議事規(guī)則(示范文本)
- 《中國心力衰竭診斷和治療指南2024》解讀
評論
0/150
提交評論