計(jì)算思維與人工智能基礎(chǔ)周勇課后習(xí)題答案_第1頁(yè)
計(jì)算思維與人工智能基礎(chǔ)周勇課后習(xí)題答案_第2頁(yè)
計(jì)算思維與人工智能基礎(chǔ)周勇課后習(xí)題答案_第3頁(yè)
計(jì)算思維與人工智能基礎(chǔ)周勇課后習(xí)題答案_第4頁(yè)
計(jì)算思維與人工智能基礎(chǔ)周勇課后習(xí)題答案_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1章

一、選擇題答案

1~4BCBC

第2章

一、選擇題答案

1~5CBCAB6~10CCDDA11-12BC

二、填空題答案

1.-9的原碼10001001、反碼11110110、補(bǔ)碼11H0U1

2.11111100101

3.8倍

4.-29.125

三、簡(jiǎn)答題答案(部分)

二進(jìn)制十進(jìn)制八進(jìn)制十六進(jìn)制

110011110314767

第2題110101.001153.187565.1435.3

0.100110.593750.460.98

10000116710343

十進(jìn)制二進(jìn)制十六進(jìn)制

97110000161

1281000000080

第3題0.50?10.8

50.625110010.10132.A

23611101100EC

20.0810100.000114.1

十進(jìn)制補(bǔ)碼

第4題

3500100011

000000000

-211111110

-1311110011

-7610110100

-12810000000

第5題如果一個(gè)有符號(hào)數(shù)占有n位,那么它的最大值是+(2"<1)0

字符ASCIIASCIIASCII

(十進(jìn)制)(十六進(jìn)制)(二進(jìn)制)

D684401000100

第6題

d1006401100100

3513300110011

空格322000100000

第3章

一、選擇題答案

1-5ACBDC6-10CDCBD11-15DCCBC

16-20CBCBC21-25AABDD26-28BCC

二、填空題答案

1.硬件系統(tǒng)軟件系統(tǒng)

2.輸入設(shè)備存儲(chǔ)器控制器運(yùn)算器輸出設(shè)備

3.38

4.文檔資料;應(yīng)用軟件

5.處理器管理存儲(chǔ)管理設(shè)備管理文件管理作業(yè)管理

6.實(shí)時(shí)

7.執(zhí)行狀態(tài)就緒狀態(tài)等待狀態(tài)

8.內(nèi)存分配內(nèi)存保護(hù)地址映射內(nèi)存擴(kuò)充

9.地址映射

10.指令

第4章

l.C2.C3.A4.A

5.客戶(hù)機(jī),服務(wù)器

6.同軸電纜、雙絞線(xiàn)、光纖

7.集線(xiàn)器

8.局域網(wǎng)、城域網(wǎng)、廣域網(wǎng)

9.1986年8月25日,瑞士日內(nèi)瓦時(shí)間4點(diǎn)11分,北京時(shí)間11點(diǎn)11分,由當(dāng)時(shí)任高能物

理所ALEPH組(ALEPH是在西歐核子中心高能電子對(duì)撞機(jī)LEP上進(jìn)行高能物理實(shí)驗(yàn)的一

個(gè)國(guó)際合作組,我國(guó)科學(xué)家參加了ALEPH組,高能物理所是該國(guó)際合作組的成員單位)組

長(zhǎng)的吳為民,從北京發(fā)給ALEPH的領(lǐng)導(dǎo)——位于瑞士日內(nèi)瓦西歐核子中心的諾貝爾獎(jiǎng)獲得

者斯坦伯格(JackSteinberger)的電子郵件是中國(guó)第一封國(guó)際電子郵件。1989年8月,中

國(guó)科學(xué)院承擔(dān)了國(guó)家計(jì)委立項(xiàng)的“中關(guān)村教育與科研示范網(wǎng)絡(luò)"(NCFC)——中國(guó)科技網(wǎng)

(CSTNET)前身的建設(shè)。1989年,中國(guó)開(kāi)始建設(shè)國(guó)家級(jí)四大骨干網(wǎng)絡(luò)聯(lián)網(wǎng)。1991年,在中

美高能物理年會(huì)上,美方提出把中國(guó)納入互聯(lián)網(wǎng)絡(luò)的合作計(jì)劃。1994年4月,NCFC率先與

美國(guó)NSFNET直接互聯(lián),實(shí)現(xiàn)了中國(guó)與Internet全功能網(wǎng)絡(luò)連接,標(biāo)志著我國(guó)最早的國(guó)際互

聯(lián)網(wǎng)絡(luò)的誕生。中國(guó)科技網(wǎng)成為中國(guó)最早的國(guó)際互聯(lián)網(wǎng)絡(luò)。1994年,中國(guó)第一個(gè)全國(guó)性

TCP/IP互聯(lián)網(wǎng)---CERNET示范網(wǎng)工程建成,并于同年先后建成。1994年,國(guó)家級(jí)四大骨干

網(wǎng)絡(luò)聯(lián)網(wǎng)(中國(guó)教育與科研計(jì)算機(jī)網(wǎng),中國(guó)科學(xué)技術(shù)網(wǎng),中國(guó)金橋信息網(wǎng),中國(guó)公用計(jì)算機(jī)

互聯(lián)網(wǎng))建成。1994年,中國(guó)終于獲準(zhǔn)加入互聯(lián)網(wǎng),并在同年5月完成全部中國(guó)聯(lián)網(wǎng)工作。

1995年,張樹(shù)新創(chuàng)立首家互聯(lián)網(wǎng)服務(wù)供應(yīng)商(瀛海威)老百姓進(jìn)入互聯(lián)網(wǎng)。1998年,CERNET

研究者在中國(guó)首次搭建IPV6試驗(yàn)床。2000年,中國(guó)三大門(mén)戶(hù)網(wǎng)站搜狐、新浪、網(wǎng)易在美國(guó)

納斯達(dá)克掛牌上市。2001年,下一代互聯(lián)網(wǎng)地區(qū)試驗(yàn)網(wǎng)在北京建成驗(yàn)收。2002年,第二季

度,搜狐率先宣布盈利,宣布互聯(lián)網(wǎng)的春天已經(jīng)來(lái)臨。

10.常見(jiàn)的網(wǎng)頁(yè)瀏覽器有InternetExplorer、MoziUaFirefox,Chrome>Safari,360安全瀏覽

器、搜狗瀏覽器等等。

第5章

1.4V特點(diǎn),Volume(大量),velocity(高速),Variety(多樣),Value(價(jià)值)。

2.數(shù)據(jù)倉(cāng)庫(kù)以關(guān)系數(shù)據(jù)庫(kù)為基礎(chǔ),無(wú)論是數(shù)據(jù)類(lèi)型還是數(shù)據(jù)量方面都存在較大的限制,而

大數(shù)據(jù)決策可以面向類(lèi)型繁多的、非結(jié)構(gòu)化的海量數(shù)據(jù)進(jìn)行決策分析。

3.略

4.現(xiàn)今社會(huì),很多智能應(yīng)用是物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)技術(shù)的有效集成,它們?nèi)吖餐瑯?gòu)建

起現(xiàn)代智能系統(tǒng)。以智能公交系統(tǒng)為例,公共汽車(chē)、電子站牌以及智能移動(dòng)終端的互連網(wǎng)絡(luò)

是物聯(lián)網(wǎng),這是整個(gè)智能公交系統(tǒng)的網(wǎng)絡(luò)通信的基礎(chǔ),公交監(jiān)控調(diào)度中心基于云計(jì)算模式使

用各種資源(包括網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)、應(yīng)用軟件等),同時(shí)智能公交系統(tǒng)產(chǎn)生大量數(shù)據(jù),

包括公共汽車(chē)運(yùn)行情況、道路擁堵情況、公共汽車(chē)載客量、用戶(hù)查詢(xún)情況等等,此類(lèi)大數(shù)據(jù)

分析,對(duì)于設(shè)計(jì)公交線(xiàn)路,調(diào)度公交車(chē)次有著重大的價(jià)值。

第6章

第六章程序設(shè)計(jì)題,解題方法不止一種,答案僅提供1種思路供參考。

1.數(shù)雞蛋問(wèn)題。雞蛋最少是52個(gè)。

End

2.吃饅頭問(wèn)題。大人20個(gè),小孩80個(gè)。

End

3.雞兔同籠問(wèn)題。雞16只,兔子3只。

End

4.單據(jù)涂抹問(wèn)題。11859。

End

5.貨幣問(wèn)題。4種組合。

第一種50元1張,10元19張;第二種50元2張,10元14張;

第三種50元3張,10元9張;第四種50元4張,10元4張;

6.樓梯走法問(wèn)題。233種方法。

End

7.猴子吃桃問(wèn)題。第一天摘了1534只桃子。

End

8.遞歸求累加和。

9.冒泡排序升序結(jié)果:

第一趟{7,4,11,12,5,9,34)

第二趟{4,7,11,5,9,12,34)

第三趟{4,7,5,9,11,12,34)

第四趟{4,5,7,9,11,12,34)

第五趟{4,5,7,9,11,12,34)

第六趟(4,5,7,9,11,12,34)

10.選擇排序降序結(jié)果:

第一趟{50,7,8,11,33,22,1)

第二趟{50,33,8,11,7,22,1)

第三趟{50,33,22,11,7,8,1)

第四趟{50,33,22,11,7,8,1)

第五趟{50,33,22,11,8,7,1}

第六趟{50,33,22,11,8,7,I)

第7章

1.什么是人工智能?它的研究目標(biāo)是什么?

人工智能,就是人類(lèi)智能的人工實(shí)現(xiàn)。具體來(lái)說(shuō),是指機(jī)器根據(jù)人類(lèi)給定的初始信息來(lái)

生成和調(diào)度知識(shí)、進(jìn)而在目標(biāo)引導(dǎo)下由初始信息和知識(shí)生成求解問(wèn)題的策略并把智能策略轉(zhuǎn)

換為智能行為從而解決問(wèn)題的能力。從學(xué)科的角度而言,人工智能是一門(mén)研究如何構(gòu)造智能

機(jī)器或智能系統(tǒng),使它能模擬、延伸、擴(kuò)展人類(lèi)智能的學(xué)科。這門(mén)學(xué)科最大的魅力在于為探

索“智能理論”提供了-一種媒介和實(shí)驗(yàn)平臺(tái):首先用計(jì)算機(jī)程序語(yǔ)言表達(dá)這些理論,然后再在

實(shí)際計(jì)算機(jī)上執(zhí)行來(lái)進(jìn)行測(cè)試和驗(yàn)證,其最終目標(biāo)是建立關(guān)于智能的理論體系和讓智能機(jī)器

達(dá)到人類(lèi)的智能水平。

2.簡(jiǎn)述人工智能研究各個(gè)發(fā)展階段及其特點(diǎn)。

3.機(jī)器要通過(guò)圖靈測(cè)試,所需要的主要技術(shù)有哪些?

一臺(tái)機(jī)器要通過(guò)圖靈測(cè)試,它至少需要有下面的能力:

1.自然語(yǔ)言處理:實(shí)現(xiàn)用自然語(yǔ)言與計(jì)算機(jī)進(jìn)行交流;

2.知識(shí)表示:存儲(chǔ)它知道的或聽(tīng)到的、看到的;

3.自動(dòng)推理:能根據(jù)存儲(chǔ)的信息回答問(wèn)題,并提出新的結(jié)論;

4.機(jī)器學(xué)習(xí):能適應(yīng)新的環(huán)境,并能檢測(cè)和推斷新的模式;

4.人工智能有哪些重要的學(xué)派,它們的認(rèn)知觀是什么?

人工智能的主要研究的學(xué)派有符號(hào)主義(SymbolicismSymbolicism)、連接主義

(ConnectionismConnectionism)和行為主義(Actionism)。符號(hào)主義其原理主要為物理符號(hào)

系統(tǒng)(即符號(hào)操作系統(tǒng))假設(shè)和有限合理性原理。連接主義其原理主要為神經(jīng)網(wǎng)絡(luò)及神經(jīng)網(wǎng)

絡(luò)間的連接機(jī)制與學(xué)習(xí)算法。行為主義其原理為控制論及感知-動(dòng)作型控制系統(tǒng)。

符號(hào)主義,又稱(chēng)為邏輯主義、心理學(xué)派或計(jì)算機(jī)學(xué)派,認(rèn)為人的認(rèn)知基元是符號(hào),而且

認(rèn)知過(guò)程即符號(hào)操作過(guò)程。它認(rèn)為智能是一個(gè)物理符號(hào)系統(tǒng),計(jì)算機(jī)也是一個(gè)物理符號(hào)系統(tǒng)。

因此,我們就能夠用計(jì)算機(jī)來(lái)模擬人的智能行為,即用計(jì)算機(jī)的符號(hào)操作來(lái)模擬人的認(rèn)知過(guò)

程。連接主義又稱(chēng)為仿生學(xué)派或生理學(xué)派,認(rèn)為人的思維基元是神經(jīng)元,而不是符號(hào)處理過(guò)

程。它對(duì)物理符號(hào)系統(tǒng)假設(shè)持反對(duì)意見(jiàn),認(rèn)為人腦不同于電腦,并提出連接主義的大腦工作

模式,用于取代符號(hào)操作的電腦工作模式。行為主義又稱(chēng)為進(jìn)化主義或控制論學(xué)派,認(rèn)為人

工智能的研究方法應(yīng)采用行為模擬方法,也認(rèn)為功能、結(jié)構(gòu)和智能行為是不可分開(kāi)的。不同

的行為表現(xiàn)出不同的功能和不同的控制結(jié)構(gòu)。認(rèn)為智能取決于感知和行動(dòng)(所以被稱(chēng)為行為

主義),提出智能行為的“感知一動(dòng)作”模式。

5.請(qǐng)列舉人工智能研究的主要應(yīng)用領(lǐng)域。

問(wèn)題求解與博弈、專(zhuān)家系統(tǒng)、模式識(shí)別、智能決策支持系統(tǒng)、自然語(yǔ)言處理、智能檢

索、自動(dòng)駕駛、機(jī)器人學(xué)、人工智能+等。

6.你認(rèn)為人工智能作為一門(mén)學(xué)科,今后的發(fā)展方向應(yīng)該如何?

7.人工智能如何更好的和傳統(tǒng)行業(yè)融合,實(shí)現(xiàn)人工智能+?

第8章

1.2.5.7略

3.以變量m、f、s、v分別指示農(nóng)夫、狐貍、小羊、菜,且每個(gè)變量只可取值1(表示在左岸)

或0(表示在右岸)。問(wèn)題狀態(tài)可以四元組(m、f、s、v)描述,設(shè)初始狀態(tài)下均在左岸,目標(biāo)狀

態(tài)下都到達(dá)右岸。從而,問(wèn)題求解任務(wù)可描述為

(1,1,1,1)->(0,0,0,0)

設(shè)計(jì)二類(lèi)操作算子:Lx、Rx,x為m、f、s、V時(shí)分別指示農(nóng)夫獨(dú)自,帶狐貍,帶小羊,帶菜過(guò)

河;狀態(tài)空間圖如下所示.由于Lx和Rx是互逆操作,故而解答路徑可有無(wú)數(shù)條,但最近的只

有二條;都是7個(gè)操作步。

0001)0100

0010

1010

ILs

0000

4.設(shè)用SK=(Sk0,Ski)表示問(wèn)題的狀態(tài),SKO表示盤(pán)片A所在的柱號(hào),S3表示盤(pán)片B所在的

柱號(hào),全部可能的狀態(tài)有九種:

So=(l,l),S1=(1,2),S2=(l,3)

S3=(2,l),S4=(2,2),Ss=(2,3)

S6=(3,l),S7=(3,2),$8=(3,3)

問(wèn)題的初始狀態(tài)集合為S=S<),目標(biāo)狀態(tài)集合為G=S8O

算符分別用A(iJ)及B(ij)oA(i』)表示把A盤(pán)片從第i號(hào)柱移到第j號(hào)柱。

B(i,j)與之同理。算符共有12個(gè)。

在狀態(tài)空間圖中,從初始節(jié)點(diǎn)(1,1)到目標(biāo)節(jié)點(diǎn)(3,3)的任何一條通路都是問(wèn)題的一個(gè)解。

其中最短的路徑長(zhǎng)度是3,它由3個(gè)算符組成。例如:A(12),B(1,3),A(23)。

6.根節(jié)點(diǎn)的MAX值是3

第9章

1.什么是機(jī)器學(xué)習(xí)?機(jī)器學(xué)習(xí)的研究目標(biāo)是什么?

關(guān)于機(jī)器學(xué)習(xí)迄今為止也沒(méi)有一個(gè)被廣泛認(rèn)可的準(zhǔn)確定義。從直觀上理解,機(jī)器學(xué)習(xí)就

是讓機(jī)器(計(jì)算機(jī))來(lái)模擬人類(lèi)的學(xué)習(xí)功能,是一門(mén)研究怎樣用機(jī)器來(lái)模擬或?qū)崿F(xiàn)人類(lèi)學(xué)習(xí)

活動(dòng)的一門(mén)學(xué)科。機(jī)器學(xué)習(xí)是人工智能中最具有智能特征的前沿研究領(lǐng)域之一。

機(jī)器學(xué)習(xí)的研究主要集中在以下三個(gè)方面展開(kāi):一是認(rèn)知模型的研究,目的是要通過(guò)對(duì)

人類(lèi)學(xué)習(xí)機(jī)理的研究和模擬,從根本上解決機(jī)器學(xué)習(xí)方面存在的種種問(wèn)題;二是理論學(xué)習(xí)的

研究,目的是要從理論上探索各種可能的學(xué)習(xí)方法,并建立起獨(dú)立于具體應(yīng)用領(lǐng)域的學(xué)習(xí)算

法;三是面向任務(wù)的研究,目的是要根據(jù)特定任務(wù)的要求建立相應(yīng)的學(xué)習(xí)系統(tǒng)。

2.什么是監(jiān)督學(xué)習(xí)?什么是無(wú)監(jiān)督學(xué)習(xí)?

監(jiān)督學(xué)習(xí)是通過(guò)已有的訓(xùn)練樣本(即已知數(shù)據(jù)以及其對(duì)應(yīng)的輸出)進(jìn)行訓(xùn)練,從而得到

一個(gè)最優(yōu)模型,再利用這個(gè)模型將所有新的數(shù)據(jù)樣本映射為相應(yīng)的輸出結(jié)果,對(duì)輸出結(jié)果進(jìn)

行簡(jiǎn)單的判斷從而實(shí)現(xiàn)分類(lèi)的目的。

無(wú)監(jiān)督學(xué)習(xí)是用來(lái)學(xué)習(xí)的數(shù)據(jù)在沒(méi)有任何類(lèi)別信息以及給定目標(biāo)值的情況下,通過(guò)學(xué)習(xí)

尋求數(shù)據(jù)間的內(nèi)在模式和統(tǒng)計(jì)規(guī)律,從而獲得樣本數(shù)據(jù)的結(jié)構(gòu)特征。

3.簡(jiǎn)述解決機(jī)器學(xué)習(xí)問(wèn)題的一般步驟。

收集數(shù)據(jù):可以使用很多方法收集樣本數(shù)據(jù),如制作網(wǎng)頁(yè)爬蟲(chóng)工具從網(wǎng)站上抽取數(shù)據(jù)、

智能設(shè)備發(fā)送過(guò)來(lái)的實(shí)測(cè)數(shù)據(jù)(溫度、血壓等)。獲得數(shù)據(jù)的方法有很多,為了確保實(shí)驗(yàn)的

可驗(yàn)證性和準(zhǔn)確性、節(jié)省時(shí)間和精力,一般采用公測(cè)數(shù)據(jù)集。

輸入數(shù)據(jù):獲得數(shù)據(jù)后,還必須確保數(shù)據(jù)格式符合要求,與收集數(shù)據(jù)的格式相比,處理

算法要求的格式相對(duì)簡(jiǎn)單很多。

數(shù)據(jù)預(yù)處理:為了從這些數(shù)字或符號(hào)(串)中抽取出對(duì)機(jī)器學(xué)習(xí)有效的信息,必須進(jìn)行數(shù)

據(jù)預(yù)處理,包括數(shù)據(jù)清理和特征提取等。數(shù)據(jù)預(yù)處理是一個(gè)非常重要的步驟,它影響著整個(gè)

機(jī)器學(xué)習(xí)的成敗。

訓(xùn)練算法:機(jī)器學(xué)習(xí)算法從這一步才真正開(kāi)始學(xué)習(xí)。根據(jù)算法的不同,第四步和第五步

是機(jī)器學(xué)習(xí)算法的核心。我們將前三步得到的格式化數(shù)據(jù)輸人到算法,從中抽取知識(shí)或信息。

這里得到的知識(shí)需要存儲(chǔ)為計(jì)算機(jī)可以處理的格式,方便后續(xù)步驟使用。

如果使用無(wú)監(jiān)督學(xué)習(xí)算法,由于不存在目標(biāo)變量值,故而也不需要訓(xùn)練算法,所有與算

法相關(guān)的內(nèi)容都集中在第五步。

測(cè)試、驗(yàn)證模型:測(cè)試模型的目的是為了確定所建立模型是否滿(mǎn)足實(shí)際應(yīng)用的要求。測(cè)

試數(shù)據(jù)應(yīng)該和訓(xùn)練用的樣本數(shù)據(jù)不一致,否則,測(cè)試所得的結(jié)果永遠(yuǎn)都是滿(mǎn)意的。用測(cè)試數(shù)

據(jù)對(duì)所建立模型進(jìn)行測(cè)試,觀察測(cè)試結(jié)果是否與實(shí)際情況是相符合。若與實(shí)際情況相符合,

所建立模型就可對(duì)未知數(shù)據(jù)做預(yù)測(cè),從而得到進(jìn)一步的驗(yàn)證。

4.什么是聚類(lèi)?常見(jiàn)的聚類(lèi)算法有哪些?

聚類(lèi)(Clustering)是一種無(wú)監(jiān)督的學(xué)習(xí)方法,目標(biāo)是通過(guò)對(duì)無(wú)標(biāo)記訓(xùn)練樣本的學(xué)習(xí)來(lái)揭

示數(shù)據(jù)的內(nèi)在的性質(zhì)和規(guī)律,為進(jìn)一步的數(shù)據(jù)分析提供基礎(chǔ)。聚類(lèi)基于“物以類(lèi)聚”的思想,

通過(guò)計(jì)算對(duì)象個(gè)體或?qū)ο箢?lèi)之間的相似程度,將滿(mǎn)足相似條件的對(duì)象個(gè)體或?qū)ο箢?lèi)分入同一

類(lèi)(簇)內(nèi);不滿(mǎn)足相似條件的對(duì)象個(gè)體或?qū)ο箢?lèi)分入不同類(lèi)(簇)中,使劃分結(jié)果滿(mǎn)足類(lèi)

內(nèi)元素相似度高、類(lèi)間元素相似程度低的要求。

主要的聚類(lèi)算法可以劃分為以下4個(gè)類(lèi)型:基于劃分的聚類(lèi)方法:代表算法有:K-

MEANS算法、K-MEDOIDS算法、CLARANS算法等;基于層次的聚類(lèi)方法:代表算法有

BIRCH算法、CURE算法、CHAMELEON算法等;基于密度的聚類(lèi)方法:代表算法有

DBSCAN算法、OPTICS算法、DENCLUE算法等;基于網(wǎng)格的聚類(lèi)方法:代表算法有STING

算法、CLIQUE算法、WAVE-CLUSTER算法等。

5.什么是分類(lèi)?常見(jiàn)的分類(lèi)算法有哪些?

分類(lèi)(Classification)是機(jī)器學(xué)習(xí)的一項(xiàng)重要任務(wù),是指在數(shù)據(jù)庫(kù)的各個(gè)對(duì)象中找出共

同特征,并按照分類(lèi)模型把它們進(jìn)行分類(lèi)。分類(lèi)分析時(shí)將依據(jù)“訓(xùn)練集”數(shù)據(jù)的類(lèi)標(biāo)號(hào),對(duì)類(lèi)

進(jìn)行準(zhǔn)確的描述或者建立模型,該模型能夠很好地?cái)M合輸入數(shù)據(jù)中類(lèi)標(biāo)號(hào)和屬性集之間的聯(lián)

系,還要能正確地預(yù)測(cè)未知樣本的類(lèi)標(biāo)號(hào)。常見(jiàn)的分類(lèi)算法有決策樹(shù)、貝葉斯、k-近鄰、支

持向量機(jī)。

6.給定貸款申請(qǐng)樣本數(shù)據(jù)集,如表9-6所示,請(qǐng)回答以下問(wèn)題:

(1)決策樹(shù)ID3算法會(huì)選擇哪個(gè)屬性作為根節(jié)點(diǎn)?

(2)構(gòu)造該決策樹(shù)。

表9-6貸款申請(qǐng)樣本數(shù)據(jù)集

序號(hào)年齡工作信息房產(chǎn)信息信貸情況類(lèi)別

1青年無(wú)無(wú)一般否

2青年無(wú)無(wú)好否

3青年有無(wú)好是

4青年有有一般是

5青年無(wú)無(wú)一般否

6中年無(wú)無(wú)一般否

7中年無(wú)無(wú)好否

8中年有有好是

9中年無(wú)有非常好是

10中年無(wú)有非常好是

11老年無(wú)有非常好是

12老年無(wú)有好是

13老年有無(wú)好是

14老年有無(wú)非常好是

15老年無(wú)無(wú)一般否

解:假定樣本集為S,分別以A,B,C,。分別表示年齡、工作、房產(chǎn)和信貸情況4個(gè)

特征,的,。2,G分別表示特征A的取值青年、中年和老年;歷,岳分別表示特征8的取值無(wú)

工作和有工作;0,C2分別表示特征C的取值無(wú)房產(chǎn)和有房產(chǎn);a,C2,。3分別表示特征D的

取值信貸情況一般、信貸情況好和信貸情況非常好,然后計(jì)算各特征對(duì)數(shù)據(jù)集S的信息增益

值。

對(duì)于給定的數(shù)據(jù)集S,其期望信息量為:

M(S)=-(9/15)log2(9/15)-(6/15)log2(6/15)=0.971bits

選取屬性A作為根節(jié)點(diǎn)的期望信息量為:

B(S,A)=Z(屬性A取值為A的概率)xM(a,.)

=(5/15)M(4)+(5/15)加(出)+(5/15)M(%)=0.888

則屬性A的信息增益值為:M(S)-B(S,A)=0.971-0.888=0.083bits

同理,可求得屬性B的信息增益值為:

M(S)—B(S,B)=0.971-0.647=0.324bits

屬性C的信息增益值為:

M(S)一伙S,C)=0.971-0.551=0.42bits

屬性。的信息增益值為:

M(S)-B(S,D)=0.971-0.608=0.363bits

最后比較各特征的信息增益值,由于特征C(房產(chǎn)信息)的信息增益值最大,所以選擇特

征C作為根節(jié)點(diǎn)的特征。它將訓(xùn)練數(shù)據(jù)集劃分為兩個(gè)子集G(取值為有)和C2(取值為無(wú))。由

于G只有同一類(lèi)樣本點(diǎn),所以它成為一個(gè)葉節(jié)點(diǎn),節(jié)點(diǎn)類(lèi)標(biāo)記為“有

對(duì)于C2則需要從特征A(年齡),B(工作信息)和。(信貸情況)中選擇新的特征。計(jì)算各

個(gè)特征的信息增益,分別為:

M(C2)-B(C2,A)=0.252

M(C2)-B(C2,B)=0.918

M(C2)-B(C2,Z))=0.474

選擇信息增益最大的特征B(工作信息)作為節(jié)點(diǎn)特征。8有2個(gè)取值,一個(gè)對(duì)應(yīng)“有”的

子節(jié)點(diǎn),包含3個(gè)樣本,他們屬于同一類(lèi),所以這是一個(gè)葉節(jié)點(diǎn),類(lèi)標(biāo)記為“有”;另一個(gè)對(duì)

應(yīng)“無(wú)”(無(wú)工作)的子節(jié)點(diǎn),包含6個(gè)樣本,屬于同一類(lèi),這也是一個(gè)葉節(jié)點(diǎn),類(lèi)標(biāo)記為“無(wú)”。

至此,該決策樹(shù)己構(gòu)建完成,如圖所示。

7.假設(shè)數(shù)據(jù)集。中有10個(gè)數(shù)據(jù)對(duì)象(用二維空間的點(diǎn)表示),分別是:

A(4,1),4(3,8),4(8,5),4(9,5),員(2,4)

鼻(3,3),B」(4,9),G(4,8),C,(9,6),Q(2,2)

用KMea〃s聚類(lèi)算法將這些數(shù)據(jù)進(jìn)行聚類(lèi),距離計(jì)算辦法采用歐氏距離。

解:首先給定聚類(lèi)數(shù)K=3,隨機(jī)選取m,機(jī)2,如作為初始類(lèi)的中心點(diǎn),分別是如=

4(4,1),皿=員(2,4),-3=G(2,2),開(kāi)始迭代。

第一次迭代:分別計(jì)算數(shù)據(jù)集中其余每個(gè)對(duì)象到這3個(gè)類(lèi)中心點(diǎn)的距離,并將其分配給

距離最近的中心點(diǎn)所代表的簇,這樣就可以得到3個(gè)簇,分別是:

K尸{AI,A3,S,C2},K2={A2,B2,B,,BA,G},&={G}

對(duì)這個(gè)結(jié)果重新計(jì)算每個(gè)簇的均值。將虛擬中心點(diǎn)更新為科=(7.5,4.25),機(jī)2=(326.4),

儂=(2,2)?

第二次迭代:重復(fù)第一次迭代中的方法,得到新的3個(gè)簇為:

K產(chǎn){-3,小@,長(zhǎng)={4,8,G},K3={Al,82,83,C3}

更新后的中心點(diǎn)為如=(8.6,5.3),,"2=(3.6,8.3),儂=(2.75,2.5)。

第三次迭代:重復(fù)第一次迭代中的方法,得到新的3個(gè)簇為:

K尸{A.—},K2={A2,B4,CI},&={AI,82,C3}

比較第三次與第二次的迭代結(jié)果,可以發(fā)現(xiàn):每個(gè)簇中的數(shù)據(jù)不再被重新分配,聚類(lèi)結(jié)

果穩(wěn)定,則算法終止。

8.數(shù)據(jù)集S如表9-7所示,試根據(jù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論