《人工智能基礎(chǔ)與應(yīng)用》第6章 個(gè)性化:主動(dòng)滿足你的需求課后習(xí)題答案_第1頁(yè)
《人工智能基礎(chǔ)與應(yīng)用》第6章 個(gè)性化:主動(dòng)滿足你的需求課后習(xí)題答案_第2頁(yè)
《人工智能基礎(chǔ)與應(yīng)用》第6章 個(gè)性化:主動(dòng)滿足你的需求課后習(xí)題答案_第3頁(yè)
《人工智能基礎(chǔ)與應(yīng)用》第6章 個(gè)性化:主動(dòng)滿足你的需求課后習(xí)題答案_第4頁(yè)
《人工智能基礎(chǔ)與應(yīng)用》第6章 個(gè)性化:主動(dòng)滿足你的需求課后習(xí)題答案_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第6章個(gè)性化推薦:主動(dòng)滿足你的需求

課后習(xí)題答案

一、考考你

1.下列哪類算法不屬于個(gè)性化推薦旦。

A.協(xié)同推薦B.基于內(nèi)容的推薦

C.關(guān)聯(lián)規(guī)則推薦D.分類推薦

2.基于用戶的協(xié)同推薦算法的特點(diǎn)是?。

A.找出用戶的特征B.基于用戶行為計(jì)算用戶相似度

C.找出物品的特征D.計(jì)算物品的相似度

3.下列哪個(gè)方法上不是用于計(jì)算相似度的。

A.歐式距離B.皮爾遜相關(guān)系數(shù)

C.均方根誤差(RMSE)D.余弦向量

4.關(guān)聯(lián)規(guī)則中置信度的含義是其。

A.物品頻繁出現(xiàn)的概率B.一個(gè)物品的銷售數(shù)量對(duì)另一個(gè)物品的影響

C.規(guī)則出現(xiàn)的概率D.兩個(gè)物品同時(shí)出現(xiàn)的頻次與前一個(gè)物品出

現(xiàn)頻次的比例

5.在關(guān)聯(lián)規(guī)則分析過(guò)程中,對(duì)原始數(shù)據(jù)集進(jìn)行事務(wù)型數(shù)據(jù)處理的主要原因是C。

A.提高數(shù)據(jù)處理速度B.節(jié)省存儲(chǔ)空間

C.方便算法計(jì)算D.形成商品交易矩陣

二、亮一亮

L協(xié)同過(guò)濾推薦與關(guān)聯(lián)規(guī)則推薦的區(qū)別是什么?他們各自適用在哪些場(chǎng)合?

參考答案:

協(xié)同過(guò)濾(Collaborativefiltering),是指通過(guò)收集群體用戶的偏好信息,自動(dòng)化預(yù)

測(cè)(過(guò)濾)個(gè)體用戶可能感興趣的內(nèi)容。協(xié)同過(guò)濾基于如下基本假設(shè):如果一個(gè)人A

在一個(gè)問(wèn)題上和另一個(gè)人B持相同觀點(diǎn),那么對(duì)于另外一個(gè)問(wèn)題,比起隨機(jī)選擇的一

個(gè)路人C,A更有可能同B持相同觀點(diǎn)。具體包括USer-based的協(xié)同過(guò)濾和Item-based

的協(xié)同過(guò)濾技術(shù)。

關(guān)聯(lián)規(guī)則分析(ASSOCiatiOnRUIeS,又稱BasketAnalysis)用于從大量數(shù)據(jù)中挖掘出

有價(jià)值的數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)關(guān)系。關(guān)聯(lián)規(guī)則解決的常見(jiàn)問(wèn)題如:“如果一個(gè)消費(fèi)者購(gòu)買

了產(chǎn)品A,那么他有多大機(jī)會(huì)購(gòu)買產(chǎn)品B?”以及“如果他購(gòu)買了產(chǎn)品C和D,那么他

還將購(gòu)買什么產(chǎn)品?”

兩者的區(qū)別比較明顯:

1)關(guān)聯(lián)規(guī)則面向的是事務(wù)transaction,而協(xié)同過(guò)濾面向的是用戶偏好(評(píng)分)。

2)協(xié)同過(guò)濾在計(jì)算相似商品的過(guò)程中可以使用關(guān)聯(lián)規(guī)則分析,但是在有用戶評(píng)分

的情況下(非1/0),協(xié)同過(guò)濾算法應(yīng)該比傳統(tǒng)的關(guān)聯(lián)規(guī)則更能產(chǎn)生精準(zhǔn)的推薦。

3)協(xié)同過(guò)濾的約束條件沒(méi)有關(guān)聯(lián)規(guī)則強(qiáng),或者說(shuō)更為靈活,可以考慮更多的商業(yè)

實(shí)施措施和特殊的商業(yè)規(guī)則。

2.在案例1推薦你喜愛(ài)的電影中,如何計(jì)算兩個(gè)用戶之間的相似度?

參考答案:

任兩位用戶之間的相似度,是基于他倆都觀看過(guò)且評(píng)論過(guò)相同的電影,由于每位用

戶評(píng)論的電影不完全一樣,所以先要找到兩位用戶共同評(píng)論過(guò)的電影,然后再計(jì)算兩者

之間的相似度,相似度用歐式距離公式計(jì)算。

三、幫幫我

1.基于案例1的樣本數(shù)據(jù),利用基于物品的協(xié)同推薦算法向用戶推薦他喜歡的電影。

提示:

1)給用戶推薦那些和他之前喜歡的電影相似的電影。

2)計(jì)算物品相似度:首先統(tǒng)計(jì)每部電影被哪些人評(píng)論過(guò),記為{電影標(biāo)題:{用戶id:評(píng)分}},

其次計(jì)算兩部電影之間的相關(guān)系數(shù),即計(jì)算兩部電影被相同人評(píng)價(jià)過(guò)的差異,記為sim(a,b),

然后根據(jù)你擬推薦用戶曾經(jīng)看過(guò)的電影評(píng)分rating,以及與這些電影相似度最大的m部電影,

根據(jù)公式ratingXSim(a,b)計(jì)算用戶對(duì)電影的興趣度,記為{電影標(biāo)題:興趣度},最后取興趣

度最大的ToPN部電影推薦給該用戶,從而完成電影推薦工作。

參考答案:

importpandasaspd

frommathimport*

importoperator

#構(gòu)建用戶-->物品的字典

defloadData(moviesFile,ratingsFile):

movies=pd.read_csv(moviesFile)

ratings=pd.read_csv(ratingsFile)

,

merge-data=pd.merge(movies,ratings,on='movield)

,,1,,

merge_data=merge_data[['userld\rating?movield','title]].sort-values(userld)

datas=merge_data.values.tolist()

data={);

forlineindatas:

userid,score,item=line[O],line[l],line[3];

data.setdefault(userid,{});

data[userid][item]=score;

returndata

data=loadData('data∕movies.csv,,,data∕ratings.csv,)

#構(gòu)造物品-物品的相似矩陣

defsimilarity(data):

N={};#喜歡物品i的總?cè)藬?shù)

C={};#喜歡物品i也喜歡物品j的人數(shù)

foruser,itemindata.items():

fori,scoreinitem.items():

N.setdefault(i,O);

N[i]+=l;

C.setdefault(i,{});

forj,scoresinitem.items():

ifjnotini:

C[i].setdefault(j,O);

C[i]U]÷=l;

#計(jì)算物品與物品的相似矩陣

W={}

fori,iteminC.items():

W.setdefault(i,{});

forj,item2initem.items():

W[i].setdefault(j,O);

W[i]∣j]=C[i]∣j]∕sqrt(N[i]*Ng]);

returnW

#根據(jù)用戶的歷史記錄,給用戶推薦物品

defrecommandList(data,W,userid,k=3,N=10):

rank={};

fori,scoreindata[userid].items():#獲得用戶user歷史記錄,如A用戶的歷史記錄為

{,a,√Γ,,b,√Γ,,d,√l,}

forj,winSOrted(W[i].items。,key=operator.itemgetter(l)jeverse=True)[0:k]:#獲得

與物品i相似的k個(gè)物品

ifjnotindata[userid].keys():#該相似的物品不在用戶user的記錄里

rank.setdefault(j,O);

rank∣j]+=float(score)*w;

#返回推薦結(jié)果

returnsorted(rank.items(),key=operator.itemgetter(l),reverse=True)[0:N]

W=SimiIarity(data);#計(jì)算物品相似矩陣

Print(recommandLiSt(data,W,5,3,10));#打印出用戶id=5的最喜歡的3個(gè)物品的前10個(gè)推

薦結(jié)果

運(yùn)行結(jié)果:

[("JurassicPark(1993),,19.79018674461378),(,ForrestGump(1994),,13.053363686962662),CSilenceoftheLambs,The(1991)',8.5307

86098376653),CSleeplessinSeattle(1993)',4.751301463486936),CDave(1993),.4.59541429975512),CReservoirDogs(1992),,4.24876

8030134158),CCliffhanger(1993),.3.8219737518039247),CCrimsonTide(1995)*.3.7278490863031535),CGhost(1990)',3.1561237661048

516),CBambi(1942)?3.141404312187716)]

2.假如某零售超市準(zhǔn)備舉辦一場(chǎng)關(guān)于berries(漿果)旺季的促銷活動(dòng),請(qǐng)你根據(jù)案例2

的購(gòu)物籃數(shù)據(jù),找出包含berries的所有可行動(dòng)規(guī)則,據(jù)此為超市提供營(yíng)銷建議或策略。

參考答案:

解決本題的主要思路是基于groceries.csv的數(shù)據(jù)設(shè)置合理的置信度,計(jì)算出包含所有

berries的關(guān)聯(lián)規(guī)則,根據(jù)關(guān)聯(lián)規(guī)則為超市提供營(yíng)銷策略。

1)將groceries.csv文件轉(zhuǎn)換為事務(wù)型數(shù)據(jù)

importpandasaspd

importnumpyasnp

importcsv

frommlxtend.preprocessingimportTransactionEncoder

frommlxtend.frequent_patternsimportapriori

frommlxtend.frequent_patternsimportassociation_rules

ls_data=[]

withopen(r,data?groceries.csv,,,r,)asf:

reader=csv.reader(f)

forrowinreader:

Is_data.append(row)

te=TransactionEncoderO

#進(jìn)行One-hoi編碼

te_array=te.fit(ls_data).transform(ls_data)

df=pd.DataFrame(te_array,columns=te.columns_)

2)利用Apriori找出包含berries的頻繁項(xiàng)集(其中min_support是基于試驗(yàn)確定的值)

freqjtem=apriori(df,min_support=0.0?,max_len=2,use_colnames=True)

freq_item.sort_values(by-support1,axis=0,ascending=False)

,

freq-item.loc[freqJtem[itemsets'].str.len()>l].sort-values(by='support?axis=0,ascending=Fa

Ise)

#查看含有berries頻繁項(xiàng)集

SetJtemsets=map(set,freqjtem.itemsets.values.tolist())

freq_item['have-berries']=[,berries'iniforiinset_itemsets]

,

freq-item.loc[freq_item['have-berries]==True]

supportitemsetshave-berries

30.033249(berries)True

930.010269(Othervegetables,berries)True

940.011795(wholemilk,berries)True

950.010574(yogurt,berries)True

3)提取有用的銷售關(guān)聯(lián)規(guī)則

,,

pd.set-option(display.max-rows,None)

rules=association_rules(freq_item,min_threshold=0.025)

,

rules.sort-values(by=confidence',axis=0,ascending=False)

#選擇含有‘berries'的前因項(xiàng)的規(guī)則

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論