![《人工智能基礎(chǔ)與應(yīng)用》第6章 個(gè)性化:主動(dòng)滿足你的需求課后習(xí)題答案_第1頁(yè)](http://file4.renrendoc.com/view11/M03/35/2E/wKhkGWXqeqqAAzcRAAHaSI6Qvro082.jpg)
![《人工智能基礎(chǔ)與應(yīng)用》第6章 個(gè)性化:主動(dòng)滿足你的需求課后習(xí)題答案_第2頁(yè)](http://file4.renrendoc.com/view11/M03/35/2E/wKhkGWXqeqqAAzcRAAHaSI6Qvro0822.jpg)
![《人工智能基礎(chǔ)與應(yīng)用》第6章 個(gè)性化:主動(dòng)滿足你的需求課后習(xí)題答案_第3頁(yè)](http://file4.renrendoc.com/view11/M03/35/2E/wKhkGWXqeqqAAzcRAAHaSI6Qvro0823.jpg)
![《人工智能基礎(chǔ)與應(yīng)用》第6章 個(gè)性化:主動(dòng)滿足你的需求課后習(xí)題答案_第4頁(yè)](http://file4.renrendoc.com/view11/M03/35/2E/wKhkGWXqeqqAAzcRAAHaSI6Qvro0824.jpg)
![《人工智能基礎(chǔ)與應(yīng)用》第6章 個(gè)性化:主動(dòng)滿足你的需求課后習(xí)題答案_第5頁(yè)](http://file4.renrendoc.com/view11/M03/35/2E/wKhkGWXqeqqAAzcRAAHaSI6Qvro0825.jpg)
下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第6章個(gè)性化推薦:主動(dòng)滿足你的需求
課后習(xí)題答案
一、考考你
1.下列哪類算法不屬于個(gè)性化推薦旦。
A.協(xié)同推薦B.基于內(nèi)容的推薦
C.關(guān)聯(lián)規(guī)則推薦D.分類推薦
2.基于用戶的協(xié)同推薦算法的特點(diǎn)是?。
A.找出用戶的特征B.基于用戶行為計(jì)算用戶相似度
C.找出物品的特征D.計(jì)算物品的相似度
3.下列哪個(gè)方法上不是用于計(jì)算相似度的。
A.歐式距離B.皮爾遜相關(guān)系數(shù)
C.均方根誤差(RMSE)D.余弦向量
4.關(guān)聯(lián)規(guī)則中置信度的含義是其。
A.物品頻繁出現(xiàn)的概率B.一個(gè)物品的銷售數(shù)量對(duì)另一個(gè)物品的影響
C.規(guī)則出現(xiàn)的概率D.兩個(gè)物品同時(shí)出現(xiàn)的頻次與前一個(gè)物品出
現(xiàn)頻次的比例
5.在關(guān)聯(lián)規(guī)則分析過(guò)程中,對(duì)原始數(shù)據(jù)集進(jìn)行事務(wù)型數(shù)據(jù)處理的主要原因是C。
A.提高數(shù)據(jù)處理速度B.節(jié)省存儲(chǔ)空間
C.方便算法計(jì)算D.形成商品交易矩陣
二、亮一亮
L協(xié)同過(guò)濾推薦與關(guān)聯(lián)規(guī)則推薦的區(qū)別是什么?他們各自適用在哪些場(chǎng)合?
參考答案:
協(xié)同過(guò)濾(Collaborativefiltering),是指通過(guò)收集群體用戶的偏好信息,自動(dòng)化預(yù)
測(cè)(過(guò)濾)個(gè)體用戶可能感興趣的內(nèi)容。協(xié)同過(guò)濾基于如下基本假設(shè):如果一個(gè)人A
在一個(gè)問(wèn)題上和另一個(gè)人B持相同觀點(diǎn),那么對(duì)于另外一個(gè)問(wèn)題,比起隨機(jī)選擇的一
個(gè)路人C,A更有可能同B持相同觀點(diǎn)。具體包括USer-based的協(xié)同過(guò)濾和Item-based
的協(xié)同過(guò)濾技術(shù)。
關(guān)聯(lián)規(guī)則分析(ASSOCiatiOnRUIeS,又稱BasketAnalysis)用于從大量數(shù)據(jù)中挖掘出
有價(jià)值的數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)關(guān)系。關(guān)聯(lián)規(guī)則解決的常見(jiàn)問(wèn)題如:“如果一個(gè)消費(fèi)者購(gòu)買
了產(chǎn)品A,那么他有多大機(jī)會(huì)購(gòu)買產(chǎn)品B?”以及“如果他購(gòu)買了產(chǎn)品C和D,那么他
還將購(gòu)買什么產(chǎn)品?”
兩者的區(qū)別比較明顯:
1)關(guān)聯(lián)規(guī)則面向的是事務(wù)transaction,而協(xié)同過(guò)濾面向的是用戶偏好(評(píng)分)。
2)協(xié)同過(guò)濾在計(jì)算相似商品的過(guò)程中可以使用關(guān)聯(lián)規(guī)則分析,但是在有用戶評(píng)分
的情況下(非1/0),協(xié)同過(guò)濾算法應(yīng)該比傳統(tǒng)的關(guān)聯(lián)規(guī)則更能產(chǎn)生精準(zhǔn)的推薦。
3)協(xié)同過(guò)濾的約束條件沒(méi)有關(guān)聯(lián)規(guī)則強(qiáng),或者說(shuō)更為靈活,可以考慮更多的商業(yè)
實(shí)施措施和特殊的商業(yè)規(guī)則。
2.在案例1推薦你喜愛(ài)的電影中,如何計(jì)算兩個(gè)用戶之間的相似度?
參考答案:
任兩位用戶之間的相似度,是基于他倆都觀看過(guò)且評(píng)論過(guò)相同的電影,由于每位用
戶評(píng)論的電影不完全一樣,所以先要找到兩位用戶共同評(píng)論過(guò)的電影,然后再計(jì)算兩者
之間的相似度,相似度用歐式距離公式計(jì)算。
三、幫幫我
1.基于案例1的樣本數(shù)據(jù),利用基于物品的協(xié)同推薦算法向用戶推薦他喜歡的電影。
提示:
1)給用戶推薦那些和他之前喜歡的電影相似的電影。
2)計(jì)算物品相似度:首先統(tǒng)計(jì)每部電影被哪些人評(píng)論過(guò),記為{電影標(biāo)題:{用戶id:評(píng)分}},
其次計(jì)算兩部電影之間的相關(guān)系數(shù),即計(jì)算兩部電影被相同人評(píng)價(jià)過(guò)的差異,記為sim(a,b),
然后根據(jù)你擬推薦用戶曾經(jīng)看過(guò)的電影評(píng)分rating,以及與這些電影相似度最大的m部電影,
根據(jù)公式ratingXSim(a,b)計(jì)算用戶對(duì)電影的興趣度,記為{電影標(biāo)題:興趣度},最后取興趣
度最大的ToPN部電影推薦給該用戶,從而完成電影推薦工作。
參考答案:
importpandasaspd
frommathimport*
importoperator
#構(gòu)建用戶-->物品的字典
defloadData(moviesFile,ratingsFile):
movies=pd.read_csv(moviesFile)
ratings=pd.read_csv(ratingsFile)
,
merge-data=pd.merge(movies,ratings,on='movield)
,,1,,
merge_data=merge_data[['userld\rating?movield','title]].sort-values(userld)
datas=merge_data.values.tolist()
data={);
forlineindatas:
userid,score,item=line[O],line[l],line[3];
data.setdefault(userid,{});
data[userid][item]=score;
returndata
data=loadData('data∕movies.csv,,,data∕ratings.csv,)
#構(gòu)造物品-物品的相似矩陣
defsimilarity(data):
N={};#喜歡物品i的總?cè)藬?shù)
C={};#喜歡物品i也喜歡物品j的人數(shù)
foruser,itemindata.items():
fori,scoreinitem.items():
N.setdefault(i,O);
N[i]+=l;
C.setdefault(i,{});
forj,scoresinitem.items():
ifjnotini:
C[i].setdefault(j,O);
C[i]U]÷=l;
#計(jì)算物品與物品的相似矩陣
W={}
fori,iteminC.items():
W.setdefault(i,{});
forj,item2initem.items():
W[i].setdefault(j,O);
W[i]∣j]=C[i]∣j]∕sqrt(N[i]*Ng]);
returnW
#根據(jù)用戶的歷史記錄,給用戶推薦物品
defrecommandList(data,W,userid,k=3,N=10):
rank={};
fori,scoreindata[userid].items():#獲得用戶user歷史記錄,如A用戶的歷史記錄為
{,a,√Γ,,b,√Γ,,d,√l,}
forj,winSOrted(W[i].items。,key=operator.itemgetter(l)jeverse=True)[0:k]:#獲得
與物品i相似的k個(gè)物品
ifjnotindata[userid].keys():#該相似的物品不在用戶user的記錄里
rank.setdefault(j,O);
rank∣j]+=float(score)*w;
#返回推薦結(jié)果
returnsorted(rank.items(),key=operator.itemgetter(l),reverse=True)[0:N]
W=SimiIarity(data);#計(jì)算物品相似矩陣
Print(recommandLiSt(data,W,5,3,10));#打印出用戶id=5的最喜歡的3個(gè)物品的前10個(gè)推
薦結(jié)果
運(yùn)行結(jié)果:
[("JurassicPark(1993),,19.79018674461378),(,ForrestGump(1994),,13.053363686962662),CSilenceoftheLambs,The(1991)',8.5307
86098376653),CSleeplessinSeattle(1993)',4.751301463486936),CDave(1993),.4.59541429975512),CReservoirDogs(1992),,4.24876
8030134158),CCliffhanger(1993),.3.8219737518039247),CCrimsonTide(1995)*.3.7278490863031535),CGhost(1990)',3.1561237661048
516),CBambi(1942)?3.141404312187716)]
2.假如某零售超市準(zhǔn)備舉辦一場(chǎng)關(guān)于berries(漿果)旺季的促銷活動(dòng),請(qǐng)你根據(jù)案例2
的購(gòu)物籃數(shù)據(jù),找出包含berries的所有可行動(dòng)規(guī)則,據(jù)此為超市提供營(yíng)銷建議或策略。
參考答案:
解決本題的主要思路是基于groceries.csv的數(shù)據(jù)設(shè)置合理的置信度,計(jì)算出包含所有
berries的關(guān)聯(lián)規(guī)則,根據(jù)關(guān)聯(lián)規(guī)則為超市提供營(yíng)銷策略。
1)將groceries.csv文件轉(zhuǎn)換為事務(wù)型數(shù)據(jù)
importpandasaspd
importnumpyasnp
importcsv
frommlxtend.preprocessingimportTransactionEncoder
frommlxtend.frequent_patternsimportapriori
frommlxtend.frequent_patternsimportassociation_rules
ls_data=[]
withopen(r,data?groceries.csv,,,r,)asf:
reader=csv.reader(f)
forrowinreader:
Is_data.append(row)
te=TransactionEncoderO
#進(jìn)行One-hoi編碼
te_array=te.fit(ls_data).transform(ls_data)
df=pd.DataFrame(te_array,columns=te.columns_)
2)利用Apriori找出包含berries的頻繁項(xiàng)集(其中min_support是基于試驗(yàn)確定的值)
freqjtem=apriori(df,min_support=0.0?,max_len=2,use_colnames=True)
freq_item.sort_values(by-support1,axis=0,ascending=False)
,
freq-item.loc[freqJtem[itemsets'].str.len()>l].sort-values(by='support?axis=0,ascending=Fa
Ise)
#查看含有berries頻繁項(xiàng)集
SetJtemsets=map(set,freqjtem.itemsets.values.tolist())
freq_item['have-berries']=[,berries'iniforiinset_itemsets]
,
freq-item.loc[freq_item['have-berries]==True]
supportitemsetshave-berries
30.033249(berries)True
930.010269(Othervegetables,berries)True
940.011795(wholemilk,berries)True
950.010574(yogurt,berries)True
3)提取有用的銷售關(guān)聯(lián)規(guī)則
,,
pd.set-option(display.max-rows,None)
rules=association_rules(freq_item,min_threshold=0.025)
,
rules.sort-values(by=confidence',axis=0,ascending=False)
#選擇含有‘berries'的前因項(xiàng)的規(guī)則
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年二年級(jí)第一學(xué)期教研工作總結(jié)(三篇)
- 2025年二年級(jí)老師教育工作總結(jié)模版(三篇)
- 2025年臨時(shí)租車協(xié)議樣本(2篇)
- 創(chuàng)意園區(qū)裝修協(xié)議
- 國(guó)際學(xué)校裝修合作合同模板
- 家電銷售居間服務(wù)合同
- 教育培訓(xùn)招生私人居間合同
- 木材物流協(xié)議范本
- 賓館客房改造追加協(xié)議
- 親子莊園別墅裝修合同范本
- 2025年中國(guó)中煤能源股份有限公司招聘筆試參考題庫(kù)含答案解析
- 2024年度碳陶剎車盤分析報(bào)告
- 2025年1月 浙江首考英語(yǔ)試卷
- 2025年1月廣西2025屆高三調(diào)研考試英語(yǔ)試卷(含答案詳解)
- 2024年中考二輪專題復(fù)習(xí)道德與法治主觀題答題技巧(小論文)之演講稿
- 質(zhì)檢工作計(jì)劃書2025質(zhì)檢部工作計(jì)劃范文
- 《復(fù)旦大學(xué)》課件
- 《纏論的實(shí)戰(zhàn)技法》課件
- 承包魚(yú)塘維修施工合同范例
- 耶魯綜合抽動(dòng)嚴(yán)重程度量表正式版
- 政府采購(gòu)項(xiàng)目采購(gòu)需求調(diào)查指引文本
評(píng)論
0/150
提交評(píng)論