![數據挖掘導論[谷風文書]_第1頁](http://file1.renrendoc.com/fileroot_temp2/2020-11/23/9fcdcd2e-2c94-40f4-a7cc-9c5287b2dcd2/9fcdcd2e-2c94-40f4-a7cc-9c5287b2dcd21.gif)
![數據挖掘導論[谷風文書]_第2頁](http://file1.renrendoc.com/fileroot_temp2/2020-11/23/9fcdcd2e-2c94-40f4-a7cc-9c5287b2dcd2/9fcdcd2e-2c94-40f4-a7cc-9c5287b2dcd22.gif)
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、19.對于下面的向量x和y,計算指定的相似性或距離度量。(a)x=(1,1,1,1),y=(2,2,2,2)余弦、相關、歐幾里得。(b)x=(0,1,0,1),y=(1,0,1,0)余弦、相關、歐幾里得、Jaccard 。(c)x=(0,-1,0,1),y=(1,0,-1,0)余弦、相關、歐幾里得。(d)x=(1,1,0,1,0,1),y=(1,1,1,0,0,1)余弦、相關、Jaccard 。(e)x=(2,-1,0,2,0,-3),y=(-1,-1,-1,0,0,-1)余弦、相關。#(a)x=c(1,1,1,1)y=c(2,2,2,2)#歐幾里得s2=sum(y-x)2)p=sqrt(s2
2、)p#余弦相似性xy-sum(x*y)x1=sqrt(sum(x2)y1=sqrt(sum(y2)cosxy=xy/(x1*y1)cosxy#相關性x=c(1,1,1,1)y=c(2,2,2,2)n=length(x) #求x的字符串長度x0=sum(x)/n #計算均值y0=sum(y)/ncovariance-sum(x-x0)*(y-y0)/(n-1)covariancestandardx-sqrt(sum(x-x0)2)/(n-1)standardxstandardy-sqrt(sum(y-y0)2)/(n-1)standardycorrxy=covariance/(standardx
3、*standardy)corrxy#(b)#余弦x-c(0,1,0,1)y-c(1,0,1,0)xy-sum(x*y)x1=sqrt(sum(x2)y1=sqrt(sum(y2)cosxy=xy/(x1*y1)cosxy#相關性x-c(0,1,0,1)y-c(1,0,1,0)n=length(x) #求x的字符串長度x0=sum(x)/n #計算均值y0=sum(y)/ncovariance-sum(x-x0)*(y-y0)/(n-1)covariancestandardx-sqrt(sum(x-x0)2)/(n-1)standardxstandardy-sqrt(sum(y-y0)2)/(n
4、-1)standardycorrxy=covariance/(standardx*standardy)corrxy#歐幾里得x-c(0,1,0,1)y-c(1,0,1,0)s2=sum(y-x)2)p=sqrt(s2)p#Jaccardx-c(0,1,0,1)y-c(1,0,1,0)xy-sum(x*y)x2=sum(x2)y2=sum(y2)EJ=xy/(x2+y2-xy)EJ#(c)#余弦x=c(0,-1,0,1)y=c(1,0,-1,0)xy-sum(x*y)x1=sqrt(sum(x2)y1=sqrt(sum(y2)cosxy=xy/(x1*y1)cosxy#相關x=c(0,-1,0,
5、1)y=c(1,0,-1,0)n=length(x) #求x的字符串長度x0=sum(x)/n #計算均值y0=sum(y)/ncovariance-sum(x-x0)*(y-y0)/(n-1)covariancestandardx-sqrt(sum(x-x0)2)/(n-1)standardxstandardy-sqrt(sum(y-y0)2)/(n-1)standardycorrxy=covariance/(standardx*standardy)corrxy#歐幾里得x=c(0,-1,0,1)y=c(1,0,-1,0)s2=sum(y-x)2)p=sqrt(s2)p#(d)x=c(1,1
6、,0,1,0,1),y=c(1,1,1,0,0,1))#余弦x=c(1,1,0,1,0,1)y=c(1,1,1,0,0,1)xy-sum(x*y)x1=sqrt(sum(x2)y1=sqrt(sum(y2)cosxy=xy/(x1*y1)cosxy#相關 x=c(1,1,0,1,0,1),y=c(1,1,1,0,0,1)n=length(x) #求x的字符串長度x0=sum(x)/n #計算均值y0=sum(y)/ncovariance-sum(x-x0)*(y-y0)/(n-1)covariancestandardx-sqrt(sum(x-x0)2)/(n-1)standardxstanda
7、rdy-sqrt(sum(y-y0)2)/(n-1)standardycorrxy=covariance/(standardx*standardy)corrxy#Jaccardx=c(1,1,0,1,0,1)y=c(1,1,1,0,0,1)xy-sum(x*y)x2=sum(x2)y2=sum(y2)EJ=xy/(x2+y2-xy)EJ#(e)x=(2,-1,0,2,0,-3),y=(-1,-1,-1,0,0,-1)#余弦x=c(2,-1,0,2,0,-3)y=c(-1,-1,-1,0,0,-1)xy-sum(x*y)x1=sqrt(sum(x2)y1=sqrt(sum(y2)cosxy=xy/(x1*y1)cosxy#相關x=c(2,-1,0,2,0,-3)y=c(-1,-1,-1,0,0,-1)n=length(x) #求x的字符串長度x0=sum(x)/n #計算均值y0=sum(y)/ncovariance-sum(x-x0)*(y-y0)/(n-1)covariancestandardx-sqrt(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 限價房居間合同
- 環(huán)保設備配送居間合同
- 2025年也門文版辦公室租賃合同(包含家具電器配置)
- 2025-2030年中國電子化工材料市場運行現(xiàn)狀及發(fā)展前景分析報告
- 2025-2030年中國燈箱片行業(yè)發(fā)展狀況及營銷戰(zhàn)略研究報告
- 2025-2030年中國漂粉精行業(yè)發(fā)展前景規(guī)劃及投資風險評估報告
- 2025-2030年中國汽車再制造產業(yè)發(fā)展態(tài)勢及投資戰(zhàn)略研究報告
- 2025-2030年中國改裝汽車制造市場發(fā)展現(xiàn)狀及前景趨勢分析報告
- 2025-2030年中國扒渣機行業(yè)規(guī)模調研及前景趨勢預測報告
- 2025-2030年中國工藝陶瓷市場運行狀況及發(fā)展趨勢分析報告
- 獅子王1中英文臺詞
- 《大學俄語》教學大綱
- 清淤工程施工記錄表
- TCITSA 24-2022 基于ETC的高速公路自由流收費技術規(guī)范
- 2022年涉農領域涉嫌非法集資風險專項排查工作總結
- 起重裝卸機械操作工國家職業(yè)技能標準(2018年版)
- 叉車裝卸區(qū)域安全風險告知牌
- 五年級下冊美術課件-第2課 新街古韻丨贛美版
- 秦荻輝科技英語寫作教程練習答案(共42頁)
- GB∕T 41168-2021 食品包裝用塑料與鋁箔蒸煮復合膜、袋
- 部編版語文一年級下冊繪本閱讀課-優(yōu)質課件.pptx
評論
0/150
提交評論