大數(shù)據(jù)下的隱私保護(hù)-陳克非-20141112_第1頁
大數(shù)據(jù)下的隱私保護(hù)-陳克非-20141112_第2頁
大數(shù)據(jù)下的隱私保護(hù)-陳克非-20141112_第3頁
大數(shù)據(jù)下的隱私保護(hù)-陳克非-20141112_第4頁
大數(shù)據(jù)下的隱私保護(hù)-陳克非-20141112_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

大數(shù)據(jù)下的隱私保護(hù)陳克非kfchen@2014.11.12西安、貴陽行網(wǎng)上訂機(jī)票引出的事無處不在的大數(shù)據(jù)網(wǎng)絡(luò)應(yīng)用,移動終端,穿戴設(shè)備,。。。個人數(shù)據(jù)可以隨處采集例:Google預(yù)測流感趨勢2009.2.19,Nature上刊登了一篇關(guān)于Google預(yù)測flutrends的文章。流行病學(xué)家發(fā)現(xiàn),F(xiàn)acebook、Twitter這類社交網(wǎng)站和谷歌等網(wǎng)絡(luò)搜索引擎,對于流感傳播情況的了解,比世界衛(wèi)生組織(WHO)或美國疾病控制與防御中心(CDC)等官方機(jī)構(gòu)的報告來得還快。通過Twitter上的數(shù)據(jù),可提前八天預(yù)報。大數(shù)據(jù)時代的安全

2023/2/15典型的安全事件系統(tǒng)類事件2010.9,發(fā)現(xiàn)Google員工利用職權(quán)查看了多個用戶的隱私數(shù)據(jù)2011.3,Google郵箱再爆大規(guī)模用戶數(shù)據(jù)泄漏,涉及15萬用戶2011.4,Amazon的EC2云計算服務(wù)被黑客租用,對SonyPlayStation網(wǎng)站進(jìn)行了攻擊,造成了大規(guī)模用戶數(shù)據(jù)的泄露2012.8,蘋果公司的iCloud云服務(wù)受到黑客攻擊,黑客暴力破解用戶密碼后,刪除了部分用戶資料,而云平臺并未備份用戶數(shù)據(jù)導(dǎo)致了用戶數(shù)據(jù)的丟失,并致使用戶Gmail和Twitter賬號被盜2014.8,美版“艷照門”iCloud數(shù)據(jù)外泄2014.10,摩根800萬客戶資料泄露斯諾登事件貌似有信譽(yù)的商家如政府不靠譜,用戶的安全需要自己把握人肉搜索事件對隱私造成巨大威脅且防不勝防隱私是什么?隱私一般是指僅與特定人的利益或者人身發(fā)生聯(lián)系且權(quán)利人不愿為他人所知曉的私人信息、私人事務(wù)和私人領(lǐng)域。

隱私泄露的關(guān)鍵是某些數(shù)據(jù)、信息與個人發(fā)生關(guān)聯(lián),而作為個體的人則通過特定的個人標(biāo)識信息信被準(zhǔn)確鎖定個人辨識信息PII(PersonalIdentifiableInformation):用戶的姓名、手機(jī)號、身份證號、電子郵箱、住址、圖片等;個人相關(guān)信息:屬于準(zhǔn)標(biāo)識符(Quasi-identifier),如年齡、性別、種族、職業(yè)、公司、遮擋的圖片等,并不與任何PII直接聯(lián)系在一起;個人屬性信息:是把個人準(zhǔn)標(biāo)識符進(jìn)一步泛化的模糊信息,如青年人(或20-30歲)、南方人、白領(lǐng)、照片剪影等等。注:1)準(zhǔn)標(biāo)識符信息雖然不能直接指向具體的人,但是把這些條件組合在一起,還是很有機(jī)會匹配到確定的個體,從而有隱私風(fēng)險。2)用進(jìn)一步泛化的模糊用戶屬性解決“Quasi-identifier”的問題,也就是把能夠辨識出個體的信息“虛化”,確保符合屬性的個體有足夠多的數(shù)量,從而無法準(zhǔn)確與個體關(guān)聯(lián),這就所謂的k-anonymity概念。顯性隱私隱性隱私2023/2/17需要保護(hù)的隱私在網(wǎng)絡(luò)環(huán)境,部分隱私就關(guān)呼個人數(shù)據(jù)的權(quán)利問題。所謂個人數(shù)據(jù),是指用來關(guān)聯(lián)個人基本情況的一組數(shù)據(jù)資料①個人登錄的身份、健康狀況。在申請上網(wǎng)開戶、免費(fèi)郵箱以及申請服務(wù)商提供的其他服務(wù)時,服務(wù)商往往要求用戶相關(guān)信息,服務(wù)商有義務(wù)和責(zé)任保守個人秘密,未經(jīng)授權(quán)不得泄露。②個人的信用和財產(chǎn)狀況,包括信用卡、電子消費(fèi)卡、上網(wǎng)卡、上網(wǎng)帳號和密碼、交易帳號和密碼等。個人在上網(wǎng)、網(wǎng)上消費(fèi)、交易時,登錄和使用的各種信用卡、帳號均屬個人隱私,不得泄露。③郵箱電址,不少用戶不愿將之公開。掌握、搜集用戶的郵箱并將之公開或提供給他人,侵犯了用戶的隱私權(quán)。④網(wǎng)絡(luò)活動蹤跡。個人在網(wǎng)上的活動蹤跡,如IP地址、瀏覽蹤跡、活動內(nèi)容,均屬個人的隱私。⑤個人的圖片和音像。通過圖像識別技術(shù),搜索引擎可以準(zhǔn)確定位到人,并找到與之關(guān)聯(lián)的其他資料⑥其他。從部分已知信息挖掘關(guān)聯(lián)出一系列個人其他資料(喜好習(xí)慣、生活規(guī)律等)。8例:網(wǎng)上曬照片造成隱私泄露某明星在上曬出居室照片被定位通過分析照片GoogleEarth微博等各種信息人肉搜索事件2023/2/19例:k-匿名技術(shù)通過屬性泛化實現(xiàn)模糊信息2023/2/110例:k-匿名技術(shù)的效用k-匿名技術(shù)的核心,使符合相關(guān)屬性的個體數(shù)目巨大,無法找到唯一解,至少增加求解的難度。大數(shù)據(jù)時代的現(xiàn)狀存在“取之不盡,用之不竭”的關(guān)聯(lián)數(shù)據(jù)、關(guān)聯(lián)方程搜索引擎和各種數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)關(guān)聯(lián)技術(shù)云計算為代表的新型計算資源可以為大眾提供廉價服務(wù)有效保護(hù)隱私?很難!2023/2/111保護(hù)隱私該做什么用戶自我保護(hù)意識慎用云存儲:上傳重要、敏感數(shù)據(jù)尤其小心不要隨意注冊:很多網(wǎng)站要求填寫個人信息小心玩社交網(wǎng):朋友圈內(nèi)的資料難保不被泄露盡量不提供個人辨識信息,如網(wǎng)購送貨到指定地點服務(wù)提供商要擔(dān)當(dāng)有義務(wù)保護(hù)用戶數(shù)據(jù)不得濫用用戶資料2023/2/112加強(qiáng)隱私保護(hù)研究研發(fā)隱私保護(hù)技術(shù)割斷用戶數(shù)據(jù)與用戶辨識信息的聯(lián)系,盡量不直接使用個人辨識信息。例如產(chǎn)生隨機(jī)數(shù)R替代個人辨識信息PII(類似于TSMIIMSI);對數(shù)據(jù)進(jìn)行必要的分割和拆分,盡可能去除不同數(shù)據(jù)項的關(guān)聯(lián)性,去除數(shù)據(jù)內(nèi)容與個人辨識信息的聯(lián)系;建立混合云框架,結(jié)合私有云和公有云形成兼顧云計算優(yōu)點有可以對敏感數(shù)據(jù)重點保護(hù)的有效機(jī)制;……。2023/2/113隱私感知的混合云分割存取技術(shù)合理利用公有云和私有云資源,在兩者之間合理分配計算任務(wù),既充分利用公有云的資源、又有效保護(hù)用戶隱私并保留數(shù)據(jù)的效用;兩類隱私信息區(qū)分處理:數(shù)據(jù)記錄本身包含的隱私信息,以及數(shù)據(jù)記錄之間關(guān)聯(lián)關(guān)系蘊(yùn)含的隱私;分割中,相對獨(dú)立的數(shù)據(jù)分配給獨(dú)立的云平臺計算,減少云間通訊。

混合云架構(gòu)設(shè)計針對隱私云數(shù)據(jù)的分割存取需求,建立一個基于混合云的大規(guī)模數(shù)據(jù)存取框架,該框架由一個私有云和多個公有云組成,以充分發(fā)揮公有云豐富且廉價的計算資源的優(yōu)勢。2023/2/114隱私感知的混合云分割存取技術(shù)需要一個隱私感知的數(shù)據(jù)分割機(jī)制,分離數(shù)據(jù)中的敏感信息,并去除不同數(shù)據(jù)項之間關(guān)聯(lián)關(guān)系,將分割后的數(shù)據(jù)計算任務(wù)分配給不同的公有云和私有云。分割處理:一方面能防止隱私信息泄露,另一方面仍支持?jǐn)?shù)據(jù)挖掘算法。種族生日性別郵編疾病Black09/20/65M02141ShortofbreathBlack02/14/65M02141ChestpainBlack10/23/65F02138HypertensionBlack08/24/65F02138HypertensionBlack11/07/64F02138ObesityBlack12/01/64F02138ChestpainWhite10/23/64M02138ChestpainWhite03/15/65F02139HypertensionWhite08/13/64M02139ObesityWhite05/05/64M02139ShortofbreathWhite02/13/67M02138ChestpainWhite03/21/67M02138Chestpain云1云22023/2/115針對加密云數(shù)據(jù)的信息檢索需求,需要一套具備隱私保護(hù)、支持復(fù)雜搜索條件的加密云數(shù)據(jù)檢索技術(shù),既允許用戶高效靈活地查詢加密云數(shù)據(jù),又能保護(hù)用戶搜索條件的隱私。用戶云數(shù)據(jù)中心上傳文件密文KP-ABE.Enc()索引表索引表密文上傳令牌搜索條件KP-ABE.Query()用戶獲取搜索結(jié)果KP-ABE.GenToken()KP-ABE.Enc()復(fù)雜搜索條件的加密云數(shù)據(jù)搜索技術(shù)1.利用密碼手段,包括同態(tài)加密、KP-ABE密碼方案--保證數(shù)據(jù)內(nèi)容不外泄、擴(kuò)散--搜索條件的隱私保護(hù)2.為了搜索速度,將通常的檢索列表擴(kuò)展為新的組合索引表16可驗證的加密云數(shù)據(jù)外包計算技術(shù)針對加密云數(shù)據(jù)的計算處理需求,研究加密云數(shù)據(jù)的外包計算技術(shù),既允許云提供商在不知道用戶數(shù)據(jù)的情況下仍能為用戶計算處理數(shù)據(jù),保護(hù)了用戶的數(shù)據(jù)隱私性,又能讓用戶驗證外包計算結(jié)果的正確性。1.建立云數(shù)據(jù)外包密文計算系統(tǒng)的形式化安全模型2.需要加密數(shù)據(jù)的可驗證外包計算的安全方案2023/2/117加密云數(shù)據(jù)的高效共享分發(fā)針對云數(shù)據(jù)的共享需求,研究加密云數(shù)據(jù)共享分發(fā)技術(shù),既允許用戶高效地與其他用戶共享加密云數(shù)據(jù),又可以保護(hù)用戶共享條件的隱私性1.設(shè)計高效安全的條件代理重加密來實現(xiàn)數(shù)據(jù)共享2.為滿足隱私性,要求條件代理重加密方案的條件具有匿名性3.為提高效率性,要求方案具有固定的密文長度(即密文長度與共享條件表達(dá)式中條件個數(shù)無關(guān))2023/2/118云數(shù)據(jù)隱私保護(hù)系統(tǒng)用戶可以通過隱私感知的混合云存取技術(shù)對數(shù)據(jù)作分離,將數(shù)據(jù)分別存到公有云和私有云中通過支持復(fù)雜搜索條件的加密云數(shù)據(jù)檢索技術(shù),用戶可以對相關(guān)數(shù)據(jù)進(jìn)行高效靈活檢索利用可驗證的加密云數(shù)據(jù)外包計算技術(shù),用戶可以借助云服務(wù)提供商對加密后數(shù)據(jù)進(jìn)行計算處理,并驗證計算結(jié)果的正確性利用云數(shù)據(jù)的高效共享分發(fā)技術(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論