




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大數(shù)據(jù)與計算社會學
2009年2月,包括大衛(wèi)拉茲在內的15名美國科學家在科學上發(fā)表了一篇具有里程碑意義的文章《數(shù)學社會學》。文章指出,“計算社會學”的學科正在發(fā)展。人們收集和使用前所未有的數(shù)據(jù),為社會科學的研究服務。在過去的三年多時間里,“計算社會學”正如這些宣言者所認為的那樣,表現(xiàn)出了很大的能量。本文,是Nature雜志今年8月刊發(fā)的關于這一領域最新進展的綜述文章。喬恩·克萊因伯格(JonKleinberg)的早期工作并不適合心臟不好的人。他于1992年發(fā)表的第一篇文章是計算機科學的論文,其內容就像它的標題一樣緊湊。這篇論文的題目是《基于動態(tài)Voronoi圖和最小Hausdorff距離的點集歐氏平面運動研究》。在萬維網席卷全球之后,成千上萬的個體用戶自主決定和誰聯(lián)系以及聯(lián)系什么??巳R因伯格開始研究當代生活所產生的大量數(shù)字副產品,比如電子郵件、移動電話、信用卡購物、網絡搜索以及社會網絡。今天,作為位于紐約州伊薩卡的康奈爾大學的計算機科學家,克萊因伯格利用這些數(shù)據(jù)來撰寫論文,比如《形成你自己的觀點有多糟糕?》以及《你一開口就征服了我:措辭如何影響記憶力》——這些標題非常適合出現(xiàn)在社會科學雜志上??巳R因伯格并不孤單。計算社會科學這個領域的出現(xiàn)正在吸引對數(shù)學感興趣的科學家蜂擁而至。而且,這也促進了學術部門的成立,并激勵像位于加州門洛帕克的社會網絡公司Facebook(臉譜)這樣的巨頭成立研究團隊來研究社會網絡的結構以及信息在社會網絡之間是如何傳遞的?!斑@真是革命性的?!笨的螤柎髮W的社會科學家米歇爾·梅西(MichaelMacy)說,她也是2009年聯(lián)合簽署增加這個新學科影響力宣言的15位作者之一?!爸拔覀円恢笔芟抻诰C述性文章,文章通常是回顧性的,實驗室研究的對象也一直是為數(shù)不多的大二學生?!爆F(xiàn)在,數(shù)字化數(shù)據(jù)流使得我們以前所未有的規(guī)模和層次來描繪個體和群體的行為。這些數(shù)據(jù)還帶來了大量的挑戰(zhàn)——特別是隱私問題,以及數(shù)據(jù)集合未必如實反應人群整體狀況的問題。雖然如此,“我把大數(shù)據(jù)給社會學帶來的機遇,等同于粒子加速器給物理學帶來的機遇,以及功能磁共振成像給神經系統(tǒng)科學帶來的機遇?!泵肺髡f。弱連接研究的興起最早大規(guī)模利用數(shù)字化數(shù)據(jù)在社會科學問題上進行研究的例子是2002年克萊因伯格和明尼蘇達州卡爾頓學院的計算機科學家大衛(wèi)·立本諾埃爾(DavidLiben·Nowell)開展的一項研究。他們考察了社會科學家認為有助于推動人際關系形成的機制:即人們傾向于和朋友的朋友成為朋友。雖然這個觀點很完美,但是卻從來沒有在幾十甚至幾百人的人際網絡中進行過檢驗??巳R因伯格和立本諾埃爾研究了科研合作中形成的關系網絡。他們考察了在1994年至1996年間向電子打印存檔(arXiv)上傳論文的數(shù)以千計的物理學家。通過編寫軟件來自動提取作者的姓名,他們所建立的合作伙伴數(shù)字網絡的數(shù)量級要遠遠大過以前測試過的數(shù)字網絡,新網絡的每個連接都代表著兩個曾經合作過的研究人員。通過跟蹤這些網絡如何隨著時間的推移而發(fā)生變化,他們發(fā)現(xiàn)一些研究人員之間親近程度的度量指標可以用來預測未來合作的可能性。正如期望的那樣,研究結果表明新的合作關系傾向于出現(xiàn)在那些同自己的現(xiàn)存研究伙伴有合作關系的人群中,用研究人員自己的話說就是“朋友的朋友”。但是這種預測在數(shù)學上的精確性可以使得它在更大的網絡中得以運用。曾師從克萊因伯格的拉斯·巴克斯托姆(LarsBackstrom)博士也在研究關聯(lián)-預測的問題———他現(xiàn)在就職于臉譜,在這里他可以盡情發(fā)揮自己的學識,而他的工作就是設計社會網絡中的當前朋友推薦系統(tǒng)。另外一個已經被計算機研究人員證實的經久不衰的社會科學理念就是”弱連接”的重要性———它是指相隔較遠且很少碰面的熟人間的關系。如今就職于斯坦福大學的社會科學家馬克·格蘭諾維特(MarkGranovetter)在1973年提出弱連接在社會派系中發(fā)揮著橋梁的作用,因而弱連接對于信息的傳播以及經濟的流動都是重要的。在前數(shù)字化時代,大規(guī)模地證實他的這種想法幾乎是不可能的。但是,美國哈佛大學網絡科學家的尤卡·佩卡翁內拉(JukkaPekkaOnnela)在2007年帶領的一個團隊利用四百萬手機用戶的數(shù)據(jù)證實了弱連接確實發(fā)揮了社會橋梁的作用(見“弱連接的能量”圖)。2010年,包括梅西在內的另外一個團隊證實了格蘭諾維特關于經濟流動性和弱連接存在關聯(lián)性的理論也是正確的。利用英國六千五百萬有線通訊和移動電話采集的數(shù)據(jù),以及全國普查的數(shù)據(jù),他們揭示了個體關系多元性和經濟發(fā)展之間存在很大的相關性:人們越富裕且他們的聯(lián)系越多元化,則他們的社區(qū)越富裕?!霸?0世紀70年代,我們不敢想象可以大規(guī)模地利用這些數(shù)據(jù)進行研究,”格蘭諾維特說。學術研究團隊的研究克萊因伯格的學生約翰·烏甘德(JohanUgander)發(fā)現(xiàn)情況肯定比那還要復雜:人們決定加入臉譜的原因不取決于他們已經加入該網絡的朋友數(shù)目,而取決于隸屬于不同社會群體的朋友加入該網站的數(shù)目。換句話說,如果加入臉譜網站的有你的同事,體育俱樂部的朋友以及你的密友,那么該網站給你留下的印象要比你在上面只發(fā)現(xiàn)了來自一個社會群體的朋友要深。所以“觀念的傳播取決于讓他們堅守該觀念的人的多樣化”這一結論對于營銷和公共健康活動來說可能是重要的。隨著計算社會學研究的擴展,社會科學研究的應用也在不斷發(fā)展。就職于麻省理工學院的計算機科學家亞歷克斯·彭特蘭(AlexPentland)的研究團隊利用智能手機應用程序和便攜式錄音設備采集研究對象每日活動和交際的精準數(shù)據(jù)。通過把這些數(shù)據(jù)和身心健康調查相結合,該團隊得知了如何識別包括抑郁在內的健康問題的出現(xiàn)。“我們發(fā)現(xiàn)這些群體從來不會進行表達,”彭特蘭說,“當涉及到關照那些需要關照的人的時候,能夠感知到他們的孤獨是十分重要的。”由彭特蘭的學生安默爾馬丹成立的位于馬薩諸塞州的分拆上市公司Ginger.io現(xiàn)在研發(fā)了一個智能手機程序,如果數(shù)據(jù)顯示某種健康問題的存在,那么這個程序就會通知衛(wèi)生保健部門。其他一些公司正在研究推特(Twitter)上每天發(fā)布的超過4億條信息。一些研究團隊開發(fā)出了一款軟件,利用這款軟件可以通過對推特使用者網上情緒的分析來預測實際情況,比如電影的票房收益或者選舉結果。雖然這種預測的精準性還一直備受爭議,但是推特基于這個方法于今年8月開始推出了美國總統(tǒng)競選的每日政治指數(shù)。同時,就職于布盧明頓印第安納大學的約翰·博倫(JohanBollen)和他的同事也采用類似的軟件來研究推特上表達的社會情緒與股票市場波動之間的關聯(lián)。他們研究的結果已經足以震撼位于倫敦的投資公司-德溫特資本市場,并得到該公司的認可。數(shù)據(jù)處理與研究反思當這些基于推特的調查在大約2年前出現(xiàn)的時候,對于這種服務在特定人口群體中(例如年輕人中)的流行性是否會扭曲其研究結果的質疑就一直存在。圍繞著這些新數(shù)據(jù)的類似辯論也不斷出現(xiàn)。舉個例子來說,臉譜網現(xiàn)在的用戶接近10億人,然而在這些用戶中年輕人的數(shù)量大大超過其他群體。同時網絡交流和現(xiàn)實的交流也存在著差別,對于一個領域的結論是否也適用于其他領域還不清晰?!拔覀兺ǔ囊粋€群體如何使用一種技術入手來推測該技術通用的使用情況,”哈佛大學網絡科學家薩繆爾·阿貝斯曼(SamuelArbesman)說,“這也可能未必是合理的?!敝С终哒J為這些都不是新的問題。幾乎所有的調查數(shù)據(jù)都包含一些人口變量方面的偏差,社會科學家已經研發(fā)出一些加權方法來糾正這種偏差。如果能夠計算出特定數(shù)據(jù)集合中的偏差,比如臉譜網上某個群體的權重過大,那么這個研究結果就可以隨之而進行調整。“在20世紀70年代,我們不敢想象可以大規(guī)模地利用這些數(shù)據(jù)進行研究。”臉譜和推特等公司所提供的減少偏差的服務也越來越廣泛地被應用。即使還存在偏差,那么這種偏差也比用來研究心理學和人類行為的數(shù)據(jù)集中存在的偏差要小得多,這些研究的數(shù)據(jù)大多數(shù)來自于西方世界中那些高度工業(yè)化,富裕且民主的社會中的大學生。格蘭諾維特對大數(shù)據(jù)進入其研究領域持一種更加哲學的保留意見。他說他對這種新的方法“十分感興趣,”但是他也擔心對數(shù)據(jù)的關注會減弱獲得更好社會系統(tǒng)理論的需求。他說,“即使絕大多數(shù)計算社會學論文都聚焦于現(xiàn)存的理論,當然這是很有研究價值的,但是只有其中一小部分做了為當今所需的研究?!北热缯f,格蘭諾維特有關弱連接的論文在發(fā)表了40年后還有很高的引用率。雖然這篇文章“多少利用了開放的數(shù)據(jù)”,他說,“但是其研究結果并不是來源于數(shù)據(jù)分析,而是對其他研究的反思。這是一個單獨的活動,我們需要人們來進行這樣的研究活動。”社會科學家這個新職業(yè)的出現(xiàn)也與數(shù)據(jù)處理的話題糾纏在一起。就職于位于帕羅奧多市的惠普實驗室的計算機科學家貝爾納多·休伯曼(BernardoHuberman)在今年2月寫到,“很多新出現(xiàn)的‘大數(shù)據(jù)’都來源于私人領域,而其他研究人員是無法獲得這些數(shù)據(jù)的。這些數(shù)據(jù)源有可能被隱藏起來,不但存在驗證問題,還涉及這些研究結果普適性的問題?!币粋€典型的案例就是臉譜網內部的研究團隊利用其網站上9億用戶的交互數(shù)據(jù)來開展自己的研究,這些研究包括對地球上任意兩個人之間的關系不超過六個人的小世界理論的再評估。(他們認為地球上任意兩個人之間的關系不超過五個人)。由于部分涉及到個人隱私問題,所以這個研究團隊只發(fā)表了其研究結果,而不是原始數(shù)據(jù)。在今年7月,臉譜網宣布說它正在制定一個計劃,這個計劃讓其他研究者有機會對其內部團隊用來得出結論的匯總匿名數(shù)據(jù)進行復核,但是該計劃不僅有時間限制,還僅限于首次進入臉譜總部的外來研究者。就眼前來說,計算社會學家更關注他們學科領域的文化問題。包括哈佛大學在內的一些研究機構都在這個領域設立了研究項目,但是不同研究部門之間的學術領域幾乎沒有交叉。鄧肯·瓦茨(DuncanWatts)是紐約的哥倫比亞大學的社會科學家和網絡理論家,他回想起了近期的一個調研錯誤,該錯誤使他把計算科學和社會學的研究生召集到一起同時開會。他說到,“有足夠的證據(jù)表明這兩個群體可以互有裨益:計算科學專業(yè)的學生比社會學專業(yè)的學生有更多的方法論知識,但是社會學專業(yè)的學生能提出更多有意思的問題。雖然他們從不認識對方,也沒有機會走進對方的辦公室?!弊鳛?009年宣言第一作者的哈佛大學社會科學家戴維·拉澤(DavidLazar)認為很多研究人員還沒有意識到這些新數(shù)據(jù)的能量。沒有數(shù)據(jù)分析的文章也可以發(fā)表在頂級社會科學雜志中。而參加探討社會議題的計算科學會議的社會科學家的人數(shù)卻少的可憐,這樣的會議包括今年6月在都柏林舉辦的博客和社會媒體的會議。盡管如此,拉澤認為,隨著具有里程碑意義的研究論文發(fā)表在頂尖學術期刊以及社會行為數(shù)據(jù)集的首次可用,這些障礙正在被打破。他說,“這些變革正出現(xiàn)在我們面前,而不是身后?!碑斎贿@也是克萊因伯格的觀點。他說,“我把自己看作是一個對社會問題感興趣的計算機科學家,但是嚴格地限定研究的邊界是很難的?!睆慕徊鎸W科到新興學科2012年1月7日,中國科學院學位評定委員會在京召開會議,同意在中科院研究生院設立“社會計算”交叉學科,并上報國務院學位委員會批準。根據(jù)中科院學位評定委員會的建議,此次擬新設立的“社會計算”學科是跨“控制科學與工程”、“計算機科學與技術”和“管理科學與工程”三個一級學科的交叉學科,學科代碼定為“99J2”,擁有博士和碩士學位授予權,學位培養(yǎng)工作將依托中科院自動化所。按照國務院學位委員會的相關規(guī)定,中科院自動化所有望在今年成為我國首個“社會計算”研究生培養(yǎng)點,同時具備博士和碩士學位授予權。目前,國際上只有卡耐基梅隆大學(CarnegieMellonUniversity)和喬治梅森大學(GeorgeMasonUniversity)開設了跟社會計算相關的博士培養(yǎng)點,密西根大學(U-niversityofMichigan)開設了類似的碩士培養(yǎng)點。中科院自動化所在社會計算領域的研究工作起步較早,研究實力和水平與國際同步,具備了設置社會計算這一新興交叉學科的基礎和實力。自動化所王飛躍研究員率先使用“社會計算”這一術語命名面向計算社會科學研究領域,并提出了基于ACP(人工社會ArtificialSocieties+計算實驗ComputationalExperiments+平行執(zhí)行ParallelExecution)理論方法的社會計算研究和應用框架。據(jù)悉,中科院自動化所已經開始“社會計算”交叉學科的建設工作,擬聘請王飛躍研究員為該學科的首席科學家,劉德榮研究員和曾大軍研究員為該學科的學術帶頭人。今年,自動化所將依托下屬的“復雜系統(tǒng)管理
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 核心素養(yǎng)下高中化學實驗課教學研究
- 加快經濟社會發(fā)展全面綠色轉型的策略及實施路徑
- 高考歷史一輪復習課標通史版夯基提能作業(yè)本第27講古代希臘的民主政治
- 弱電廣播系統(tǒng)施工方案
- 四川省南充市第一中學(三校區(qū))2024-2025學年高一上學期期中檢測歷史試題(原卷版)
- 大廈配套設施施工方案
- 基于改進的DBNs算法的專利價值評估系統(tǒng)研究與實現(xiàn)
- 基層畜牧獸醫(yī)動物檢疫檢驗工作的思考
- DB2統(tǒng)計信息測試數(shù)據(jù)自動生成系統(tǒng)的設計與實現(xiàn)
- 眼科門診患者疾病不確定感及與中醫(yī)證型相關性的研究
- 2024年全國職業(yè)院校技能大賽高職組(社區(qū)服務實務賽項)考試題庫(含答案)
- 中醫(yī)治療男科疾病的方法
- 墨子的《非攻》課件
- YY 0790-2024血液灌流設備
- 《基于STM32的公交車智能終端設計與實現(xiàn)》
- DB13-T 6021.3-2024 節(jié)水型企業(yè)評價導則 第3部分:石油化工業(yè)
- 護-學-崗-簽-到-簿
- 2025年日歷(日程安排-可直接打印)
- 易能變頻器edsv300說明書
- 2024年下半年杭州黃湖鎮(zhèn)招考編外工作人員易考易錯模擬試題(共500題)試卷后附參考答案
- 人音版音樂七年級上冊《父親的草原母親的河》課件
評論
0/150
提交評論