![大數(shù)據(jù)時代計量經(jīng)濟學發(fā)展展望,計量經(jīng)濟學論文_第1頁](http://file4.renrendoc.com/view/c22bc690f2c3cac731f8eab56bd21c66/c22bc690f2c3cac731f8eab56bd21c661.gif)
![大數(shù)據(jù)時代計量經(jīng)濟學發(fā)展展望,計量經(jīng)濟學論文_第2頁](http://file4.renrendoc.com/view/c22bc690f2c3cac731f8eab56bd21c66/c22bc690f2c3cac731f8eab56bd21c662.gif)
![大數(shù)據(jù)時代計量經(jīng)濟學發(fā)展展望,計量經(jīng)濟學論文_第3頁](http://file4.renrendoc.com/view/c22bc690f2c3cac731f8eab56bd21c66/c22bc690f2c3cac731f8eab56bd21c663.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
大數(shù)據(jù)時代計量經(jīng)濟學發(fā)展展望,計量經(jīng)濟學論文計量經(jīng)濟學已成為我們國家高校經(jīng)濟管理類學科本科和研究生必修的核心理論課程之一,并在我們國家經(jīng)濟學界越來越遭到關注,正可謂經(jīng)濟學界的寵兒,引領經(jīng)濟學的研究方向。任何計量經(jīng)濟學研究都離不開高質量的數(shù)據(jù)。然而對計量經(jīng)濟學學者來講,數(shù)據(jù)都是觀測數(shù)據(jù)而非實驗數(shù)據(jù),很難得到大而全、高質量的數(shù)據(jù),導致模型擬合存在天生缺陷。經(jīng)濟理論或模型作為對復雜現(xiàn)實經(jīng)濟的簡化抽象,只能刻畫主要的或重要的經(jīng)濟因素。而實際觀測到的數(shù)據(jù)卻是由很多因素共同作用的結果,華而不實,有些因素是未知的或不可觀測的,或者沒有包括在經(jīng)濟模型中,因而反映不出它們的影響。數(shù)據(jù)搜集困難導致數(shù)據(jù)不全、質量不高,加之計量模型假設過于苛刻和模型的過度擬合等缺陷致使處理結果缺乏可信度和實用性,因而當下計量經(jīng)濟學研究價值也飽受爭議。自然科學中很多學科,如物理學,能夠精到準確地把握物體運動規(guī)律和預測物體運動變化,一個重要原因是所研究的物理系統(tǒng)在相當長的一段時間內(nèi)不具有時變性。經(jīng)濟系統(tǒng)則有很大不同,經(jīng)濟發(fā)展是一個不可逆或不可重復的動態(tài)經(jīng)過,經(jīng)濟關系和經(jīng)濟系統(tǒng)也經(jīng)常發(fā)生時變和構造性變化。大數(shù)據(jù)概念炙手可熱:隨著互聯(lián)網(wǎng)的發(fā)展,大數(shù)據(jù)有著強大的數(shù)據(jù)采集能力,且數(shù)據(jù)的采集具有實時性;大數(shù)據(jù)處理和數(shù)據(jù)建模都有專業(yè)的大數(shù)據(jù)團隊來完成;計算機本身擁有強大的計算、分析和處理能力,計算機沒有失誤〔除非程序本身錯誤〕、不存在偏見和豐富的感情色彩。大數(shù)據(jù)使得不管是在數(shù)據(jù)的采集、數(shù)據(jù)的挖掘、數(shù)據(jù)的處理和數(shù)據(jù)建模等方面都有了質的飛躍,然而大數(shù)據(jù)能否彌補計量經(jīng)濟學的局限?在哪些方面、多大程度上彌補?大數(shù)據(jù)又將給計量經(jīng)濟學帶來哪些影響和沖擊?一、計量經(jīng)濟學的局限性〔一〕數(shù)據(jù)1.數(shù)據(jù)的搜集計量經(jīng)濟學研究的成功離不開全面、高質量的數(shù)據(jù)。然而,全面、高質量的數(shù)據(jù)離不開高水平的數(shù)據(jù)采集。由于受數(shù)據(jù)采集的工具、采集的條件和采集人員的失誤等因素的限制,導致經(jīng)濟數(shù)據(jù)可能存在測量誤差,數(shù)據(jù)很難知足高質量、全面、準確的要求,且經(jīng)濟學學者搜集到的原始經(jīng)濟數(shù)據(jù)幾乎都已經(jīng)過工作人員的處理,工作人員在數(shù)據(jù)統(tǒng)計時難免帶有偏見和盲點,無論預測人員帶有什么偏見和盲點,這些偏見和盲點都可能會被復制到他的計算機程序中,加之工作人員的偷懶和難以避免的失誤等人為因素,都會使得采集的數(shù)據(jù)存在失真可能,數(shù)據(jù)經(jīng)太多重的輾轉反側和多級的蹂躪才到達研究者手中。一些經(jīng)濟變量數(shù)據(jù)缺失,也使得經(jīng)濟理論研究數(shù)據(jù)缺乏完好性,給計量經(jīng)濟學研究帶來阻礙。同時經(jīng)濟數(shù)據(jù)的獲得存在嚴重的時滯現(xiàn)象,時滯也使得數(shù)據(jù)的使用價值和統(tǒng)計計量研究價值黯然失色。如美國勞工統(tǒng)計局的人員每個月頒布〔CPI〕,聯(lián)邦為了得到相關數(shù)據(jù),要雇傭很多人向全美90個城市的商店、辦公室打、發(fā)甚至登門拜訪。然而采集到的各種各樣的數(shù)據(jù)信息達80000種,要采集這些數(shù)據(jù)每年大概需要花費兩億五千萬美元。這些數(shù)據(jù)是精到準確的也是有序的,然而從數(shù)據(jù)的搜集到到達統(tǒng)計計量經(jīng)濟學者手中再到結果的頒布會滯后數(shù)周。2008年的經(jīng)濟危機表示清楚,這種滯后是致命的。對于計量經(jīng)濟學學者來講,所使用的數(shù)據(jù)時間跨度更大,要求披滿厚厚灰塵的數(shù)據(jù)有左右將來經(jīng)濟的能力,不免力不從心,數(shù)據(jù)的過于陳舊,也使得計量經(jīng)濟學模型頻繁遭遇滑鐵盧。2.數(shù)據(jù)的處理對于搜集到的數(shù)據(jù),作為數(shù)據(jù)的應用方--經(jīng)濟學學者只能被動接受。建模者通常面對的是觀測數(shù)據(jù)而非實驗數(shù)據(jù)。這對計量經(jīng)濟學中的經(jīng)歷體驗建模有兩方面的重要含義。首先,要求建模者把握與分析實驗數(shù)據(jù)極為不同的技巧其次,數(shù)據(jù)搜集者與分析者的分離要求建模者特別熟悉所用數(shù)據(jù)的性質和構造。因此經(jīng)濟學學者只能憑借個人經(jīng)歷體驗等手段屏蔽自個眼中的噪聲--對數(shù)據(jù)進行加減乘除等各項處理〔微觀經(jīng)濟數(shù)據(jù)推宏觀經(jīng)濟數(shù)據(jù)尤為如此〕。在對數(shù)據(jù)進行處理時,受制于分析能力和技術條件的限制,經(jīng)濟學學者對搜集到的數(shù)據(jù)〔尤其超大型數(shù)據(jù)〕很難進行再處理,或者進行簡單的處理,乃至不處理;即便處理也是根據(jù)學者要求進行,根據(jù)經(jīng)歷體驗來看,所有人都有各自的信仰和偏見--這種信仰和偏見是由個人的閱歷、價值觀、知識、內(nèi)涵修養(yǎng)、政治立場或者專業(yè)背景等因素凝聚而成,處理的數(shù)據(jù)也很難給出公正合理的結果;計量經(jīng)濟學學者在數(shù)據(jù)選擇時可能存在樣本的選擇偏差,數(shù)據(jù)與經(jīng)濟模型中的變量的定義可能不相符或貼合度過低;由于過分追求模型的精到準確性,學者經(jīng)常以十分數(shù)據(jù)嚴重偏離曲線為正當理由對數(shù)據(jù)進行抹殺;數(shù)據(jù)處理時細分維度低、無精細的數(shù)據(jù),使得曲線過度擬合風險增加,且原始數(shù)據(jù)很難二次細分,也給數(shù)據(jù)的應用帶來阻礙;宏觀經(jīng)濟數(shù)據(jù)大都由微觀經(jīng)濟數(shù)據(jù)簡單的加減乘除得來,這種處理可能是應用兩個或者多個低相關度的微觀數(shù)據(jù)組推導宏觀數(shù)據(jù),可能改變宏觀經(jīng)濟變量之間的關系。數(shù)據(jù)形式多樣化:隨著互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)不僅僅僅是可觀測的構造性的數(shù)據(jù),還存在不可觀測的半構造性和非構造性數(shù)據(jù)〔谷歌的搜索詞條〕等等,計量經(jīng)濟學卻沒有能力對構造性數(shù)據(jù)之外的數(shù)據(jù)進行處理。計量經(jīng)濟預測者面臨的最大挑戰(zhàn)之一就是,他們的原始數(shù)據(jù)質量不高。經(jīng)濟預測者在進行預測時,很少公開自個的預測區(qū)間,或許是由于這樣做會降低公眾對他們的專業(yè)知識的信任度。哈祖斯講:經(jīng)濟預測者為什么不公開預測區(qū)間呢?由于他們怕出丑。我以為就是這個原因.然而,不僅經(jīng)濟預測中存在著不確定性,經(jīng)濟變量本身也具有不確定性。大多數(shù)經(jīng)濟數(shù)據(jù)序列都需要修正,統(tǒng)計數(shù)據(jù)已經(jīng)頒布,修正工作可能長達數(shù)月甚至數(shù)年?!捕硵?shù)據(jù)建模1.模型假設計量經(jīng)濟模型的構建之前,需要對函數(shù)形式提出諸多前提假設,如最小二乘法的基本假設:x值是固定的或獨立于誤差項;干擾項ui的均值為0;各干擾項之間無自相關等。一個非常有價值的問題是:所有這些假定有多真實?這個假定現(xiàn)實性的問題是科學哲學中的一個古老問題。有一派觀點以為假定能否真實無關緊要,重要的是基于這些假設的預測。以假定無關緊要論著稱的弗里德曼,對他來講,假定的非真實性有著積極的意義。為了有意義,一個假設在其假定中從描繪敘述上看必定是錯誤的。但是回想一下在任何科學研究中我們做某些假定,都是由于它們便于逐步開展主題研究,并不由于它們在準確地復制了現(xiàn)實的意義上必須是真實的。但是,如一位作者所講,假如簡單性是好的理論所盼望的一個準則,那么所有好的理論都將肆無忌憚地理想化和簡單化。模型漏洞百出,提出利己假設更多的是為彌補模型漏洞。為了方便對經(jīng)濟數(shù)據(jù)進行統(tǒng)計分析,計量經(jīng)濟學家經(jīng)常要假設一個經(jīng)濟系統(tǒng)的運行規(guī)律具有不隨時間和個體改變的某些特征,比方假設經(jīng)濟系統(tǒng)具有時間平穩(wěn)性或不同經(jīng)濟人的數(shù)據(jù)生成經(jīng)過具有同質性。而任何經(jīng)濟系統(tǒng)的時變性〔不確定性〕是影響經(jīng)濟系統(tǒng)最主要的因素,一些經(jīng)濟預測者不愿意讓人們知道這一點。與其他大多數(shù)學科門類的預測者一樣,計量經(jīng)濟預測者將不確定性視作仇敵--威脅其聲譽的天敵。他們沒有對經(jīng)濟時變性做出準確地預測,而是無端地以為預測模型中的不確定性降低了,但在現(xiàn)實理論研究中,他們卻無法提高預測的質量,這樣做也無法改良真實經(jīng)濟中的預測。一旦洪水來襲,我們將毫無準備。假設給模型帶來的害處就是給模型套上了枷鎖,使得模型與實際相去甚遠,多數(shù)模型只是劃過天空的流星--經(jīng)不起時間的考驗。2.模型擬合計量經(jīng)濟學家建立經(jīng)濟理論或模型,目的就是解釋這些經(jīng)歷體驗特征事實。這一階段的關鍵是建立適宜的經(jīng)濟數(shù)學模型,模型的好壞事關經(jīng)濟研究的成敗。大多失敗的模型預測大都源于一種盲目的自信導致的過度擬合,模型實際所能解釋的問題和自以為所能解釋的問題之間存在鴻溝。他們用精到準確的預測冒充精準的預測。在統(tǒng)計學中,將噪聲誤以為信號的行為被稱為過度擬合。擬合的講法源于統(tǒng)計模型和過去的觀測值貼合度,當過于粗略地擬合時即不充分擬合,就意味著你在對觀測數(shù)據(jù)中的噪聲進行擬合,而不是挖掘數(shù)據(jù)的深層構造。在計量經(jīng)濟學研究領域,過度擬合的錯誤更為常見。為了弄清這種錯誤的成因,我們暫且賦予自個一種在現(xiàn)實中幾乎不可能擁有的優(yōu)勢--我們清楚地知道真實數(shù)據(jù)的廬山真面目。如此圖1,畫了一條平緩的拋物線,頂點落在中間位置,末端逐步加強。這條拋物線代表著我們想了解的所有現(xiàn)實數(shù)據(jù)。但是,我們還是不能直接觀察到隱藏在數(shù)據(jù)中的深層關系,這種關系由一系列的獨立的數(shù)據(jù)點具體表現(xiàn)出,而我們只能從這些點推斷出這種關系模型。除此之外,這些數(shù)據(jù)點必定受特殊環(huán)境的影響--有信號,有噪聲。在圖1中,畫了100個數(shù)據(jù)點,分別用圓形和三角形標記,貌似這樣就足以從噪聲中捕捉到信號。即便這些數(shù)據(jù)中存在一定程度的隨機性,但顯然它們?nèi)宰裱藪佄锞€。然而,當我們的數(shù)據(jù)相對有限時〔現(xiàn)實情況經(jīng)常如此〕,情況將會怎樣呢?那時我們就更可能陷入過度擬合的陷阱中。在圖2中,將100個數(shù)據(jù)點縮減至25個,這時,你會怎樣連接這些點呢?當然,前面已假設我們知道真實數(shù)據(jù)應該呈現(xiàn)的關系模型,就會自然地將它們連接成為一條拋物線。當然,這樣的數(shù)學表示出式用二次方程式能夠很好地重建真實的關系模型〔圖3〕。但是,在無法得知數(shù)據(jù)擬合的理想模型時,我們有時就會表現(xiàn)得貪心和聰明的無知。如此圖4,一個過度擬合的模型案例。在圖中,設計了一個復雜的函數(shù),能夠追蹤每一個邊緣數(shù)據(jù)點,建構準確的數(shù)學模型,用這個函數(shù)連接這些點,曲線的上下波動陡然加強。這使得模型離真實的關系模型相去甚遠,也使得預測更離譜。這個錯誤貌似很容易避免,前提是我們無所不知,對數(shù)據(jù)的深層構造總是了如指掌,因而避免這個錯誤就顯得很輕松。然而,幾乎在所有的計量經(jīng)濟學研究工作中,我們都必須利用歸納法,從已經(jīng)知道的證據(jù)中對其構造進行推斷。當數(shù)據(jù)有限且充滿噪聲時,且我們對基本關系的理解很粗淺時,就更有可能對一種模型做出過度擬合,在對經(jīng)濟危機預測時,這兩種情況可謂習以為常。假如我們既不在乎也不知道數(shù)據(jù)關系的真相,就有很多理由解釋我們?yōu)槭裁磧A向于過度擬合的模型。華而不實之一就是,在計量經(jīng)濟學學者最常用的統(tǒng)計測試中,過度擬合模型更受青睞。有一項測試是用以測試擬合模型能夠解釋多少數(shù)據(jù)的變化。根據(jù)這一測試,過度擬合的模型〔圖4〕解釋了85%的數(shù)據(jù)變化,而適度擬合模型只解釋了56%的數(shù)據(jù)變化。但是本質上,過度擬合模型是在混淆視聽,將噪聲誤當作信號混入模型中。事實上,在解釋真實世界時,它的表現(xiàn)更糟。這種解釋似乎讓情況一目了然,但很多計量經(jīng)濟學學者完全無視此問題。研究者擁有諸多統(tǒng)計檢驗方式方法,可這么多的方式方法卻沒有使他們增加一點科學態(tài)度,減少一點夢幻想象,而是更像充滿夢幻想象的孩子在天空中尋找動物形狀的云一樣。過度擬合代表了雙重毒運:過度擬合模型外表上看來比擬好,但其實際性能卻很糟糕。由于后一種因素,若被用在真實的經(jīng)濟預測中,過度擬合模型最終將使得預測者付出慘痛的代價。而由于前一種因素--其外表效果不錯,而且自稱可做出非常準確并且經(jīng)濟價值很高的預測,所以,這類模型更吸引人,更易在學術期刊上推介。但是,假如這個模型是用噪聲擬合的,就很有可能會阻礙經(jīng)濟的預測,進而阻撓經(jīng)濟發(fā)展。應該講明的是,這些錯誤習以為常。它影響我們,讓我們更容易被隨機性捉弄.我們可以能會越來越迷戀此模型的特質,甚至可能會創(chuàng)造出一個貌似很有講服力的理論來佐證這一錯誤的合理性。從邏輯的角度來看,這有點像觀測者效應〔長被誤以為海森堡的不確定性原理〕:一旦我們開場測量某物,它的行為就會主動乃至被動發(fā)生改變。大多數(shù)統(tǒng)計模型都是依托這一概念建立的,自變量與因變量、信號與噪聲,相互之間涇渭分明,但在經(jīng)濟領域中,它們相互之間卻混在一起、亂作一團?!踩衬P蜋z驗和預測以統(tǒng)計檢驗著稱的計量經(jīng)濟學,做普通的線性回歸分析時,如研究自變量和因變量的關系時,對自變量回歸系數(shù)采用t檢驗,計量經(jīng)濟學界公認t0.05就講明兩變量相關,精到準確度則在95%以上。計量經(jīng)濟學學者在收集樣本的時候應用一整套的方式方法減少錯誤發(fā)生的概率。在統(tǒng)計檢驗之前,他們也會檢測樣本能否存在潛在的系統(tǒng)性偏差。這些躲避錯誤的手段無不在美化結果。一味的追求精到準確性,無時不在驅使著統(tǒng)計計量學家去挖掘愈加智能的算法系統(tǒng)模型。回歸分析有一些值得提出的基本分歧:在回歸分析中,對解釋變量和因變量的處理方式方法存在著不對稱性。因變量被當作是隨機的、統(tǒng)計的,也就是因變量有一個概率分布。而解釋變量則被看作是在重復抽樣中獲得固定值。解釋變量本身也是隨機的。但是出于回歸分析的目的,計量經(jīng)濟學學者假定它們的值在重復抽樣中固定不變〔即X在不同的多個樣本中取同樣的一組值〕,進而把它們轉變成本質上非隨機的。計量經(jīng)濟模型通過實證檢驗擬合成功后,可用來檢驗經(jīng)濟理論或經(jīng)濟假講的正確性以及提供政策建議,當然最終要預測將來經(jīng)濟的走向。模型的質量決定預測的質量:墨菲提出,衡量預測的一種途徑--或許也是最顯而易見的途徑--就是通過他所講的質量,但何種質量才可被認定為準確呢?質量是指預測與實際天氣相符合嗎?無論預測得多么準確,這個預測是預測者當時的巔峰之作嗎?這個預測能否反映了預測者的最佳判定呢?公之于眾之前,這個預測能否作了某種程度的修飾呢?預測能否有經(jīng)濟價值,判定的根據(jù)就是,預測能否有助于公眾或政治決策者做出更好的決定或決策。經(jīng)濟理論或模型作為對復雜現(xiàn)實經(jīng)濟的簡化抽象,只能刻畫主要的或重要的經(jīng)濟因素。而實際觀測到的數(shù)據(jù)卻是由很多因素共同作用的結果,失敗預測的模型可能應用非樣本數(shù)據(jù),華而不實有些因素是未知的或不可觀測的,并沒有包括在經(jīng)濟模型中,或者數(shù)據(jù)的信噪比過低,因而反映不出它們的影響,而計量經(jīng)濟學學者卻沒有足夠的能力和技術做出甄別。這點與自然科學不同,自然科學研究能夠通過可控實驗過濾或消除次要因素的影響。在經(jīng)濟學領域,經(jīng)濟學家通常是數(shù)據(jù)的使用方,大多數(shù)收集到的經(jīng)濟數(shù)據(jù)都是非實驗性的。因而無法從觀測到的經(jīng)濟數(shù)據(jù)過濾出經(jīng)濟模型以外的因素所產(chǎn)生的那一部分影響,這便造成經(jīng)濟實證研究的困難。經(jīng)濟數(shù)據(jù)和經(jīng)濟系統(tǒng)的上述特征,不可避免地造成了計量經(jīng)濟學實證研究的局限性,使之難以到達與一些自然科學學科那樣的成熟程度。計量經(jīng)濟學所面臨的局限性不是計量經(jīng)濟學本身所特有的,而是整個經(jīng)濟學科所面臨的局限性。事實上,正是由于經(jīng)濟系統(tǒng)的非實驗性、時變性和不可逆性,以及經(jīng)濟數(shù)據(jù)的種種缺陷,計量經(jīng)濟學理論本身的發(fā)展已相對全面和成熟。但是這種先進的實證研究方式方法,仍無法代替或克制由經(jīng)濟系統(tǒng)和經(jīng)濟數(shù)據(jù)特點所造成的局限,進而使得計量經(jīng)濟學的分析與預測遠沒有像多數(shù)自然科學學科那樣精到準確。經(jīng)濟是一個動態(tài)系統(tǒng),不是一個方程式,假如你只把經(jīng)濟當作一系列變量和方程式,而沒有看到其深層次構造,那就很容易把噪聲當成信號,誤以為自個正在做出準確地預測,而實際上你的預測并不準確。大多數(shù)計量經(jīng)濟學家做預測時,會在一定程度上依靠自個的判定,而不根據(jù)統(tǒng)計模型輸出的信息進行預測??紤]到數(shù)據(jù)雜亂性,這種做法或許是有益的。20世紀七八十年代計算機開場廣泛使用時,經(jīng)濟學家普遍以為統(tǒng)計模型能夠解決經(jīng)濟預測問題。但是,改良的技術無法掩蓋對經(jīng)濟領域理論認識的缺乏,只會讓經(jīng)濟學家愈加迅速且煞費苦心地將噪聲誤以為信號??此魄熬安诲e的預測模型在某些方面一敗涂地,最后慘遭淘汰。二、大數(shù)據(jù)時代的思維變革經(jīng)濟預測者面臨著三大基本挑戰(zhàn)。第一,單純依靠經(jīng)濟統(tǒng)計數(shù)據(jù)〔僅依靠構造性數(shù)據(jù)〕,很難判定原因與結果。第二,經(jīng)濟是一個動態(tài)系統(tǒng),始終都在變化,某一經(jīng)濟周期的經(jīng)濟運行狀況無法被用來解釋將來經(jīng)濟的發(fā)展。第三,經(jīng)濟學家以往的預測如此糟糕,那么他們作預測時所參照的數(shù)據(jù)也好不到哪去。以上挑戰(zhàn)問題和大數(shù)據(jù)的特點不謀而合。IBM公司從其特點定義大數(shù)據(jù):實時性--大數(shù)據(jù)是在線的,隨時可調(diào)用和計算的,這是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)的最大特征;多樣性--種類、來源多樣化,包括構造化、半構造化和非構造化數(shù)據(jù);規(guī)模性--數(shù)據(jù)量大,包括數(shù)據(jù)的采集、存儲和計算的量都非常大。之后業(yè)界又加了兩個特點:價值性--大數(shù)據(jù)作為新的生產(chǎn)力,創(chuàng)造價值;速度快時效高--增長和處理速度快,時效要求也高。如此一來,大數(shù)據(jù)又在哪些方面給計量經(jīng)濟學帶來影響和沖擊呢?〔一〕數(shù)據(jù)1.數(shù)據(jù)的采集大數(shù)據(jù)是以移動終端、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等移動或者固定設備為依托而產(chǎn)生的非構造化、半構造化以及構造化數(shù)據(jù)的總和。幾乎每個經(jīng)濟體,每時每刻都在生產(chǎn)數(shù)據(jù),雖講大數(shù)據(jù)技術的意義不在于把握規(guī)模龐大的數(shù)據(jù)信息,而在于對這些數(shù)據(jù)進行智能處理,從中分析和挖掘出有價值的信息,但前提是擁有大量數(shù)據(jù)。古人云:巧婦難為無米之炊,所以數(shù)據(jù)采集是為大數(shù)據(jù)價值挖掘創(chuàng)造條件,是大數(shù)據(jù)價值挖掘的基礎。數(shù)據(jù)采集的方式多樣化:不管是移動的還是固定設備,要進行數(shù)據(jù)的采集都直接或者間接的和傳感器相關。它更多地賦予設備智能化。傳感器的可集成性、多樣性、準確性等特點使得數(shù)據(jù)的采集變得方便、快速、準確。當前世界最小的晶體管2nm[7].2nm的研發(fā)成功對于芯片市場來講絕對是個令人振奮的成果,假如該晶體管真正量產(chǎn)并廣泛使用,將會極大地提高芯片的性能。到時科技將賦予傳感器更多、更全的功能,傳感器的精到準確度也會有質的飛躍。2nm絕對不是極限,科技的飛速發(fā)展和進步--數(shù)據(jù)采集的方式方法和手段的革新,也將更好地幫助人類去獲取愈加及時、準確和多樣的數(shù)據(jù)。2.大數(shù)據(jù)的挖掘只要米沒有巧婦,也不會有可口的飯菜。如此一來,自然誕生了下一個產(chǎn)業(yè)鏈:數(shù)據(jù)挖掘。數(shù)據(jù)挖掘賦予了大數(shù)據(jù)智能生命。有了數(shù)據(jù)倉庫為依托,數(shù)據(jù)挖掘如虎添翼,就如巧婦進入了米倉.數(shù)據(jù)挖掘指通過一定的計算機算法對大量數(shù)據(jù)進行數(shù)據(jù)分析,進而解釋大數(shù)據(jù)背后隱藏的趨勢、形式和關系,為決策者提供根據(jù),創(chuàng)造價值。之所以稱作挖掘,就比方在蒼茫大地中開礦掘金一樣困難。數(shù)據(jù)挖掘的主要目的:一是去發(fā)現(xiàn)埋藏在大數(shù)據(jù)外表下的歷史規(guī)律,即對歷史描繪敘述性分析;二是對將來進行預測,即預測性分析。數(shù)據(jù)挖掘把數(shù)據(jù)分析的范圍從已經(jīng)知道到未知,從過去到將來,是商務智能的真正的生命力和靈魂所在。它的成熟與發(fā)展,最終推動商務智能在各行各業(yè)的廣泛應用。多維度數(shù)據(jù)分析法作為大數(shù)據(jù)挖掘的基本方式方法,它主要通過對數(shù)據(jù)的匯總、比照、穿插、趨勢分析等途徑,獲取有價值的信息。數(shù)據(jù)分析的多維度不僅彌補了獨立維度進行分析所難得發(fā)現(xiàn)的一些問題--不同維度之間的相關關系,通太多維度之間的比擬、細分,使得分析結果更有意義,還賦予大數(shù)據(jù)更多的價值。計算機數(shù)據(jù)處理的優(yōu)點:計算速度快;不會犯錯,除非編程時就編入錯誤;不會偷懶,在分析招數(shù)、分析可能位置時不會半途而廢;不存在偏見,不帶感情色彩,不會贏了一步過度自信以致失去勝勢,或是碰到困局而沮喪。互聯(lián)網(wǎng)的數(shù)據(jù)采集優(yōu)點:數(shù)據(jù)的采集實現(xiàn)實時性,不摻雜個人感情和偏見;采集到的數(shù)據(jù)形式多樣化;原始數(shù)據(jù)可根據(jù)個人需要隨意提取。計算機和互聯(lián)網(wǎng)的以上優(yōu)點也給大數(shù)據(jù)彌補計量經(jīng)濟學的局限和成就計量經(jīng)濟學帶來了可乘之機?!捕炒髷?shù)據(jù)分析1.大數(shù)據(jù)預測追求混雜性而非精到準確性計量經(jīng)濟學研究經(jīng)常根據(jù)所研究的內(nèi)容事先提出多個前提假設,在假設的基礎上,應用數(shù)學模型進行統(tǒng)計檢驗驗證假設。經(jīng)濟學學者在收集樣本的時候應用一整套的方式方法減少錯誤發(fā)生的概率。在統(tǒng)計檢驗之前,他們也會檢測樣本能否存在潛在的系統(tǒng)性偏差。這些躲避錯誤的手段無不在美化結果。一味地追求精到準確性,無時不在驅使著統(tǒng)計計量學家去挖掘愈加智能的算法系統(tǒng)。大數(shù)據(jù)更多的用概率講話,不再追求精到準確性,轉而追求數(shù)據(jù)維度的集合--混雜性。大數(shù)據(jù)不僅要求計量經(jīng)濟學預測不再追求精到準確性,伴隨數(shù)據(jù)維度和組合越來越豐富,也使得他們無法實現(xiàn)精到準確性。錯誤不是大數(shù)據(jù)所特有的,但是也是大數(shù)據(jù)無法消除的,且可能長期存在的。假如計量經(jīng)濟學試圖擴大數(shù)據(jù)的維度,獲得大數(shù)據(jù)帶來的價值,大數(shù)據(jù)就要求計量經(jīng)濟學包涵和接受混雜性和不確定性?;祀s是標準途徑,而不應當是計量經(jīng)濟學所竭力避免的。大數(shù)據(jù)要求計量經(jīng)濟學學者重新審視精到準確性的優(yōu)劣,嘗試追求數(shù)據(jù)的完備性和混雜性,進而實現(xiàn)范式轉移。據(jù)估計,只要5%的數(shù)字數(shù)據(jù)是構造化的且能適用于傳統(tǒng)數(shù)據(jù)庫,假如不接受混雜性,剩下95%的半構造化和非構造化數(shù)據(jù)都無法被利用,比方網(wǎng)頁和視頻資源。通過接受大數(shù)據(jù)非精到準確性,我們就會打開一個從未牽涉的經(jīng)濟之窗。2.大數(shù)據(jù)預測:樣本=總體傳統(tǒng)計量經(jīng)濟學研究一直停留在小數(shù)據(jù)時代,對于新生事物是不敏感的,必須等事情發(fā)生并且成長到一定規(guī)模以后才能搜集到足夠數(shù)據(jù)進行相關研究。在計量經(jīng)濟學理論研究中,由于分析、記錄和存儲數(shù)據(jù)的工具不夠好,加之數(shù)據(jù)搜集條件和數(shù)據(jù)處理能力等方面的影響,只能應用少量數(shù)據(jù)講話.計量經(jīng)濟學家們以為:樣本分析的精到準確性隨著采樣隨機性的增加而大幅度提高,與樣本數(shù)量的增加關系不大,即樣本選擇的隨機性比樣本數(shù)量更重要,退一步講,當然這種觀點頗有建樹,通過搜集樣本,用較少的花費做出高精到準確度的判定,固然樣本分析獲得了宏大成功,成為現(xiàn)代測量領域的中流砥柱。但是這只不過是條捷徑,是在迫不得已〔搜集和分析數(shù)據(jù)等困難的束縛〕的情況下的迫不得已。樣本采集的經(jīng)過中難免摻雜個人感情,加之經(jīng)濟學學者往往還要對采集到的數(shù)據(jù)進行二次處理,研究結果多被采樣的質量綁架,大大降低了研究成果的質量。結論往往誕生在結果之前,也不免使得結論價值大打折扣。在經(jīng)濟活動中真正有趣的事情往往藏匿在細節(jié)中,這是樣本分析法難以捕捉的--如啤酒與尿布的相關關系。在大數(shù)據(jù)時代,利用所有的數(shù)據(jù),而不再僅僅局限于依靠小部分構造性數(shù)據(jù),拓展了計量經(jīng)濟學的研究范圍。采集數(shù)據(jù)的方式多樣化,擁有先進的技術手段對大規(guī)模數(shù)據(jù)快速處理,且數(shù)據(jù)的采集具有實時性,能夠愈加快速地通過分析全體數(shù)據(jù)對經(jīng)濟行為進行研究,一旦有新情況、新動態(tài)立即予以關注,及時對事前政策做出適應性調(diào)整和指導將來政策的走向,進而實現(xiàn)對新生事物的早期干涉和分析,因而具有前瞻性。大數(shù)據(jù)本身就具有智能,能夠輔助計量經(jīng)濟學發(fā)現(xiàn)知識。麻省理工學院〔MIT〕的兩位經(jīng)濟學家,阿爾貝托卡瓦羅和羅伯托里哥本通過一個軟件在互聯(lián)網(wǎng)上搜集信息,他們天天能夠搜集到50萬種商品的價格。收集到的數(shù)據(jù)很混亂,也不是所有數(shù)據(jù)都能輕易進行比擬。但是把大數(shù)據(jù)和好的分析法相結合,這個項目在2008年9月雷曼兄弟破產(chǎn)之后馬上就發(fā)現(xiàn)了通貨緊縮趨勢,然而那些依靠官方數(shù)據(jù)的人直到11月才知道這種情況。三、大數(shù)據(jù)和計量經(jīng)濟學的融合計量經(jīng)濟學是被樣本=總體撼動的最厲害的經(jīng)濟學分支學科之一,伴隨大數(shù)據(jù)分析取代樣本分析,計量經(jīng)濟學不再單純地依靠實證數(shù)據(jù)分析。雖講統(tǒng)計抽樣在經(jīng)濟學界固若金湯,但統(tǒng)計抽樣只是為了在被技術限制的特定時期,解決存在問題的被動選擇?,F(xiàn)如今,技術已不是阻止大數(shù)據(jù)的最大障礙,當然在特定條件下統(tǒng)計抽樣方式方法仍然可用。大數(shù)據(jù)拓展了計量經(jīng)濟學的研究范圍,可增加計量經(jīng)濟學研究的實用性,數(shù)據(jù)的實時性可以增加計量經(jīng)濟學預測的準確性。大數(shù)據(jù)所牽涉的資料已遠遠超出一般的計量經(jīng)濟學分析所能處理的范疇,大數(shù)據(jù)分析法的出現(xiàn)給計量經(jīng)濟學研究提供了更大的空間、更新的視角,也給以往計量經(jīng)濟學難以研究或者不可研究的經(jīng)濟領域--如商業(yè)中啤酒和尿布的關系,注入了新的原動力;大數(shù)據(jù)分析法并非是傳統(tǒng)計量經(jīng)濟學家通過考慮、領悟、觀察、建模等方式方法的分析而獲取結論的,而是通過大數(shù)據(jù)的聚集和不同數(shù)據(jù)維度的組合、穿插,運用計算機技術和大數(shù)據(jù)思維處理得來的;大數(shù)據(jù)構建了豐富且可持續(xù)完善的數(shù)據(jù)集和分析工具,其分享性、協(xié)調(diào)性、重用性等大大加強,這些都為大數(shù)據(jù)與計量經(jīng)濟學的融合提供條件;大數(shù)據(jù)聚集專業(yè)領域的數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)維護等專業(yè)團隊,也為與計量經(jīng)濟學的融合提供了必備條件。以上所有的理由都表示清楚:大數(shù)據(jù)和計量經(jīng)濟學融合有其天然的優(yōu)勢,同時也是大勢所趨。計算機速度非???,而且它能夠非常踏實衷心地計算--孜孜不倦、不帶感情、不會中途改變分析方式。但這并不意味著電腦做出的預測就一定很完美或者很準確。若給計算機輸入錯誤的數(shù)據(jù),或提供一套愚笨的指令供其分析,它不可能變廢為寶.除此之外,計算機也不擅長完成需要創(chuàng)造性和想象力的任務,比方為這個世界的運轉方式設計謀略或提出理論。因而,大數(shù)據(jù)和計量經(jīng)濟學的珠聯(lián)璧合顯得尤為重要。將來大數(shù)據(jù)計量經(jīng)濟學的研究,不僅僅需要大數(shù)據(jù)、云計算的技術支持,還要有第三方大數(shù)據(jù)處理機構--大數(shù)據(jù)算法師、大數(shù)據(jù)建模師、大數(shù)據(jù)維護師等,計量經(jīng)濟學家也是不可或缺的。將來計量經(jīng)濟學家、大數(shù)據(jù)擁有者、大數(shù)據(jù)處理機構共同構造大數(shù)據(jù)計量經(jīng)濟學的價值鏈,使得計量經(jīng)濟學更接地氣,創(chuàng)造更大的經(jīng)濟價值。大數(shù)據(jù)時代,我們將見證大數(shù)據(jù)計量經(jīng)濟學騰飛。四、考慮與總結經(jīng)濟預測和經(jīng)濟政策之間的界線特別模糊,一個不準確的預測可能會使現(xiàn)實中的經(jīng)濟狀況變得更糟。大數(shù)據(jù)應用全體數(shù)據(jù)分析二維或多維數(shù)據(jù)的相關性,而不是分析少量數(shù)據(jù)樣本;大數(shù)據(jù)對紛繁混雜的數(shù)據(jù)選擇了包涵,而不再一味地去追求精到準確性;大數(shù)據(jù)不再追尋經(jīng)濟行為之間的因果關系,轉而用相關關系挖掘經(jīng)濟行為之間的聯(lián)絡。這些給計量經(jīng)濟學研究帶來的好處就是:大數(shù)據(jù)量化經(jīng)濟風險,減弱了經(jīng)濟行為中因信息不確定性帶來的逆向選擇和道德風險;大數(shù)據(jù)提供計量經(jīng)濟學更大的探尋歷史、追尋將來的空間;傳統(tǒng)計量經(jīng)濟理論多
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人貸款合同樣本:銀行借款專用
- 一站式融資擔保合同范例
- 個人住宅購買合同樣本
- 個人清潔服務合同范本
- 個人貨車租賃合同模板
- 二手房買賣合同范本
- 買賣合同簡易版樣本:家庭用品
- 專利許可合同其二:地域限制說明
- 個人股權轉讓合同
- 2025年物流費用結算辦法協(xié)議
- 關于市推動高新技術企業(yè)發(fā)展的調(diào)研報告
- 13J103-7《人造板材幕墻》
- 上海高考英語詞匯手冊列表
- PDCA提高患者自備口服藥物正確堅持服用落實率
- 上海石油化工股份有限公司6181乙二醇裝置爆炸事故調(diào)查報告
- 家譜人物簡介(優(yōu)選12篇)
- 品管部崗位職責20篇
- 2023年中智集團下屬中智股份公司招聘筆試題庫及答案解析
- GA 1409-2017警用服飾硬式肩章
- 小兒垂釣 (課件)(14張)
- 嘉吉樂恩貝1-FarLactation課件
評論
0/150
提交評論