專題一-統(tǒng)計數(shù)據(jù)分析-統(tǒng)計數(shù)據(jù)概述_第1頁
專題一-統(tǒng)計數(shù)據(jù)分析-統(tǒng)計數(shù)據(jù)概述_第2頁
專題一-統(tǒng)計數(shù)據(jù)分析-統(tǒng)計數(shù)據(jù)概述_第3頁
專題一-統(tǒng)計數(shù)據(jù)分析-統(tǒng)計數(shù)據(jù)概述_第4頁
專題一-統(tǒng)計數(shù)據(jù)分析-統(tǒng)計數(shù)據(jù)概述_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

專題一統(tǒng)計數(shù)據(jù)概述商務(wù)統(tǒng)計

本章主要介紹了:數(shù)據(jù)來源數(shù)據(jù)的計量尺度數(shù)據(jù)的類別數(shù)據(jù)的整理第一節(jié)數(shù)據(jù)來源

(datasource)數(shù)據(jù)的來源一般有干脆和間接兩種來源:干脆來源間接來源原始數(shù)據(jù)(rawdata)一般通過統(tǒng)計調(diào)查、統(tǒng)計試驗等手段獲得;次級數(shù)據(jù)(secondarydata)一般通過查閱、購買等手段獲得。數(shù)據(jù)獲得渠道對于公司來說,所須要的數(shù)據(jù)主要是公司自身的數(shù)據(jù),這可以從公司的各種記錄中得到;行業(yè)數(shù)據(jù)、市場數(shù)據(jù)等可以通過自己組織調(diào)查或從詢問調(diào)查公司購買得到;宏觀數(shù)據(jù)則可以從政府部門發(fā)布的年鑒、報告獲得。還有一種就是通過統(tǒng)計試驗活動數(shù)據(jù)。對于政府發(fā)布的數(shù)據(jù),一個重要獲得途徑是政府網(wǎng)站。Example:公司內(nèi)部數(shù)據(jù)職員記錄:姓名、地址、社會保障號碼、工薪、任職狀況、其他個人狀況;生產(chǎn)記錄:部件或產(chǎn)品、生產(chǎn)量、管理成本、原料成本等;銷售記錄:產(chǎn)品、銷售量、區(qū)域銷售量、客戶類型銷售量、營銷成本等;信用記錄:客戶名稱、地址、電話、信用限額、應(yīng)收帳款余額;客戶記錄:年齡、性別、收入水平、家庭狀況、地址、愛好。Example:從特地收集和維護數(shù)據(jù)的組織中獲得商務(wù)和經(jīng)濟數(shù)據(jù)國外——如:鄧布拉斯公司(Dun&Bradstreet)、道-瓊斯公司是兩個向客戶供應(yīng)大量商業(yè)數(shù)據(jù)的公司;國內(nèi)——如:央視調(diào)查詢問中心、零點市場調(diào)查與分析公司。Example:試驗數(shù)據(jù)例如:制藥公司通過試驗了解一種新藥是否會影響血壓或其他副作用;又如,在正式實施某一策略前,進行小規(guī)模的試點,等等Example:政府機構(gòu)是數(shù)據(jù)的重要來源中國統(tǒng)計年鑒及各省市地區(qū)統(tǒng)計年鑒各級政府工作報告國務(wù)院各有關(guān)部委發(fā)布的公告其他官方資料Appendix:常用的一些免費數(shù)據(jù)網(wǎng)絡(luò)地址中國國家統(tǒng)計局以及各省市統(tǒng)計局官方網(wǎng)站://中國勞動社會保障部://國家外匯管理局:///model_safe/index.html世經(jīng)中國:///美國經(jīng)濟分析局(BEA,U.S.DepartmentofCommerceBureauofEconomicAnalysis)

://美國勞工部(BLS,U.S.DepartmentofLaborBureauofLaborStatistics)://其次節(jié)數(shù)據(jù)的計量尺度

(ScalesofMeasurement)統(tǒng)計數(shù)據(jù)是對客觀現(xiàn)象接受某種計量尺度對事物進行計量的結(jié)果。Dataarethefactsandfiguresthatarecollected,analyzed,andsummarizedforpresentationandinterpretation.依據(jù)對事物計量的精確程度,可將所接受的計量尺度由低級到高級分為四個層次:定類尺度(NominalScale)定序尺度(OrdinalScale)定距尺度(IntervalScale)定比尺度(RatioScale)定類尺度(列名尺度),依據(jù)事物的某種屬性對其進行平行的分類或分組。例1:人的性別(男、女);企業(yè)的全部制性質(zhì)(國有、私營等)特點1、定類尺度只測度了事物之間的類別差,而對各類之間的其他差別卻無法從中得知,因此各類地位相同,依次可以隨意變更;具有對稱性和傳遞性的特點。(對稱性:A對B的關(guān)系,也就是B對A的關(guān)系;傳遞性:A=BB=C,也即A=C)2、對定類尺度的計量結(jié)果,可以且只能計算每一類別中各元素個體出現(xiàn)的頻數(shù)(frequency)。▼留意對事物進行分類時,必需符合窮盡(exhaustive)和互斥(mutuallyexclusive)要求。一、定類尺度定序尺度(依次尺度),是對事物之間等級或依次差別的一種測度。例2:產(chǎn)品等級(一等品、二等品、…)考試成果(優(yōu)、良、中、可、差)特點:1、不僅可以測度類別差(分類),還可以測度次序差(比較優(yōu)劣或排序);具有傳遞性(A>B,B>C,則A>C),不具有對稱性。2、無法測出類別之間的精確差值,因此該尺度的計量結(jié)果只能排序,不能進行算術(shù)運算。二、定序尺度定距尺度(間隔尺度),是對事物類別或次序之間間距的測度。例3:100分制考試成果;攝氏溫度對不同地區(qū)溫度的測量。特點:1、具有定序尺度的全部特征,不僅能將事物區(qū)分為不同類型并進行排序,而且可精確指出類別之間的差距是多少;2、定距尺度通常以自然或物理單位為計量尺度,因此測量結(jié)果表現(xiàn)為數(shù)值;3、計量結(jié)果可以進行加減運算(加減運算有意義);4、“0”是測量尺度上的一個測量點,并不代表“沒有”三、定距尺度定比尺度(比率尺度):是能夠測算兩個測度值之間比值的一種計量尺度。例4:職工月收入;企業(yè)產(chǎn)值;公制的距離、重量特點:1、與定距尺度屬于同一層次,具有定距尺度的全部特征,而且存在確定零點。計量結(jié)果表現(xiàn)為數(shù)值;2、除了具有其他三種計量尺度的計算特點外,還具有可計算兩個測度值之間比值的特點;3、“0”表示“沒有”,即它有一固定的確定“零點”,因此它可進行加、減、乘、除運算。四、定比尺度▼留意:定距尺度中的“0”并不表示“沒有”,不是一個確定的“零點”;而定比尺度中的“0”表示“沒有”,是一個確定的“零點”。攝氏溫度中的0度不是確定零點;熱力學(xué)溫度中的0K可以認為是確定零點。1、四種計量尺度對事物的計量層次是由低級到高級、由粗略到精確逐步遞進的。2、高層次的計量尺度可以計量低層次計量尺度能夠計量的事物,但反之不行;3、可將高層次計量尺度的計量結(jié)果轉(zhuǎn)換為低層次計量尺度的計量結(jié)果,但不能反過來。

Summarization:四種計量尺度的區(qū)分與聯(lián)系Exercises指出下面變量的測量尺度:學(xué)生住址距學(xué)校的距離;學(xué)生某門課的一次測驗成果(百分制);學(xué)生的誕生地;按年級分類的高校學(xué)生;每周學(xué)生學(xué)習的小時數(shù);夏季室外溫度。第三節(jié)數(shù)據(jù)的分類從數(shù)據(jù)的表現(xiàn)形式不同:定性數(shù)據(jù)和定量數(shù)據(jù)從計量尺度的不同:定類數(shù)據(jù)、定序數(shù)據(jù)、定距數(shù)據(jù)和定比數(shù)據(jù)從數(shù)據(jù)的反映方式不同:確定數(shù)、相對數(shù)和平均數(shù)從樣本性質(zhì)不同:截面數(shù)據(jù)、時間序列和面板數(shù)據(jù)從數(shù)據(jù)反映的范圍不同:總體數(shù)據(jù)和樣本數(shù)據(jù)從數(shù)據(jù)內(nèi)容不同:宏觀經(jīng)濟數(shù)據(jù)、微觀經(jīng)濟數(shù)據(jù)、社會學(xué)數(shù)據(jù)、自然科學(xué)數(shù)據(jù)等等

從不同的角度可以對數(shù)據(jù)進行分類一、數(shù)據(jù)表現(xiàn)形式不同定性數(shù)據(jù)(Qualitativedata)說明的是事物的品質(zhì)特征,不能用數(shù)值表示(可以接受確定技術(shù)手段進行定量化),由定類尺度或定序尺度計量形成;定量數(shù)據(jù)(Quantitativedata)說明的是事物的數(shù)量特征,能夠用數(shù)值表示,由定距尺度或定比尺度計量形成。▼對不同類型的數(shù)據(jù),接受的統(tǒng)計方法會有所不同定性數(shù)據(jù)接受的分析方法較少:如組頻率、非參數(shù)統(tǒng)計方法等;定量數(shù)據(jù)除了可接受定性數(shù)據(jù)的分析方法外,還可以接受更多的統(tǒng)計分析方法。二、按計量尺度的數(shù)據(jù)分類定類數(shù)據(jù):對稱性和傳遞性(如性別、門牌號、生產(chǎn)日期)定序數(shù)據(jù):傳遞性(如產(chǎn)品等級、學(xué)歷等)定距數(shù)據(jù):可比較相對大?。ㄈ鐪囟龋┒ū葦?shù)據(jù):具有確定零點,可比較相對大小和確定大?。ㄈ缡杖?、支出、產(chǎn)值、人口數(shù)等)

▼定類數(shù)據(jù)和定序數(shù)據(jù)屬于定性數(shù)據(jù),定距數(shù)據(jù)和定比數(shù)據(jù)屬于定量數(shù)據(jù)。商務(wù)統(tǒng)計實踐中,對于通過計數(shù)和數(shù)學(xué)運算得到的定量數(shù)據(jù)具有三種基本表現(xiàn)形式:確定數(shù)、相對數(shù)和平均數(shù)。(均可現(xiàn)實說明)三、數(shù)據(jù)反映形式不同(經(jīng)濟統(tǒng)計中)1、確定數(shù)(Absolutenumber)確定數(shù)是統(tǒng)計數(shù)據(jù)的最基本表現(xiàn)形式,表明事物(現(xiàn)象)的確定數(shù)量特征,即確定規(guī)模或水平。如:人口、GDP、進口額、出口額、商品零售額等▼確定數(shù)由于反映的是現(xiàn)實中的現(xiàn)象規(guī)模和水平,因此具有計量單位:實物單位(噸、公里)價值單位(元、萬元)、復(fù)合單位(噸公里、千瓦時)雙重/多重單位(馬力/臺、噸/(立方米·座·年))時期數(shù)和時點數(shù)特點:1、時期數(shù)可連續(xù)計量,并可累加;2、時點數(shù)只可間斷計量,一般不能累加(累加無現(xiàn)實說明)。▼確定數(shù)按其反映事物現(xiàn)象的時間狀況不同可分為時期數(shù)和時點數(shù):時期數(shù)(periodicalnumber)反映事物現(xiàn)象在確定時期內(nèi)的總量,如:產(chǎn)量、產(chǎn)值、誕生人口;

時點數(shù)(time-pointnumber)反映事物現(xiàn)象在某一瞬間時刻上的總量,如:人口數(shù)、土地面積等。2、相對數(shù)(relativenumber)相對數(shù)是一般是兩個確定數(shù)的比值,反映事物的相對水平;但有時也可以是兩個相對數(shù)或者兩個平均數(shù)的對比。相對數(shù)的表現(xiàn)形式:比例、比率。例5:一數(shù)量為N的總體被分為K個部分,各部分的數(shù)量分別為Ni,則比例定義為:Ni/N。明顯有:比例(Proportion)

:總體中各個部分的數(shù)量占總體數(shù)量的比重,反映總體的構(gòu)成或結(jié)構(gòu)。一般以百分數(shù)等表示。▼百分數(shù)(Percentage):將對比的基數(shù)抽象化為100而計算的相對數(shù)。比率(Ration)

:各不同類別的數(shù)量比值??梢允峭豢傮w中不同部分的比較(系數(shù)、倍數(shù))如,人口中:男性人口數(shù)/女性人口數(shù);GDP中:投資/消費;可以是同一現(xiàn)象在不同空間上的對比(系數(shù)、倍數(shù))如,不同地區(qū)GDP之比兩個地區(qū)經(jīng)濟水平差異可以是同一總體同一現(xiàn)象在不同時空的對比,即速度(%)如,不同年份GDP之比經(jīng)濟發(fā)展速度可以是不同現(xiàn)象確定數(shù)之間的對比,即強度相對數(shù)如,人均GDP、數(shù)字電視普及率、外貿(mào)依存度等可以是不同相對數(shù)或平均數(shù)對比(系數(shù)、倍數(shù))如,需求價格彈性、相對匯率等

3、平均數(shù)(averagenumber)一般來說,經(jīng)濟統(tǒng)計中平均數(shù)是兩個確定數(shù)之比,分子反映總體某種特征總量,分母則是總體(總體可是某個時間跨度)中所包含的元素(元素可以是時期或時點)總數(shù)??梢苑譃榭臻g(靜態(tài))平均數(shù)和序時(動態(tài))平均數(shù)。經(jīng)濟統(tǒng)計中,一般要求計算過程和計算結(jié)果有實際含義(時點數(shù)計算過程除外),因此:計算相對數(shù)或者平均數(shù)的空間(靜態(tài))平均數(shù)時,總是先轉(zhuǎn)化為分子確定數(shù)和分母確定數(shù),再對比;計算相對數(shù)或者平均數(shù)的序時(動態(tài))平均數(shù)時,則是先計算相對數(shù)或者平均數(shù)分子確定數(shù)、分母確定數(shù)的序時平均數(shù),再對比。四、按樣本性質(zhì)不同截面數(shù)據(jù)(Cross-sectionaldata):同一時點或時期的總體各單位的數(shù)據(jù)。時間序列數(shù)據(jù)(Timeseriesdata):將若干個時間上搜集來的反映相同內(nèi)容的數(shù)據(jù)按時間先后依次排列在一起,便形成了時間序列數(shù)據(jù)。面板數(shù)據(jù)(Paneldata):截面數(shù)據(jù)和時間序列數(shù)據(jù)交織在一起所形成的數(shù)據(jù)集。面板數(shù)據(jù)既具有截面數(shù)據(jù)的特征,又具有時間序列數(shù)據(jù)的特征。年份進口總額2003119.3200293.7200188.0200081.2199955.2199846.9……表1遼寧省各年進口總額單位:億美元資料來源:《中國統(tǒng)計年鑒2004》Example:Timeseriesdata地區(qū)消費品零售總額(億元人民幣)進口總額(億美元)…北京1916.7516.1…天津922.3149.9…河北1841.630.5…山西729.38.2…內(nèi)蒙古676.816.7…遼寧2330.8119.3……………表22003年中國各地區(qū)主要經(jīng)濟指標資料來源:《中國統(tǒng)計年鑒2004》Example:Cross-sectionaldataExample:Paneldata地區(qū)年份200320022001200019991998北京1916.71744.81593.51443.31313.31167.2天津922.3941.4832.7736.6657.3587.1河北1841.61968.31778.31613.91458.81332.6山西729.3755.4679.9629.1587.1547.1內(nèi)蒙古676.8606537.3484437.4399.5遼寧2330.82258.42034.91847.61696.11568.7…………………表3中國各地區(qū)社會消費品零售總額資料來源:《中國統(tǒng)計年鑒2004》單位:億元第四節(jié)數(shù)據(jù)整理

(SummarizingData)依據(jù)升序(ascending)或者降序(descending)將全部數(shù)據(jù)排列,這是整理的第一步。排序目的通過閱讀數(shù)據(jù)發(fā)覺一些明顯的特征趨勢或解決問題的線索;有助于數(shù)據(jù)的檢查糾錯;為分組供應(yīng)依據(jù)。一、排序(orderingdata)二、數(shù)據(jù)分組和分布數(shù)列數(shù)據(jù)分組/分類(datagrouping/classification)統(tǒng)計整理的重要手段。數(shù)據(jù)分組就是依據(jù)探討的須要,將總體依據(jù)確定的標記區(qū)分為若干個組成部分的一種統(tǒng)計方法。進行排序分組后,再計算出組頻數(shù)或頻率,列成確定的表式就是分布數(shù)列(distributionseries)。目的將總體中的具有不同性質(zhì)元素進行分類,以對數(shù)據(jù)的內(nèi)部結(jié)構(gòu)進行了解,以便進一步進行統(tǒng)計分析。▼組內(nèi)差異小和組間差異大

確定組數(shù)

確定組距(按組)整理成分布頻數(shù)表

三、分組及頻數(shù)計算基本步驟例6一會計事務(wù)所對其20家客戶(clients)年底帳目輯核(audits)時間(天)統(tǒng)計如下表:Table4Year-EndAuditTimes(indays)1214191815151817202722232221332814181613這里分組主要指組距數(shù)列的分組。

第一步,確定組數(shù)(Numberofclasses)。組數(shù)的確定一般視數(shù)據(jù)本身的特點及數(shù)據(jù)的多少而定。閱歷上以5~20之間為好,尤其留意不要確定太多的組數(shù),使得每組包含的數(shù)據(jù)太少。

其中N為數(shù)據(jù)的個數(shù),一般對結(jié)果取整數(shù)。例9中:K=1+lg20/lg2=1+4.32=5.325實際分組時常按斯特格斯(Sturges)提出的閱歷公式來確定組數(shù)K:其次步,確定組距(Widthofclasses):組距是一個組的上限與下限之差,可依據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定:組距=(最大值-最小值)/組數(shù)例6中,組距=(33-12)/5=4.2,可取整數(shù)5為最終選定的組距。

第三步,確定各組組限(Classlimits)并據(jù)此整理頻數(shù)分布表。

分組所遵循的主要原則是“不重不漏”(eachdatavaluebelongstooneclassandonlyoneclass)。因此,最低組限(Thelowerclasslimit)

數(shù)據(jù)的最小值

最大組限(Theupperclasslimit)

數(shù)據(jù)的最大值▼留意:對離散型數(shù)據(jù),可接受相鄰兩組組限間斷的方法解決“不重”的問題(如6~10,11~15,16~20等);對連續(xù)型數(shù)據(jù),往往接受相鄰兩組組限重疊,依據(jù)“上限不在內(nèi)原則”解決“不重”問題(如[5,10),(10,15),[15,20)等)。例6是離散型數(shù)據(jù)(天),接受組限間斷方法,因此可得頻數(shù)分布表如下:Table5Frequencydistribution,relativefrequencyandpercentfrequencydistributionfortheaudit-timedataAuditFrequencyRelativePercentTime(days)FrequencyFrequency10~1440.202015~1980.404020~2450.252525~2920.101030~3410.055Total201.00100在最大值與最小值與其他數(shù)據(jù)相差懸殊時,為避開空白組出現(xiàn),第一組和最終一組可接受“XX以下”及“XX以上”這樣的開口組;在組距分組時,假如各組組距相等則稱為等距分組,否則為不等距分組。不等距分組各組的頻數(shù)受組距大小不同的影響,因此須要計算頻數(shù)密度(=頻數(shù)/組距),才能精確反映頻數(shù)分布的實際;有時為了統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論