統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度_第1頁
統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度_第2頁
統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度_第3頁
統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度將數(shù)據(jù)劃分為三類:定距型數(shù)據(jù)(Scale)、定序型數(shù)據(jù)(Ordinal)、定類型數(shù)據(jù)(Nominal)。定距型數(shù)據(jù)通常是指諸如身高、體重、血壓等的連續(xù)型數(shù)據(jù),也包括諸如人數(shù)、商品件數(shù)等離散型數(shù)據(jù);定序型數(shù)據(jù)具有內(nèi)在固有大小或高低順序,但它又不同于定距型數(shù)據(jù),一般可以數(shù)值或字符表示。如職稱變量可以有低級(jí)、中級(jí)、高級(jí)三個(gè)取值,可以分別用1、2、3等表示,年齡段變量可以有老、中、青三個(gè)取值,分別用ABC表示等。這里,無論是數(shù)值型的1、2、3還是字符型的ABC,都是有大小或高低順序的,但數(shù)據(jù)之間卻是不等距的。因?yàn)?,低?jí)和中級(jí)職稱之間的差距與中級(jí)和高級(jí)職稱之間的差距是不相等的;定

2、類型數(shù)據(jù)是指沒有內(nèi)在固有大小或高低順序,一般以數(shù)值或字符表示的分類數(shù)據(jù)。如性別變量中的男、女取值,可以分別用1、2表示,民族變量中的各個(gè)民族,可以用漢回滿等字符表示等。這里,無論是數(shù)值型的1、2還是字符型的漢回滿都不存在內(nèi)部固有的大小或高低順序,而只是一種名義上的指代。我覺得教育年限應(yīng)該設(shè)置成定距型數(shù)據(jù)(Scale)吧。因?yàn)?,教育年限?yīng)該是一個(gè)連續(xù)的變量,它不存在內(nèi)在的大小或高低順序問題。將可變的數(shù)量標(biāo)志抽象化就稱其為變量,其取值稱為變量值或標(biāo)志值。變量分為確定性變量和隨機(jī)變量。確定性變量是指受必然性因素的作用,各變量值呈現(xiàn)出上升或下降惟一方向性變動(dòng)的變量;隨機(jī)變量是指受偶然性因素的作用,變量

3、值呈現(xiàn)出隨機(jī)的混沌狀態(tài)變動(dòng)的變量。根據(jù)變量的取值是否連續(xù)劃分,有連續(xù)型變量和離散型變量。連續(xù)型變量是指在一個(gè)取值區(qū)間內(nèi)可取無窮多個(gè)值。連續(xù)型變量值要用測(cè)量或計(jì)算的方法取得;離散型變量是指在一個(gè)取值區(qū)間內(nèi)變量?jī)H可取有限個(gè)可列值。離散型變量值只能用計(jì)數(shù)的方法取得。離散變量是指其數(shù)值只能用自然數(shù)或整數(shù)單位計(jì)算的則為離散變量例如,企業(yè)個(gè)數(shù),職工人數(shù),設(shè)備臺(tái)數(shù)等,只能按計(jì)量單位數(shù)計(jì)數(shù),這種變量的數(shù)值一般用計(jì)數(shù)方法取得反之,在一定區(qū)間內(nèi)可以任意取值的變量叫連續(xù)變量,其數(shù)值是連續(xù)不斷的,相鄰兩個(gè)數(shù)值可作無限分割,即可取無限個(gè)數(shù)值例如住產(chǎn)零件的規(guī)格尺寸,人體測(cè)量的身高,體重胸圍等為連續(xù)變量,其數(shù)值只能用測(cè)量或

4、計(jì)量的方法取得如果變量可以在某個(gè)區(qū)間內(nèi)取任一實(shí)數(shù),即變量的取值可以是連續(xù)的,這隨機(jī)變量就稱為連續(xù)型隨機(jī)變量,1)無偏性。無偏性是指估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。設(shè)總體參數(shù)為0,所選擇的估計(jì)量為B?如果E(0?)=稱,B?為0的無偏估計(jì)量。(2)有效性。一個(gè)無偏的估計(jì)量并不意味著它就非常接近被估計(jì)的參數(shù),它還必須與總體參數(shù)的離散程度比較小。假定有兩個(gè)用于估計(jì)總體參數(shù)的無偏估計(jì)量,分別用m1和m2表示,它們的抽樣分布的方差分別用D(m1)和D(m2)表示,如果m1的方差小于m2的方差,即D(m1)3時(shí),曲線轉(zhuǎn)為偏態(tài)。卡方分布特性:卡方分布的自由度為獨(dú)立的正態(tài)離差的個(gè)數(shù),此處v=n,

5、其分布圖形為一組具不同自由度v值的曲線。X2值最小為0,最大為+x,因而在坐標(biāo)軸的右面。自由度小時(shí)呈偏態(tài),隨著自由度增加,偏度降低,至+x時(shí),呈對(duì)稱分布。t分布特性:t分布特性:t分布曲線是對(duì)稱的,圍繞其平均數(shù)卩=0向兩側(cè)遞降。自由度較小的t分布比之自由度較大的t分布具有較大的變異度。它和正態(tài)曲線比較,t分布曲線稍為扁平,峰頂略低,尾部稍高。t分布是一組隨自由度v而改變的曲線,但當(dāng)v30時(shí)接近正態(tài)曲線,當(dāng)v=x時(shí)和正態(tài)曲線合一,由于分布受自由度制約,所以t值與其相應(yīng)的概率也隨自由度而不同。二、評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)1.無偏性(unbiased)由于估計(jì)量是樣本的函數(shù),是隨機(jī)變量,它對(duì)于不同樣本觀測(cè)值會(huì)得到不同的估計(jì)值。我們自然希望這些估計(jì)值的平均值與參數(shù)的真值相等,也就是一個(gè)好的估計(jì)量的期望等于未知參數(shù)的真實(shí)值,具有這種性質(zhì)的估計(jì)量,稱為無偏估計(jì)量(unbiasedestimate).即當(dāng)估計(jì)值彳的期望E(予-v時(shí),稱彳為v的無偏估計(jì)量。有效性(effectiveness)有時(shí)未知參數(shù)的無偏估計(jì)量不是唯一的,那么如何比較其好壞呢?自然是估計(jì)量?與參數(shù)二的偏差越小越好,因?yàn)镋(彳)-v,也就是鄉(xiāng)的方差越小越好。我們把方差最小的那個(gè)估計(jì)量稱為有效估計(jì)量(efficient

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論