心統(tǒng)第一次小測(cè)復(fù)習(xí)提綱描述統(tǒng)計(jì)部分_第1頁(yè)
心統(tǒng)第一次小測(cè)復(fù)習(xí)提綱描述統(tǒng)計(jì)部分_第2頁(yè)
心統(tǒng)第一次小測(cè)復(fù)習(xí)提綱描述統(tǒng)計(jì)部分_第3頁(yè)
心統(tǒng)第一次小測(cè)復(fù)習(xí)提綱描述統(tǒng)計(jì)部分_第4頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、心統(tǒng)第一次小測(cè)復(fù)習(xí)提綱- 描述統(tǒng)計(jì)部分第一章統(tǒng)計(jì)和度量的基本概念- 以后重點(diǎn)掌握統(tǒng)計(jì)的邏輯與統(tǒng)計(jì)方法適用條件統(tǒng)計(jì):?指組織,總結(jié)和解釋信息的一整套方法和規(guī)則。描述統(tǒng)計(jì) :總結(jié),組織,和使數(shù)據(jù)簡(jiǎn)單化的統(tǒng)計(jì)程序。推論統(tǒng)計(jì) :使我們能夠通過(guò)對(duì)樣本的研究將其結(jié)果推廣于總體。多元統(tǒng)計(jì)統(tǒng)計(jì)的功能:?統(tǒng)計(jì)方法使研究者能夠描述和分析所得到的觀察結(jié)果?統(tǒng)計(jì)方法通過(guò)組織和解釋數(shù)據(jù),幫助人們確定所得到的信息,準(zhǔn)確而有效的呈現(xiàn)或解釋觀察所得。科學(xué)方法:?我們產(chǎn)生一個(gè)可驗(yàn)證的假設(shè)?我們客觀地驗(yàn)證這個(gè)假設(shè)設(shè)計(jì)實(shí)驗(yàn) .隨機(jī)取樣 .收集數(shù)據(jù) .分析數(shù)據(jù) ,看是否支持了假設(shè).自變量 : IV是原因,在真實(shí)驗(yàn)中,自變量是研究者所

2、操縱的。因變量 : DV 測(cè)量自變量效果的變量,需要是可觀察的和可測(cè)量的。IV DV的確定:排除任何恒定的東西.IV和 DV 是 變量 -在某一尺度上變化的一系列分?jǐn)?shù).在開始我們會(huì)遇到有一個(gè)實(shí)驗(yàn)組和一個(gè)控制組的研究找到這兩個(gè)組.這就是量了原因 .IV并且度DV通常有 多個(gè) 值.我們預(yù)期實(shí)驗(yàn)組的分?jǐn)?shù)不同于控制組.統(tǒng)計(jì)學(xué)要解決的實(shí)際問(wèn)題?如何收集資料才能最有效的反映所研究的課題;?采用什么方法整理和分析所得數(shù)據(jù)才能最大限度最客觀地呈現(xiàn)這些數(shù)據(jù)所反映的信息;?怎樣才能把抽取的樣本中所獲得的結(jié)果推廣到總體中,作出一般規(guī)律性的科學(xué)結(jié)論總體:你想要研究的所有個(gè)體的總和。取樣隨機(jī)取樣隨機(jī)樣本樣本:研究所關(guān)注

3、的被試子群體。數(shù)據(jù):樣本中一個(gè)個(gè)體觀測(cè)結(jié)果的分?jǐn)?shù)。變量:全部被試在某一指標(biāo)上的所有數(shù)據(jù)點(diǎn)。參數(shù)和統(tǒng)計(jì)量?參數(shù)( parameter) - 描述總體的數(shù)值。參數(shù)可以從一次測(cè)量中獲得,或者從總體的一系列測(cè)量中推論得到。?統(tǒng)計(jì)量( statistic )描述樣本的數(shù)值。統(tǒng)計(jì)量可以從一次測(cè)量中獲得,或者從樣本的一系列測(cè)量中推論得到。?取樣誤差( Sampling error )樣本統(tǒng)計(jì)量與相應(yīng)的總體參數(shù)之間的差距。假設(shè)構(gòu)念和操作性定義?假設(shè)( hypothesis) 對(duì)實(shí)驗(yàn)結(jié)果的預(yù)測(cè)。在實(shí)驗(yàn)研究中, 假設(shè)就是對(duì)操縱自變量會(huì)如何影響因變量的預(yù)測(cè)。?構(gòu)念( Constructs) 指假設(shè)的概念,用于理論中

4、,按其內(nèi)部機(jī)制來(lái)組織觀察。比如智力、人格、動(dòng)機(jī)等等?操作定義( operational definition ) 用具體的操作或程序以及由此產(chǎn)生的測(cè)量指標(biāo)來(lái)定義構(gòu)念。因此 , 一個(gè)操作定義包含兩個(gè)成分: 1)它描述了度量一個(gè)構(gòu)念的一系列操作或程序; 2)它用度量的結(jié)果來(lái)定義構(gòu)念。 如:可以將智力定義為韋氏成人智力量表的得分研究方法相關(guān)法:( correlational method )看兩個(gè)變量是否有某種特定關(guān)系。是 觀察 研究( observational method ),即觀察在自然情境中存在的兩個(gè)變量只能夠提供兩個(gè)變量之間相關(guān)程度的研究,卻不能提供因果關(guān)系的證據(jù)實(shí)驗(yàn)法:( experi

5、mental method ) 操縱一個(gè)變量,觀測(cè)另外一個(gè)變量的變化。用以建立兩個(gè)變量間的因果關(guān)系。用 隨機(jī)分組和控制其他變量恒定的方法,試圖消除其他因素的影響或使之減為最小準(zhǔn)實(shí)驗(yàn)法( quasi-experimental method )考察 已有的各組被試間的差別(如性別差異)或在不同時(shí)間所采集數(shù)據(jù)的差異前和處理后 ).分組變量稱準(zhǔn)自變量, 每個(gè)被試的分?jǐn)?shù)稱因變量混淆變量:未能控制的變量,與自變量有非預(yù)期的系統(tǒng)性關(guān)系。(如 ,處理變量的性質(zhì):離散型連續(xù)型 (精確界限的問(wèn)題)數(shù)據(jù)的測(cè)度等級(jí):?命名等級(jí)( nominal scale ) 由一系列具不同名稱的范疇所組成。命名量表的度量將觀察所得

6、標(biāo)定并分類 , 但不會(huì)對(duì)觀察所得作任何數(shù)量化的區(qū)分(無(wú)大小之分)。?順序等級(jí)( ordinal scale)由一系列按順序排列的范疇所組成。順序量表的度量將觀察所得按其大小或數(shù)量排定秩次 ( rank)。?等距等級(jí)( interval scale)由一系列按順序排列的范疇所組成,且每?jī)蓚€(gè)鄰近范疇之間的距離都是相等的。在等距量表中,加減運(yùn)算反映數(shù)目的大小差距 . 但是,乘除運(yùn)算沒(méi)有任何意義。?比例等級(jí)( ratio scale) 是具有 絕對(duì)零點(diǎn) 的等距量表 . 在比例量表中,乘除運(yùn)算反映數(shù)量間的比例關(guān)系。數(shù)據(jù)的測(cè)度等級(jí)與統(tǒng)計(jì)分析:?各種測(cè)量類型的局限性直接關(guān)系到統(tǒng)計(jì)分析方法的選擇- 描述統(tǒng)計(jì)

7、推論統(tǒng)計(jì)選用統(tǒng)計(jì)方法的步驟:分析實(shí)驗(yàn)設(shè)計(jì),判斷數(shù)據(jù)類型,分析數(shù)據(jù)分布特征。常用符號(hào):N = 群體大小(參數(shù))n = 樣本容量(統(tǒng)計(jì)量) -X , -s幾個(gè)問(wèn)題:概念解釋: 總體 樣本 個(gè)體隨機(jī)變量(數(shù)據(jù)的變異性隨機(jī)性 - 隨機(jī)誤差 規(guī)律性 - 樣本推論總體)觀測(cè)值 參數(shù) 統(tǒng)計(jì)量第二章次數(shù)分布描述統(tǒng)計(jì)的目標(biāo):使一組數(shù)據(jù)數(shù)據(jù)易于理解,生動(dòng)直觀,簡(jiǎn)單明確采用圖和表 - 初步整理次數(shù)分布 -最簡(jiǎn)單的描述統(tǒng)計(jì):?描述統(tǒng)計(jì)的目的:簡(jiǎn)化和整理數(shù)據(jù)的表達(dá)。?次數(shù)分布( Frequency Distribution ):是指一批數(shù)據(jù)在某一量度的每一個(gè)類目所出現(xiàn)的次數(shù)情況?次數(shù)分布表和次數(shù)分布圖就是表達(dá)一組數(shù)據(jù)是

8、如何在某一度量上分布 的簡(jiǎn)單次數(shù)分布表?次數(shù)分布表是將位于量數(shù)的每一個(gè)類目的個(gè)體的個(gè)數(shù)組織成表格的形式1.-變量的值 ? -填充 x 列 從大到小,每個(gè)可能的值2.-每個(gè)值出現(xiàn)多少次(發(fā)生次數(shù))-填充 f 列3.-觀察的總數(shù)?將次數(shù)行求和, 將得到 S f = N4.-變量的總值?最簡(jiǎn)單的方法就是求(X) 和 (f)的乘積列,然后將結(jié)果求和S(Xf )每個(gè)分?jǐn)?shù)的比率和百分率?Proportion=p=f/n分組次數(shù)分布表- 以本質(zhì)特性為基礎(chǔ),包含所有數(shù)據(jù),標(biāo)識(shí)明確(性質(zhì)類別,數(shù)量類別)?當(dāng)變量的值分布在一個(gè)較廣的范圍時(shí),需要分組次數(shù)分布表簡(jiǎn)捷地描述數(shù)據(jù)?常常以區(qū)間或類別的形式出現(xiàn) , 而不是某

9、一特定值 . ?編制分組次數(shù)分布表的步驟1.把所有數(shù)據(jù)按大小順序排列2.求全距3.定組數(shù)4.定組距5.寫出區(qū)間上下限6.統(tǒng)計(jì)每個(gè)區(qū)間的次數(shù)分組的“慣常法則” ( rules of thumbs )? 1. 分組次數(shù)分布表應(yīng)該有大約10( 5-15 )個(gè)區(qū)間,目的是使這組數(shù)據(jù)易于直觀感受和理解? 2. 所有區(qū)間的寬度應(yīng)該相等? 3. 組距應(yīng)該是個(gè)比較簡(jiǎn)單的數(shù)字,如2, 5,10, 20? 4. 每個(gè)區(qū)間開始的分?jǐn)?shù)應(yīng)該是組距的倍數(shù)精確界限( Real Limits )?對(duì)于一個(gè) 連續(xù)型 變量,每個(gè)分?jǐn)?shù)實(shí)際對(duì)應(yīng)量尺上的一段區(qū)間。分割這些區(qū)間的界限叫做精確界限( real limits ) . 分割兩

10、個(gè)鄰近分?jǐn)?shù)的精確界限位于兩個(gè)分?jǐn)?shù)的中間。?每個(gè)分?jǐn)?shù)有兩個(gè)精確界限 , 一個(gè)在區(qū)間的頂端,稱為精確上限(在區(qū)間的底端,稱為精確下限( lower real limit ) . ?注意一個(gè)區(qū)間的精確上限也是高一個(gè)區(qū)間的精確下限upper real limit ) ,另一個(gè)次數(shù)分布圖:直方圖(histogram )?用一些垂直條畫在每個(gè)分?jǐn)?shù)之上?垂直條的高度代表次數(shù)?垂直條的 寬度代表分?jǐn)?shù)的精確區(qū)間.?臨近的垂直條連接在一起?只有 數(shù)據(jù)是等距或等比量度(連續(xù)變量)X 軸與 Y 軸 的交叉點(diǎn)應(yīng)該是0時(shí),才能用直方圖棒圖(條形圖;bar graph)?表達(dá)質(zhì)性研究的數(shù)據(jù)(qualitative data

11、).?用一些垂直條畫在每個(gè)分?jǐn)?shù)(或類別 )之上?垂直條的高度代表次數(shù)?每個(gè) 垂直條之間有一段空間?只有 數(shù)據(jù)是命名或順序量度。(離散型變量)時(shí),才能用棒圖折線圖( line graph )又稱次數(shù)分布多邊圖(frequency distribution polygon)?在每一分?jǐn)?shù)上面畫點(diǎn)?點(diǎn)的高度代表次數(shù)?一條連續(xù)折線將這些點(diǎn)連接在一起?表達(dá)數(shù)據(jù)的變化趨勢(shì)無(wú)所謂數(shù)據(jù)類型莖和葉圖: 將數(shù)組中的數(shù)按位數(shù)進(jìn)行比較, 將數(shù)的大小基本不變或變化不大的位作為一個(gè)主干(莖),將變化大的位的數(shù)作為分枝(葉) ,列在主干的后面,這樣就可以清楚地看到每個(gè)主干后面的幾個(gè)數(shù),每個(gè)數(shù)具體是多少。與直方圖類似,但保留了

12、原始數(shù)據(jù)。如何準(zhǔn)確地用圖表達(dá)數(shù)據(jù)?把復(fù)雜的觀點(diǎn)傳遞得清晰,準(zhǔn)確 ,高效 .?在最短的時(shí)間里用最少的筆墨和空間傳遞最多的信息.?圖形的實(shí)際差別與數(shù)據(jù)的差別成正比.?標(biāo)注清楚 ,詳細(xì) ,完全 . 測(cè)度單位要一致.次數(shù)分布的形狀:用3 個(gè)特征可以完整地描述一個(gè)分布:?形狀( shape)?集中趨勢(shì)( central tendency)?變異性(variability)對(duì)稱分布(未必單峰)雙峰分布矩形分布偏態(tài)分布: 即統(tǒng)計(jì)數(shù)據(jù)峰值與平均值不相等的頻率分布,分?jǐn)?shù)堆積在分布的一端,成為比較尖細(xì)的尾端(tail )。樣本增大時(shí),趨向于正態(tài)分布。?偏態(tài)分布尾端向右的稱為正偏態(tài)(positively skewe

13、d) (因?yàn)槠湮捕酥赶蛘龜?shù))?偏態(tài)分布尾端向左的稱為負(fù)偏態(tài)(negatively skewed ).百分位數(shù)( percentile)而另一端?我們也可用次數(shù)分布來(lái)描述某一個(gè)別點(diǎn)在一個(gè)集合中的位置?原始分?jǐn)?shù)本身并不提供該點(diǎn)在一個(gè)集合中的位置的信息?一個(gè)分?jǐn)?shù)的等級(jí)(rank) 或百分位數(shù)等級(jí)(percentile rank ): 某一分布中分?jǐn)?shù)在某一值之下或等于該值的個(gè)體所占的百分比. 當(dāng)一個(gè)分?jǐn)?shù)被其百分位數(shù)等級(jí), 該分?jǐn)?shù)稱為百分位數(shù)( percentile ) .相對(duì)次數(shù)分布累計(jì)次數(shù)分布?cf = 累積次數(shù)( cumulative frequency )?c% = cf/N*100%累積百分比

14、( cumulative percentage )?對(duì)于連續(xù)型數(shù)據(jù), 必須考慮其精確上限和精確下限,百分位數(shù)對(duì)應(yīng)區(qū)間精確上限。插值法 ( Interpolation )?有時(shí)你所感興趣的值并未出現(xiàn)在表內(nèi)。此時(shí)你需要做基于經(jīng)驗(yàn)的猜測(cè).?插值法的假設(shè)是在所求解點(diǎn)的附近1 個(gè)組距單位區(qū)間之內(nèi)的分?jǐn)?shù)和對(duì)應(yīng)的百分比的變化是線性的(統(tǒng)計(jì)圖表的誤差:歸組效應(yīng),忽略了樣本本來(lái)的分布。組距越大,誤差越大)。?關(guān)鍵在于要找到距求解點(diǎn)最近的兩個(gè)區(qū)間,對(duì)于較遠(yuǎn)的區(qū)間,則不滿足分?jǐn)?shù)和對(duì)應(yīng)的百分比線性變化的假設(shè)。第三章集中趨勢(shì)和離散性- 如何計(jì)算、選取,各有什么性質(zhì)數(shù)據(jù)特性集中趨勢(shì)變異性形狀均值標(biāo)準(zhǔn)差中位數(shù)四分位距偏度眾

15、數(shù)全距集中趨勢(shì)指的是分布的中間位置的情況,離散性指的是分布有多分散。均值( Mean),亦稱算術(shù)平均數(shù)(arithmetic average )總體的均值公式: m = S X/ N樣本的均值公式: x = S X /n平衡原則:分布重心。優(yōu)點(diǎn)與適用范圍,需注意的問(wèn)題:反應(yīng)靈敏(用到了每一個(gè)數(shù)據(jù),但受極端數(shù)據(jù)影響,有模糊不清數(shù)據(jù)時(shí)無(wú)法計(jì)算),準(zhǔn)確可靠(較少受樣本變動(dòng)影響)。 同質(zhì)性原則(指使用統(tǒng)一觀測(cè)手段,觀測(cè)標(biāo)準(zhǔn)反映某一問(wèn)題統(tǒng)一特質(zhì)的數(shù)據(jù)) ,與標(biāo)準(zhǔn)差配合使用(個(gè)體差異大 /小,均值代表性小 /大),可以進(jìn)一步進(jìn)行代數(shù)運(yùn)算。中位數(shù):中數(shù)( median) 是將分?jǐn)?shù)分布均分為兩部分的那個(gè)分?jǐn)?shù).

16、 分布有 50% 的個(gè)體等于或小于中數(shù) . 中數(shù)等價(jià)于百分位數(shù)(percentile )是 50 的數(shù)。中數(shù)將分布分為兩個(gè)大小相等的組。可能是原有數(shù)據(jù)中的數(shù),也可能不是。求中數(shù)的三種情況1) 如果分?jǐn)?shù)的個(gè)數(shù)是奇數(shù)個(gè) , 將其按從小到大的順序排列 . 中間的數(shù)目就是中數(shù)2) 如果分?jǐn)?shù)的個(gè)數(shù)是偶數(shù)個(gè) , 將其按從小到大的順序排列 . 然后找出中間的兩個(gè)分?jǐn)?shù)。 將其相加后再除以 23)當(dāng)分布的 中間分?jǐn)?shù)有相等分?jǐn)?shù) 時(shí),用中間分?jǐn)?shù)的精確上下限作插值法極端分?jǐn)?shù)或模糊數(shù)據(jù)不影響中數(shù)。 概念簡(jiǎn)單,不靈敏,不如平均數(shù)穩(wěn)定。3. 眾數(shù) ( mode)在次數(shù)分布中 , 眾數(shù)是具有最多次數(shù)的那個(gè)分?jǐn)?shù)或類目。注意:一

17、個(gè)次數(shù)分布可能有多個(gè)眾數(shù).是類目變量(命名)可以選用的唯一集中量數(shù)不穩(wěn)定,反應(yīng)不靈敏,可能不是好的集中量數(shù)。選擇適宜的集中量數(shù):命名型變量順序型變量等距或以上變量眾數(shù)中數(shù)均值 (分布正態(tài))中數(shù) (分布偏態(tài))集中量數(shù)的優(yōu)缺點(diǎn):優(yōu)點(diǎn)眾數(shù)計(jì)算快捷對(duì)于命名型數(shù)據(jù)特別有用中數(shù)不易受極端分?jǐn)?shù)影響適用于有不確定數(shù)值的數(shù)據(jù)均值樣本穩(wěn)定性好(較小受抽樣變動(dòng)影響)與方差有關(guān)缺點(diǎn)樣本穩(wěn)定性差在一定程度上樣本穩(wěn)定性差對(duì)離散性數(shù)據(jù)不適用易受極端數(shù)據(jù)影響分布形狀與集中趨勢(shì)量數(shù)的關(guān)系:正偏態(tài):眾數(shù)中數(shù)均值負(fù)偏態(tài):均值中數(shù)眾數(shù)差異量數(shù)( Variability )分布的第三個(gè)特征- 變異性( Variability ) .變

18、異數(shù)是對(duì)于分布的延伸和聚合狀態(tài)程度的定量化描述變異數(shù)越高,表明分?jǐn)?shù)間的差別大, 變異數(shù)越小,表明分?jǐn)?shù)間越近似.三種差異量數(shù):全距 ( range), 標(biāo)準(zhǔn)差 ( standard deviation ), 和四分位距( interquartile range )全距( range)全距是分布分?jǐn)?shù)最大值(maximum)X 的精確上限與分布分?jǐn)?shù)最小值限的差值。用全距描述分?jǐn)?shù)變異性的局限:該統(tǒng)計(jì)量只依據(jù)分布中的兩個(gè)極端值,分信息 - 不敏感,不穩(wěn)定,適用于初步檢查,如分組的確定。(minimum)X 的精確下未利用到分布的大部注意: 如果分?jǐn)?shù)是連續(xù)型,必須用精確上下限。四分位距 (interqua

19、rtile range )用 50%, 25%和 75%的百分位數(shù) ,分布被分成 4 部分。 IQR=2*SIQR四分位距就是 75% 百分位數(shù)與 25%百分位數(shù)間的距離 . 它代表分布中間對(duì)于連續(xù)性變量,使用插入法確定百分位數(shù)為 25、 75 的自變量取值。穩(wěn)定性,敏感性較差,無(wú)法進(jìn)行代數(shù)運(yùn)算,常與中數(shù)配合使用。50%的距離.標(biāo)準(zhǔn)差(standard deviation)量度了分布中的每一個(gè)個(gè)體與某一標(biāo)準(zhǔn)偏移的距離, 這個(gè)標(biāo)準(zhǔn)就是均值最重要 , 最常用的差異量數(shù)考慮了分布中的所有信息- 靈敏,穩(wěn)定,可進(jìn)行代數(shù)運(yùn)算,但受極端數(shù)據(jù)影響較大。標(biāo)準(zhǔn)差計(jì)算的邏輯步驟:1) x-m= 離差分?jǐn)?shù),和方SS

20、=離差平方求和(滿足最小平方原理),SS= (X-m)2 ,具體計(jì)算時(shí)SS = SX2 - (SX)2/n,可以直接利用x 的值。2)方差:定義公式總體s2=SS/N樣本s2=SS/( n-1)考慮樣本常常比其所屬的總體較少變異性,標(biāo)準(zhǔn)差 s=sqrt(s2)標(biāo)準(zhǔn)差的計(jì)算需做校正.如果樣本統(tǒng)計(jì)量高估或低估了總體參數(shù),它就稱為有偏估計(jì)如果用樣本統(tǒng)計(jì)量作總體方差,就低估了總體方差,是有偏估計(jì)粗略估計(jì)均值和標(biāo)準(zhǔn)差: 拇指原則: 對(duì)于對(duì)稱分布,均值常常在分布的中點(diǎn),標(biāo)準(zhǔn)差常常在全距的 1/4 左右。標(biāo)準(zhǔn)差的意義:34% 48% 50%可代數(shù)運(yùn)算標(biāo)準(zhǔn)差的性質(zhì)1) 對(duì)分布中的每一個(gè)分?jǐn)?shù)加上一個(gè)常數(shù)不會(huì)改變

21、其標(biāo)準(zhǔn)差.2) 對(duì)分布中的每一個(gè)分?jǐn)?shù)乘上一個(gè)常數(shù),所得分布的標(biāo)準(zhǔn)差是原分布的標(biāo)準(zhǔn)差乘上這個(gè)常數(shù).總標(biāo)準(zhǔn)差的合成,分組數(shù)據(jù)使用每組中點(diǎn)數(shù)據(jù)進(jìn)行計(jì)算。應(yīng)用:差異系數(shù),標(biāo)準(zhǔn)分轉(zhuǎn)化。差異系數(shù): CV=s/m描述有絕對(duì)零的等距數(shù)據(jù)的離散程度,相對(duì)差異量,無(wú)統(tǒng)計(jì)意義。比較三種離中量數(shù)極端分?jǐn)?shù) : 全距( range) 受影響最大 , IQR 受影響最小樣本大小 : 全距( range) 可能隨 n 的增加而增加, IQR & s不會(huì)樣本選?。簭耐豢傮w中多次取不同樣本,全距(range) 沒(méi)有穩(wěn)定的值 , 但穩(wěn)定的,不應(yīng)波動(dòng)很大對(duì)于有不確定值的分布, 全距 或 S 都無(wú)法求得 , IQR ( 或

22、SIQR) 是唯一的選擇對(duì)于偏態(tài)分布,IQR 比 s 常用差異量數(shù)的優(yōu)缺點(diǎn):IQR和 S 是優(yōu)點(diǎn)缺點(diǎn)全距計(jì)算快捷樣本穩(wěn)定性差受極端數(shù)值影響(不可靠)四分位差標(biāo)準(zhǔn)差不易受極端數(shù)值影響適用于有不確定數(shù)值的數(shù)據(jù)樣本穩(wěn)定性好包含最多信息(反應(yīng)靈敏)可能與樣本量有關(guān)(不靈敏)在一定程度上樣本穩(wěn)定性差(未考慮全部數(shù)據(jù))不敏感受極端數(shù)值影響(偏態(tài)分布中使用四分位距)考慮使用差異量數(shù)時(shí),需同時(shí)考慮對(duì)應(yīng)的集中趨勢(shì)量數(shù)Tips避免錯(cuò)誤:計(jì)算前應(yīng)先對(duì)均值和標(biāo)準(zhǔn)差作個(gè)粗略的估計(jì)計(jì)算 SS 應(yīng)作表不要根據(jù)次數(shù)分布表計(jì)算SS總體和樣本的標(biāo)準(zhǔn)差公式不同,因此應(yīng)先確定數(shù)據(jù)是來(lái)自總體或樣本在 SS 的計(jì)算公式中,無(wú)論總體或樣本

23、都是n 而不是n-1。心統(tǒng)第二次小測(cè),四五章復(fù)習(xí)提綱- 推論統(tǒng)計(jì)初步第四章Z 分?jǐn)?shù)概率正態(tài)分布二項(xiàng)分布Z 分?jǐn)?shù): z= ( X- ) / 原始分?jǐn)?shù)與 Z 分?jǐn)?shù)的相互轉(zhuǎn)化( , 未必代表正態(tài)分布,只是分布的均值與標(biāo)準(zhǔn)差而已)Z分?jǐn)?shù)可以解釋原始分?jǐn)?shù)的含義,也可以將整個(gè)分布標(biāo)準(zhǔn)化。-可比,可加(同質(zhì)性),明確,穩(wěn)定。標(biāo)準(zhǔn)分布:原始分布按照上式轉(zhuǎn)換為Z 分?jǐn)?shù)分布,即為標(biāo)準(zhǔn)分布。特征: Z 分?jǐn)?shù)分布與原始分布的形狀完全相同,分?jǐn)?shù)所在相對(duì)位置(相對(duì)位置量數(shù)- 明確性)亦完全相同(便于分?jǐn)?shù)間相對(duì)比較- 可比性,穩(wěn)定性) 。標(biāo)準(zhǔn)分布均值為0,標(biāo)準(zhǔn)差為1。若原始分布為正態(tài)分布,標(biāo)準(zhǔn)分布為一標(biāo)準(zhǔn)正態(tài)分布。概率:推

24、論統(tǒng)計(jì)的基本概念。推論統(tǒng)計(jì)與后驗(yàn)概率。概率:表明隨機(jī)事件出現(xiàn)的可能性大小的客觀指標(biāo)隨機(jī)取樣應(yīng)滿足以下兩個(gè)條件:1. 總體中的每個(gè)個(gè)體有同樣的機(jī)會(huì)被選擇(隨機(jī)因素決定,排除主觀隨意性,主觀能動(dòng)性)2. 如果樣本中要選擇多于一個(gè)的個(gè)體 ,每次選擇的概率應(yīng)當(dāng)恒定回置取樣概率的性質(zhì):非負(fù),必然事件為1,不可能事件為0, 0、 1 之間。互不相容事件可加,獨(dú)立事件可乘。分類:連續(xù)離散正態(tài)分布(一族分布)- 對(duì)稱性,單峰性,漸進(jìn)性。正態(tài)曲線: 曲線函數(shù) ,鐘形,呈對(duì)稱分布,單峰,其均值、中數(shù)、眾數(shù)對(duì)應(yīng)于同一個(gè)數(shù)值,正態(tài)分布中各差異量數(shù)比例固定。大部分的原始分?jǐn)?shù)都集中分布在均值附近, 極端值相對(duì)而言是比較少

25、的。曲線兩端向靠近橫軸處不斷延伸,但始終不會(huì)與橫軸相交。是密度曲線 (并非次數(shù)曲線 ),曲線下方的面積總和必定為1。確定分?jǐn)?shù)對(duì)應(yīng)的的百分位數(shù):轉(zhuǎn)化為 Z 分?jǐn)?shù),查表,可能會(huì)用到插值法。確定百分位等級(jí)對(duì)應(yīng)的百分位點(diǎn):查表得對(duì)應(yīng)的Z 分?jǐn)?shù),可能用到插值法,轉(zhuǎn)化為原始分?jǐn)?shù)。四分位距:Q3 對(duì)應(yīng)的Z 分?jǐn)?shù)為0.67。固定比率:Z=0.259.87%Z=0.6725%Z=134.13%Z=247.72%Z=349.87%95%的分?jǐn)?shù)會(huì)落入-1.96 與 1.96 標(biāo)準(zhǔn)差之間 . 95% 的分?jǐn)?shù)會(huì)落入1.65 標(biāo)準(zhǔn)差以左 . 99% 的分?jǐn)?shù)會(huì)落入 -2.58 與 2.58 標(biāo)準(zhǔn)差之間 .99%的分?jǐn)?shù)會(huì)落入

26、2.33 標(biāo)準(zhǔn)差以左 .99.9%的分?jǐn)?shù)會(huì)落入-3.30 與3.30 標(biāo)準(zhǔn)差之間。應(yīng)用:化等級(jí)評(píng)定為測(cè)量數(shù)據(jù),測(cè)驗(yàn)分?jǐn)?shù)正態(tài)化(已知分?jǐn)?shù)分布應(yīng)該為正態(tài):原始分?jǐn)?shù)組中點(diǎn)百分等級(jí) -Z 分?jǐn)?shù)非線性轉(zhuǎn)換) ,等級(jí)評(píng)定時(shí)確定人數(shù)(六西格瑪) 。-各二項(xiàng)分布:一次試驗(yàn)只可能有兩種結(jié)果,實(shí)驗(yàn)次數(shù)事先設(shè)定,一次實(shí)驗(yàn)間獨(dú)立同分布。性質(zhì):階躍式概率直方圖,p=q 時(shí),對(duì)稱;否則,偏態(tài)(n 大,偏態(tài)趨于正態(tài))B(n, p)n 足夠大時(shí) (pn > 10 和 qn > 10) ,趨于正態(tài)分布。均值與標(biāo)準(zhǔn)差: =np =sqrt (npq) -每次抽取,方差為pq,那么n 次抽取方差為 npq,獨(dú)立變量Va

27、r( X1+X2 ) =Var (X1 )+V ar( X2 )原始分?jǐn)?shù)由此標(biāo)準(zhǔn)化利用正態(tài)分布表求二項(xiàng)分布的概率(解決機(jī)遇問(wèn)題):正態(tài)分布中X的值是一段 , 而并非一點(diǎn) , 所以當(dāng)二項(xiàng)分布近似為正態(tài)分布時(shí),需要考慮精確上下限。 因?yàn)槲覀兪窃谟眠B續(xù)型分布 (正態(tài) ) 來(lái)估計(jì)離散型分布的值.第五章樣本均值分布假設(shè)檢驗(yàn)初步隨機(jī)樣本:抽到的概率5%-95%樣本均值分布(distribution of sample mean):總體中可抽取的所有可能的特定容量 (n) 的隨機(jī)樣本 的均值的集合。(明確均值的含義!投擲骰子實(shí)驗(yàn),樣本均值=總點(diǎn)數(shù) / 投擲次數(shù),摸球?qū)嶒?yàn),設(shè)黑球?yàn)?,白球?yàn)?,樣本均值 =總

28、分 /摸取次數(shù)) - 不同于樣本分布抽樣分布(samplingdistribution): 總體中可抽取的所有可能的特定容量分布的統(tǒng)計(jì)量所形成的統(tǒng)計(jì)分布。可用于推論總體。樣本均值分布是抽樣分布的特例目的:能通過(guò)樣本均值對(duì)總體均值做出最佳估計(jì)。骰子實(shí)驗(yàn): n=1 時(shí) 接近矩形分布n=2、 5、 10 極端值變少,趨于正態(tài)分布樣本均值分布的特性:形狀:樣本均值的分布形狀接近正態(tài)分布(n 較小且原始分布不為正態(tài)時(shí),則不是正態(tài)分布). 原始分布即為正態(tài)分布時(shí);或者當(dāng) n 較大時(shí) (30 以上 ), 樣本均值的分布幾乎是完全的正態(tài)分布 . 而不在乎原始分布的形狀。均值:樣本均值的期望等于總體的均值(總體的均值 -總體中獨(dú)立同分布隨機(jī)變量的均值)。變異性:樣本均值分布的標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)誤。X 的標(biāo)準(zhǔn)誤 = X = X 與 的標(biāo)準(zhǔn)距離 . 這個(gè)統(tǒng)計(jì)量的主要目的和用途是告訴我們樣本均值對(duì)總體均值的估計(jì)是否準(zhǔn)確 . 換言之 ,取樣誤差是多大 .(衡量樣本均值變分布異性,標(biāo)準(zhǔn)差是衡量次數(shù)分布的變異性)總體方

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論