現(xiàn)代心理與教育統(tǒng)計(jì)學(xué)的復(fù)習(xí)重點(diǎn)_第1頁(yè)
現(xiàn)代心理與教育統(tǒng)計(jì)學(xué)的復(fù)習(xí)重點(diǎn)_第2頁(yè)
現(xiàn)代心理與教育統(tǒng)計(jì)學(xué)的復(fù)習(xí)重點(diǎn)_第3頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、一二章、緒論現(xiàn)代統(tǒng)計(jì)學(xué)之父:皮爾遜描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)描述統(tǒng)計(jì)主要研究如何整理、描述數(shù)據(jù)的特征。推斷統(tǒng)計(jì)主要研究如何通過(guò)局部數(shù)據(jù)所提供的信息推論總體特征。變量類型定類變量:如,性別、學(xué)號(hào)、顏色類別、教學(xué)方法 。特征:沒有絕對(duì)零點(diǎn),沒有測(cè)量單位。變量值之間有“相等”和“不等”的關(guān)系, 但沒有大小之分,不能比較大小,更不能進(jìn)行加、減、乘、除四則運(yùn)算。定序變量:程度、等級(jí)和水平。如,比賽名次、品質(zhì)等級(jí)、喜愛程度特征:既無(wú)零點(diǎn)、又無(wú)測(cè)量單位。變量的值之間具有“等于”或“不等于”關(guān)系、 序關(guān)系(優(yōu)于、先于、劣于、后于等),四則運(yùn)算沒有意義。定比變量:除了可以說(shuō)出名稱和排出大小,還能算出差異大小量的變量。如

2、溫度、測(cè)驗(yàn)成績(jī)、智商。特征:有相等的測(cè)量單位,無(wú)絕對(duì)零點(diǎn)。考試成績(jī)?yōu)榱悴槐硎緵]有一點(diǎn)知識(shí)。可 進(jìn)行加減運(yùn)算,乘除運(yùn)算則無(wú)意義。定距變量:如身高、重量、學(xué)生人數(shù)。既有測(cè)量單位,又有絕對(duì)零點(diǎn),可進(jìn)行計(jì) 算。降低偏差:利用隨機(jī)抽樣降低變異性:用大一點(diǎn)的樣本三、描述統(tǒng)計(jì)一、頻數(shù):某一事件在某一類別中出現(xiàn)的次數(shù)。頻數(shù)分布類型:正態(tài),正(負(fù))偏態(tài),正(反) J形,U形分布。分布性質(zhì);集中(分散)程度,偏度和峰度不同。偏態(tài)系數(shù):數(shù)據(jù)的對(duì)稱性峰態(tài)系數(shù):數(shù)據(jù)的峰度二、集中量數(shù):包括算術(shù)平均數(shù)M、中位數(shù)Md、眾數(shù)M。(用眾數(shù)代表一組數(shù)據(jù),可靠性較差,不過(guò),眾數(shù)不受極端數(shù)據(jù)的影響,并且求法簡(jiǎn)便)、加權(quán)平均數(shù)MW、幾

3、何平均數(shù)Mg、調(diào)和平均數(shù)Mh。組數(shù)據(jù)中有少數(shù)數(shù)據(jù)偏大或偏小,數(shù)據(jù)的分布呈偏態(tài)時(shí),應(yīng)用幾何平均數(shù)。算數(shù)平均數(shù)的性質(zhì)(算法必須會(huì)):(1)每一個(gè)變量加減或乘除一個(gè)數(shù)之后,均值也相應(yīng)增加。(2)變量值與均值的離均差之和為零。(3)變量值與均值的離均差平方和為最小值。三、離散量數(shù):全距R、四分位差Q、平均差A(yù).D、方差(樣本統(tǒng)計(jì)量S2,總體參數(shù)2 )、標(biāo)準(zhǔn)差(s或者SD)、百分位差全距:全部數(shù)據(jù)中的最大值與最小值的差,描述了數(shù)據(jù)分布的范圍。四分位差(Q):樣本中間50%的人的全距的一半。是一個(gè)距離,Q越大,表示 樣本中各樣品越不整齊平均差:全部數(shù)據(jù)與均值絕對(duì)離均差的均值。方差:各個(gè)數(shù)據(jù)偏離中心的程度。

4、方差越大,數(shù)據(jù)波動(dòng)越大。 標(biāo)準(zhǔn)差:方差的算術(shù)平方根。自由度:自由度是指當(dāng)以樣本的統(tǒng)計(jì)量來(lái)估計(jì)總體的參數(shù)時(shí),樣本中獨(dú)立或能自由變化的數(shù)據(jù)的個(gè)數(shù)。標(biāo)準(zhǔn)分?jǐn)?shù):以標(biāo)準(zhǔn)差為單位表示一個(gè)原始分?jǐn)?shù)在團(tuán)體中所處的相對(duì)位置,即原始分?jǐn)?shù)在均值以上或以下幾個(gè)標(biāo)準(zhǔn)差的位置。性質(zhì):標(biāo)準(zhǔn)分?jǐn)?shù)的均值為0,標(biāo)準(zhǔn)差為1。沒有實(shí)際單位。 應(yīng)用:(1) 、比較不同性質(zhì)的觀測(cè)值在各自數(shù)據(jù)分布中相對(duì)位置的高低。如身高與體重。(2)計(jì)算不同質(zhì)的觀測(cè)值的總和或者均值,以表示在團(tuán)體中的相對(duì)位置。如高 考的標(biāo)準(zhǔn)分。(3)做線性轉(zhuǎn)換后,表示標(biāo)準(zhǔn)測(cè)驗(yàn)分?jǐn)?shù)。如 IQ。圖表?xiàng)l形圖,用于定性數(shù)據(jù)。 直方圖與多邊圖:用于定量數(shù)據(jù) 時(shí)序圖:反映事物變化趨勢(shì)

5、 餅圖:定性數(shù)據(jù)的多少或構(gòu)成比例 散點(diǎn)圖:兩個(gè)變量的變化關(guān)系和變化方向。 莖葉圖:保留小樣本連續(xù)變量的原貌。 三線表的組成要素包括:表序、表題、項(xiàng)目欄、表體、表注 五、隨機(jī)變量分布正態(tài)分布 X 樣本均值的分布 正態(tài)分布曲線下的面積:曲線高度是頻數(shù)(丫),曲線下面積則是累積頻數(shù)P (也 視作隨機(jī)變量出現(xiàn)的概率)。X軸上的截距為Z。其中,卩決定曲線的位置,C決定曲線的“胖瘦” 無(wú)論各分布的均值與標(biāo)準(zhǔn)差的值是多少,x取值以下特定區(qū)域的概率(面積)是確 定的,即:正負(fù)一個(gè)標(biāo)準(zhǔn)差,占68.27%,兩個(gè)95.45%,三個(gè)99.73%標(biāo)準(zhǔn)正態(tài)分布:均值為0,標(biāo)準(zhǔn)差為1.總體服從正態(tài)分布N (卩,二2 )時(shí),

6、來(lái)自該總體的所有容量為 n的樣本的均值_ 2X也服從山念分仆 X的期望為卩,方差為(T 2/n即 XN(卩n平均數(shù)的標(biāo)準(zhǔn)誤二乂CJ,N標(biāo)準(zhǔn)誤衡量了抽樣誤差(sampling error)的大小。所謂抽樣誤差是指由抽樣引 起的樣本統(tǒng)計(jì)量與總體參數(shù)間的差異。標(biāo)準(zhǔn)誤越小,統(tǒng)計(jì)量與參數(shù)越接近,樣本對(duì)總體越有代表性,用統(tǒng)計(jì)量推斷 參數(shù)的可靠度越大,所以,標(biāo)準(zhǔn)誤是推斷統(tǒng)計(jì)可靠性的重要指標(biāo)??ǚ椒植迹鹤兞肯嗷オ?dú)立,且服從N(0,1)分布的隨機(jī)變量。稱隨機(jī)變量服從自由n度為為n的卡方分布。記做x2二x2(n),x2x2iS卡方分布:樣本方差的分布(樣本方差的分布)T分布:隨機(jī)變量X服從N(0,1),丫服從x2

7、(n),且相互獨(dú)立,則隨機(jī)變量服從自由度為n的t分布,X記做 t t(n).t=Yn來(lái)自一個(gè)正態(tài)總體:t(X -、 (x -x)2 磯(N1),其中,S='' 丿 S.NN -1來(lái)自兩個(gè)正態(tài)總體(X1 - X2)-(7 - 2)t NNN1N2Sp其中,SP =(Ni -1)S2 (N2 -1)S2:t(NN2 -2),2Sp為兩樣本的混合標(biāo)準(zhǔn)差。N1 N2 _2T分布的均值為0,方差為n/(n-2).t統(tǒng)計(jì)量是參數(shù)估計(jì)與假設(shè)檢驗(yàn)的基礎(chǔ) 。特點(diǎn):當(dāng)樣本容量趨于:,t分布為正態(tài)分布,方差為1,隨自由度的減少,離散程度(方差)增大,分布中間變低,尾部變高F分布:FF(Ni -1小2

8、 -1)兩樣本方差的比F統(tǒng)計(jì)量主要用于方差分析、協(xié)方差分析、回歸分析等。六、參數(shù)估計(jì)參數(shù)估計(jì):當(dāng)在研究中從樣本獲得一組數(shù)據(jù)后, 如何通過(guò)這組信息,對(duì)總體特征 進(jìn)行估計(jì),也就是如何從局部結(jié)果推論總體的情況, 稱為總體參數(shù)估計(jì)。總體參 數(shù)估計(jì)問題可以分為點(diǎn)估計(jì)與區(qū)間估計(jì)。點(diǎn)估計(jì):用某一樣本統(tǒng)計(jì)量的值來(lái)估計(jì)相應(yīng)總體參數(shù)的值。優(yōu)良的估計(jì)量具有的性質(zhì):無(wú)偏性、有效性、一致性。區(qū)間估計(jì):按一定概率要求,由樣本統(tǒng)計(jì)量的值估計(jì)總體參數(shù)值的所在范圍 原理:抽樣分布理論。抽樣分布的標(biāo)準(zhǔn)誤的大小決定置信區(qū)間的長(zhǎng)度。置信區(qū)間:指在某一置信度時(shí),總體參數(shù)所在的區(qū)域長(zhǎng)度。置信度:是作出某種推斷時(shí)正確的可能性(概率)。通常

9、用(1-a)表示。顯著性水平:即a,是指估計(jì)總體參數(shù)落在某一區(qū)間時(shí)可能犯錯(cuò)誤的概率。 兩個(gè)要素:可靠性(置信水平的高低)和精確度(區(qū)間長(zhǎng)度)。置信水平為95%的置信區(qū)間的確切含義:重復(fù)抽樣N次,所得到的N個(gè)置信區(qū)間 中有95%個(gè)包含了總體參數(shù)。影響區(qū)間估計(jì)精確度的因素:(1) 置信度(1- a)(反比)(2) 樣本容量(正比)(3) 總體數(shù)據(jù)的變異程度(反比)0.95的置信區(qū)間:X -1.96個(gè)標(biāo)準(zhǔn)誤單總體均值的區(qū)間估計(jì):方差已知,正態(tài)分布;N(0,1)方差未知,t分布兩總體均值差異的區(qū)間估計(jì):T分布。相關(guān)樣本與獨(dú)立樣本都為 T分布 其中,獨(dú)立樣本時(shí)用很長(zhǎng)很長(zhǎng)的那個(gè)公式。學(xué)習(xí)必備歡迎下載總體均

10、值的區(qū)間估計(jì):卡方分布 二 S2 : x2(N -1)七、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)(顯著性檢驗(yàn)):事先對(duì)總體參數(shù)或分布形式作出某種假設(shè),然后利用 樣本信息來(lái)判斷原假設(shè)是否成立。類型:參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)(包括分布檢驗(yàn)和獨(dú)立性檢驗(yàn))。假設(shè)檢驗(yàn)的原理:(1)邏輯上為反證法(假設(shè)檢驗(yàn)首先假定虛無(wú)假設(shè)H。為真,通過(guò)否定H。,來(lái)檢驗(yàn)備擇假設(shè)出的真實(shí)性)(2)統(tǒng)計(jì)上為小概率事件(小概率事件在一次實(shí)驗(yàn)或觀測(cè)中,幾乎是不可能發(fā)生 的。在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)。小概率由 研究者事先確定,如 0.05, 0.01, 0.001等)。假設(shè)檢驗(yàn)的步驟:(1)提出原假設(shè)和備擇假設(shè)(2)確定適當(dāng)?shù)臋z

11、驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)統(tǒng)計(jì)量(方差已知)的基本形式為:z(3)規(guī)定顯著性水平(0.05或0.01)(4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值(5)作出統(tǒng)計(jì)決策拒絕域:拒絕原假設(shè)的概率。兩類錯(cuò)誤:拒真錯(cuò)誤:型錯(cuò)誤;取偽錯(cuò)誤1型錯(cuò)誤。統(tǒng)計(jì)效力(統(tǒng)計(jì)檢驗(yàn)力)1- 1 兩類錯(cuò)誤的關(guān)系:(1)不一定等于1.(2)其他條件不變,兩者不能同時(shí)增大或者減小。(3)兩者地位不一樣。我們應(yīng)盡量避免第一類錯(cuò)誤。(4)影響錯(cuò)誤的因素有總體標(biāo)準(zhǔn)差(正比)和樣本容量(反比) 單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn) 單側(cè)檢驗(yàn):強(qiáng)調(diào)方向性。 雙側(cè)檢驗(yàn):只強(qiáng)調(diào)差異,不強(qiáng)調(diào)方向性。單總體均值的假設(shè)檢驗(yàn):X _ LL方差已知,正態(tài)分布;Z=壯N(0,1)。用這個(gè)統(tǒng)計(jì)公式,然后

12、查表。方差未知,t分布。其中,s- (N:)” N兩總體均值差異的顯著性檢驗(yàn):(1)相關(guān)樣本,使用t分布統(tǒng)計(jì)量(2)獨(dú)立樣本,方差已知,使用正態(tài)分布統(tǒng)計(jì)量;(X! -X2)-(丄1 - ' '2 )2 2:N1N2(3)獨(dú)立樣本,方差未知,但是齊性,使用t分布統(tǒng)計(jì)量(Xi X2)-(片一込)|NiN2 spV N N2:t(Ni N2 -2),其中,(Ni1)S2 (2-1)& q汕譏_2總體分布的假設(shè)檢驗(yàn)(屬于非參數(shù)檢驗(yàn)):卡方檢驗(yàn)設(shè)有N個(gè)被試,按變量X的取值可以分成k類,第i類有Oi個(gè)觀測(cè)值,則檢驗(yàn)統(tǒng)計(jì)量為:? (Oi -Ei)2yEi2:x (K -1)八、方差分

13、析方差分析的邏輯:把觀察值的總變異分解為兩個(gè)或多個(gè)部分, 除隨機(jī)誤差外,其 余各部分變異可由某個(gè)或某幾個(gè)因素或它們的交互作用來(lái)解釋。 F分布的統(tǒng)計(jì)推 斷可闡明某一或某些因素或因素間交互作用是否對(duì)觀察值有影響。單因素方差分析的邏輯與步驟:(1)模型與假設(shè)(2)平方和的分解與F檢驗(yàn)(3)關(guān)聯(lián)強(qiáng)度與效應(yīng)值(4)多重比較(5)前提假設(shè)方差分析的前提條件:總體服從正態(tài)分布;變異可加性;方差齊性;獨(dú)立性。單因素完全隨機(jī)設(shè)計(jì)的方差分析:關(guān)聯(lián)強(qiáng)度與效應(yīng)值:實(shí)驗(yàn)處理引致的效應(yīng)的大小或者數(shù)據(jù)的變異有多少部分是由實(shí)驗(yàn)處理造成的 關(guān)聯(lián)強(qiáng)度:因變量的變異被自變量解釋的百分比。事后比較:F檢驗(yàn)顯著說(shuō)明各組均值并不相同(至

14、少兩組不同),但不能回答到底 哪幾組不同。通過(guò)對(duì)各組均值之間的配對(duì)比較來(lái)進(jìn)一步檢驗(yàn)到底哪些均值之間存 在差異。事后比較的方法:(1) 費(fèi)舍最小顯著差異法:對(duì)檢驗(yàn)兩總體均值是否相等的t檢驗(yàn)方法的總體方 差估計(jì)加以修正(用MSE代替)。(2)S-N-K,q檢驗(yàn):把各組均值排序,用每一比較的兩個(gè)均值在排序序列種相 差的等級(jí)數(shù)來(lái)確定不同的q臨界值。(3)HSD檢驗(yàn):與SNK法類似,不同之處在于不論各組均值的大小次序,均 使用同一臨界值。(4)Bonferroni校正(以t分布作為檢驗(yàn)分布,對(duì)檢驗(yàn)水準(zhǔn)進(jìn)行調(diào)整),不適用于比 較的次數(shù)很多的情況。方差分析結(jié)果的解釋與報(bào)告 單因素方差分析結(jié)果(范例):方差分

15、析的結(jié)果(見表2)顯示,教學(xué)方法對(duì)閱讀理解的成績(jī)有顯著影響,F(xiàn)(2, 15)=4.44, MSE=34.94, p=0.031<0.05, Etap2=0.37。進(jìn)一步的多重比較顯示, 當(dāng)使用教學(xué)方法2時(shí),被試的成績(jī)顯著高于使用方法1( p=0.015)或方法3時(shí)(p=0.030);但是,方法1和方法3之間則無(wú)顯著差異(p=0.737)。雙因素結(jié)果方差分析(范例):標(biāo)題提示與閱讀速度對(duì)成績(jī)的影響方差分析的結(jié)果顯示,標(biāo)題提示對(duì)成績(jī)有顯著影響,F(xiàn)(2,66)=3.856,2MSE=2.475,p=0.026<0.05,Eta p =0.105。事后比較結(jié)果顯示,當(dāng)標(biāo)題提示為正 確與中性

16、時(shí),成績(jī)顯著高于標(biāo)題提示為誤導(dǎo)時(shí)的成績(jī)(p<0.05),但前兩者無(wú)顯方差分析還顯示,閱讀速度對(duì)成績(jī)有顯著影響,F(xiàn)(1,66)=21.573, MSE=2.475, p=0.000<0.01,Eta p2 =0.246,閱讀速度為常速時(shí)的成績(jī)比快速時(shí)更高。更重要的是,交互作用顯著,F(xiàn)(2,66)=3.575, MSE=2.475, p=0.034<0.05,Eta p2 =0.098,也就是說(shuō),標(biāo)題提示對(duì)成績(jī)的影響會(huì)隨著閱讀速度的不同而不同。 簡(jiǎn)單主效應(yīng)檢驗(yàn)顯示,閱讀速度為快速時(shí),標(biāo)題提示為正確時(shí)的成績(jī)顯著高于標(biāo) 題提示為中性(p=0.031)和誤導(dǎo)時(shí)(p=0.001)的成績(jī),

17、但后兩者無(wú)顯著差異(p=0.247);而當(dāng)閱讀速度為常速時(shí),標(biāo)題提示對(duì)成績(jī)無(wú)顯著影響F(1,66)=1.560,2MSE=2.475, p=0.218, Eta p =0.045。兩因素完全隨機(jī)設(shè)計(jì)的方差分析:適用情形:有2個(gè)自變量,自變量A有p個(gè)水平,自變量B有q個(gè)水平,共有 p*q種處理。比單因素多了一個(gè)交互作用的離均差平方和。交互作用:交互作用顯著以后,還要做進(jìn)一步的簡(jiǎn)單主效應(yīng)的檢驗(yàn)。多重比較:小結(jié):F檢驗(yàn):主效應(yīng)與交互作用是否顯著。 多重比較:對(duì)顯著的主效應(yīng)進(jìn)行多重比較。簡(jiǎn)單主效應(yīng)檢驗(yàn):檢驗(yàn)因素 A(B)在B(A)各個(gè)水平上的簡(jiǎn)單主效應(yīng),若顯著,繼 續(xù)就簡(jiǎn)單主效應(yīng)進(jìn)行多重比較。九、相關(guān)

18、相關(guān)量數(shù)相關(guān)系數(shù):兩列變量間相關(guān)程度的數(shù)字表現(xiàn)形式作為樣本的統(tǒng)計(jì)量用r表示,作為總體參數(shù)一般用p表示。 正相關(guān):兩列變量變動(dòng)方向相同負(fù)相關(guān):兩列變量中有一列變量變動(dòng)時(shí),另一列變量呈現(xiàn)出與前一列變量方向相 反的變動(dòng)零相關(guān):兩列變量之間沒有關(guān)系,各自按照自己的規(guī)律或無(wú)規(guī)律變化1 .積差相關(guān)也就是Pearson相關(guān)。(1)前提 數(shù)據(jù)要成對(duì)出現(xiàn),即若干個(gè)體中每個(gè)個(gè)體都有兩種不同的觀測(cè)值,并且每隊(duì)數(shù)據(jù)與其它對(duì)子相互獨(dú)立 兩列變量各自總體的分布都是正態(tài)的,至少接近正態(tài) 兩個(gè)相關(guān)的變量是連續(xù)變量,也即兩列數(shù)據(jù)都是測(cè)量數(shù)據(jù) 兩列變量之間的關(guān)系應(yīng)是直線性的2. 等級(jí)相關(guān)也就是Spearman相關(guān)(1) 適用范圍

19、 當(dāng)研究考察的變量為順序型數(shù)據(jù)時(shí), 若原始數(shù)據(jù)為等比貨等距,則先轉(zhuǎn)化為順 序型數(shù)據(jù) 當(dāng)研究考察的變量為非線性數(shù)據(jù)時(shí)(2) 公式將原始數(shù)據(jù)轉(zhuǎn)化為順序型數(shù)據(jù),仍然用 Pears on相關(guān)公式計(jì)算即可。3. 肯德爾等級(jí)相關(guān)(1) 肯德爾W系數(shù)也叫肯德爾和諧系數(shù),原始數(shù)據(jù)資料的獲得一般采用等級(jí)評(píng)定法, 即讓K個(gè)被試 對(duì)N件實(shí)物進(jìn)行等級(jí)評(píng)定。其原理是評(píng)價(jià)者評(píng)價(jià)的一致性除以最大變異可能性。(2) 肯德爾U系數(shù)#其與肯德爾W系數(shù)所處理的問題相同,但評(píng)價(jià)者采用對(duì)偶比較法,即將N件事物 兩兩配對(duì)分別進(jìn)行比較4. 點(diǎn)二列相關(guān)與二列相關(guān)(1)點(diǎn)二列相關(guān) 適用于一列數(shù)據(jù)為等距正態(tài)變量,另一列為離散型二分變量。是與二分

20、稱名變量的一個(gè)值對(duì)應(yīng)的連續(xù)變量的平均數(shù) 是與二分稱名變量的另一個(gè)值對(duì)應(yīng)的連續(xù)變量的平均數(shù) p與q是二分稱名變量?jī)蓚€(gè)值各自所占的比率 st是連續(xù)變量的標(biāo)準(zhǔn)差(2)二列相關(guān)適用于兩列變量都是正態(tài)等距變量,但其中一列變量被人為地分成兩類 y為標(biāo)準(zhǔn)正態(tài)曲線中p值對(duì)應(yīng)的高度,查正態(tài)分布表能得到相關(guān)系數(shù):度量?jī)蓚€(gè)變量相關(guān)程度大小的數(shù)字特征 變量類型與該用的相關(guān)方法:兩個(gè)定序變量斯皮爾曼等級(jí)相關(guān)兩定類變量卡方獨(dú)立性檢驗(yàn)一定類,一個(gè)定序卡方獨(dú)立性檢驗(yàn)定類(序),定距點(diǎn)二列相關(guān),單因素方差分析兩定距皮爾遜相關(guān)(積差相關(guān)) 各種統(tǒng)計(jì)方法的適用條件:T檢驗(yàn):(1)總體正態(tài)分布(2)方差齊性(3)變量相互獨(dú)立方差分析

21、:(1)正態(tài)(2)方差齊性(3)獨(dú)立性(4)變異可加性積差相關(guān):(1)兩個(gè)變量都是連續(xù)的(2)正態(tài)分布(3)變量之間為線性關(guān)系 回歸:(1)正態(tài)(2)線性關(guān)系(3)獨(dú)立性(4)誤差等分散 積差相關(guān)的計(jì)算協(xié)方差:協(xié)方差是兩個(gè)變量離均差乘積的均值。兩個(gè)變量離均差的成績(jī)能夠反映 兩個(gè)變量的一致性。協(xié)方差是兩個(gè)變量線性關(guān)系的指示器, 但不能直接用它來(lái)表 示相關(guān)的大小,因?yàn)橛胁煌臏y(cè)量單位,故將其標(biāo)準(zhǔn)化。rxy方差是協(xié)方差的特例。cov(X X)(Y -Y)SxSyN * Sx Sy相關(guān)系數(shù)值的大小不表示相關(guān)是否顯著。 相關(guān)的程度與r值不成正比 卡方檢驗(yàn):x2八(f e)f為實(shí)際頻數(shù),e為理論頻數(shù),e理

22、論頻數(shù)二所占比率*人數(shù)點(diǎn)二列相關(guān):一個(gè)連續(xù)變量與另一個(gè)二分稱名變量的相關(guān)程度。(男女,高低)二列相關(guān):兩列數(shù)據(jù)均為正態(tài)分布(男女兩個(gè)類別);十、回歸回歸:指由一個(gè)變量的變化去預(yù)測(cè)另一個(gè)變量的變化, 描述一個(gè)變量隨另一變量 做不同程度變化的單向關(guān)系。回歸分析的目的就是要找出一個(gè)錯(cuò)誤最小的方法來(lái)用 X預(yù)測(cè)丫?;貧w分析的步驟:(1)建立并求解回歸模型的方程(2)檢驗(yàn)與評(píng)價(jià)回歸方程的有效性 針對(duì)整個(gè)回歸方程針對(duì)各個(gè)回歸系數(shù)(3)利用回歸方程作出預(yù)測(cè)與控制建立回歸方程:Y=a+bXb為回歸系數(shù),丫為實(shí)際的丫的預(yù)測(cè)值a -bX、(Xi X)(Y 丫)2、(Xi -X)回歸系數(shù)與相關(guān)系數(shù):xy = . bxybyx檢驗(yàn)與評(píng)價(jià):是一個(gè)估計(jì)總體參數(shù)的置信區(qū)間和假設(shè)檢驗(yàn)的問題估計(jì)誤差標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤):SyxJ (Y-Y)2N 2回歸方程的顯著性檢驗(yàn):回歸方程參數(shù)的置信區(qū)間與檢驗(yàn):t檢驗(yàn) 回歸系數(shù)的b的檢驗(yàn):(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論