


版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、一二章、緒論現(xiàn)代統(tǒng)計學之父:皮爾遜描述統(tǒng)計與推斷統(tǒng)計描述統(tǒng)計主要研究如何整理、描述數(shù)據(jù)的特征。推斷統(tǒng)計主要研究如何通過局部數(shù)據(jù)所提供的信息推論總體特征。變量類型定類變量:如,性別、學號、顏色類別、教學方法 。特征:沒有絕對零點,沒有測量單位。變量值之間有“相等”和“不等”的關系, 但沒有大小之分,不能比較大小,更不能進行加、減、乘、除四則運算。定序變量:程度、等級和水平。如,比賽名次、品質(zhì)等級、喜愛程度特征:既無零點、又無測量單位。變量的值之間具有“等于”或“不等于”關系、 序關系(優(yōu)于、先于、劣于、后于等),四則運算沒有意義。定比變量:除了可以說出名稱和排出大小,還能算出差異大小量的變量。如
2、溫度、測驗成績、智商。特征:有相等的測量單位,無絕對零點??荚嚦煽?yōu)榱悴槐硎緵]有一點知識???進行加減運算,乘除運算則無意義。定距變量:如身高、重量、學生人數(shù)。既有測量單位,又有絕對零點,可進行計 算。降低偏差:利用隨機抽樣降低變異性:用大一點的樣本三、描述統(tǒng)計一、頻數(shù):某一事件在某一類別中出現(xiàn)的次數(shù)。頻數(shù)分布類型:正態(tài),正(負)偏態(tài),正(反) J形,U形分布。分布性質(zhì);集中(分散)程度,偏度和峰度不同。偏態(tài)系數(shù):數(shù)據(jù)的對稱性峰態(tài)系數(shù):數(shù)據(jù)的峰度二、集中量數(shù):包括算術平均數(shù)M、中位數(shù)Md、眾數(shù)M。(用眾數(shù)代表一組數(shù)據(jù),可靠性較差,不過,眾數(shù)不受極端數(shù)據(jù)的影響,并且求法簡便)、加權平均數(shù)MW、幾
3、何平均數(shù)Mg、調(diào)和平均數(shù)Mh。組數(shù)據(jù)中有少數(shù)數(shù)據(jù)偏大或偏小,數(shù)據(jù)的分布呈偏態(tài)時,應用幾何平均數(shù)。算數(shù)平均數(shù)的性質(zhì)(算法必須會):(1)每一個變量加減或乘除一個數(shù)之后,均值也相應增加。(2)變量值與均值的離均差之和為零。(3)變量值與均值的離均差平方和為最小值。三、離散量數(shù):全距R、四分位差Q、平均差A.D、方差(樣本統(tǒng)計量S2,總體參數(shù)2 )、標準差(s或者SD)、百分位差全距:全部數(shù)據(jù)中的最大值與最小值的差,描述了數(shù)據(jù)分布的范圍。四分位差(Q):樣本中間50%的人的全距的一半。是一個距離,Q越大,表示 樣本中各樣品越不整齊平均差:全部數(shù)據(jù)與均值絕對離均差的均值。方差:各個數(shù)據(jù)偏離中心的程度。
4、方差越大,數(shù)據(jù)波動越大。 標準差:方差的算術平方根。自由度:自由度是指當以樣本的統(tǒng)計量來估計總體的參數(shù)時,樣本中獨立或能自由變化的數(shù)據(jù)的個數(shù)。標準分數(shù):以標準差為單位表示一個原始分數(shù)在團體中所處的相對位置,即原始分數(shù)在均值以上或以下幾個標準差的位置。性質(zhì):標準分數(shù)的均值為0,標準差為1。沒有實際單位。 應用:(1) 、比較不同性質(zhì)的觀測值在各自數(shù)據(jù)分布中相對位置的高低。如身高與體重。(2)計算不同質(zhì)的觀測值的總和或者均值,以表示在團體中的相對位置。如高 考的標準分。(3)做線性轉(zhuǎn)換后,表示標準測驗分數(shù)。如 IQ。圖表條形圖,用于定性數(shù)據(jù)。 直方圖與多邊圖:用于定量數(shù)據(jù) 時序圖:反映事物變化趨勢
5、 餅圖:定性數(shù)據(jù)的多少或構成比例 散點圖:兩個變量的變化關系和變化方向。 莖葉圖:保留小樣本連續(xù)變量的原貌。 三線表的組成要素包括:表序、表題、項目欄、表體、表注 五、隨機變量分布正態(tài)分布 X 樣本均值的分布 正態(tài)分布曲線下的面積:曲線高度是頻數(shù)(丫),曲線下面積則是累積頻數(shù)P (也 視作隨機變量出現(xiàn)的概率)。X軸上的截距為Z。其中,卩決定曲線的位置,C決定曲線的“胖瘦” 無論各分布的均值與標準差的值是多少,x取值以下特定區(qū)域的概率(面積)是確 定的,即:正負一個標準差,占68.27%,兩個95.45%,三個99.73%標準正態(tài)分布:均值為0,標準差為1.總體服從正態(tài)分布N (卩,二2 )時,
6、來自該總體的所有容量為 n的樣本的均值_ 2X也服從山念分仆 X的期望為卩,方差為(T 2/n即 XN(卩n平均數(shù)的標準誤二乂CJ,N標準誤衡量了抽樣誤差(sampling error)的大小。所謂抽樣誤差是指由抽樣引 起的樣本統(tǒng)計量與總體參數(shù)間的差異。標準誤越小,統(tǒng)計量與參數(shù)越接近,樣本對總體越有代表性,用統(tǒng)計量推斷 參數(shù)的可靠度越大,所以,標準誤是推斷統(tǒng)計可靠性的重要指標??ǚ椒植迹鹤兞肯嗷オ毩?,且服從N(0,1)分布的隨機變量。稱隨機變量服從自由n度為為n的卡方分布。記做x2二x2(n),x2x2iS卡方分布:樣本方差的分布(樣本方差的分布)T分布:隨機變量X服從N(0,1),丫服從x2
7、(n),且相互獨立,則隨機變量服從自由度為n的t分布,X記做 t t(n).t=Yn來自一個正態(tài)總體:t(X -、 (x -x)2 磯(N1),其中,S='' 丿 S.NN -1來自兩個正態(tài)總體(X1 - X2)-(7 - 2)t NNN1N2Sp其中,SP =(Ni -1)S2 (N2 -1)S2:t(NN2 -2),2Sp為兩樣本的混合標準差。N1 N2 _2T分布的均值為0,方差為n/(n-2).t統(tǒng)計量是參數(shù)估計與假設檢驗的基礎 。特點:當樣本容量趨于:,t分布為正態(tài)分布,方差為1,隨自由度的減少,離散程度(方差)增大,分布中間變低,尾部變高F分布:FF(Ni -1小2
8、 -1)兩樣本方差的比F統(tǒng)計量主要用于方差分析、協(xié)方差分析、回歸分析等。六、參數(shù)估計參數(shù)估計:當在研究中從樣本獲得一組數(shù)據(jù)后, 如何通過這組信息,對總體特征 進行估計,也就是如何從局部結果推論總體的情況, 稱為總體參數(shù)估計??傮w參 數(shù)估計問題可以分為點估計與區(qū)間估計。點估計:用某一樣本統(tǒng)計量的值來估計相應總體參數(shù)的值。優(yōu)良的估計量具有的性質(zhì):無偏性、有效性、一致性。區(qū)間估計:按一定概率要求,由樣本統(tǒng)計量的值估計總體參數(shù)值的所在范圍 原理:抽樣分布理論。抽樣分布的標準誤的大小決定置信區(qū)間的長度。置信區(qū)間:指在某一置信度時,總體參數(shù)所在的區(qū)域長度。置信度:是作出某種推斷時正確的可能性(概率)。通常
9、用(1-a)表示。顯著性水平:即a,是指估計總體參數(shù)落在某一區(qū)間時可能犯錯誤的概率。 兩個要素:可靠性(置信水平的高低)和精確度(區(qū)間長度)。置信水平為95%的置信區(qū)間的確切含義:重復抽樣N次,所得到的N個置信區(qū)間 中有95%個包含了總體參數(shù)。影響區(qū)間估計精確度的因素:(1) 置信度(1- a)(反比)(2) 樣本容量(正比)(3) 總體數(shù)據(jù)的變異程度(反比)0.95的置信區(qū)間:X -1.96個標準誤單總體均值的區(qū)間估計:方差已知,正態(tài)分布;N(0,1)方差未知,t分布兩總體均值差異的區(qū)間估計:T分布。相關樣本與獨立樣本都為 T分布 其中,獨立樣本時用很長很長的那個公式。學習必備歡迎下載總體均
10、值的區(qū)間估計:卡方分布 二 S2 : x2(N -1)七、假設檢驗假設檢驗(顯著性檢驗):事先對總體參數(shù)或分布形式作出某種假設,然后利用 樣本信息來判斷原假設是否成立。類型:參數(shù)檢驗和非參數(shù)檢驗(包括分布檢驗和獨立性檢驗)。假設檢驗的原理:(1)邏輯上為反證法(假設檢驗首先假定虛無假設H。為真,通過否定H。,來檢驗備擇假設出的真實性)(2)統(tǒng)計上為小概率事件(小概率事件在一次實驗或觀測中,幾乎是不可能發(fā)生 的。在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設。小概率由 研究者事先確定,如 0.05, 0.01, 0.001等)。假設檢驗的步驟:(1)提出原假設和備擇假設(2)確定適當?shù)臋z
11、驗統(tǒng)計量,檢驗統(tǒng)計量(方差已知)的基本形式為:z(3)規(guī)定顯著性水平(0.05或0.01)(4)計算檢驗統(tǒng)計量的值(5)作出統(tǒng)計決策拒絕域:拒絕原假設的概率。兩類錯誤:拒真錯誤:型錯誤;取偽錯誤1型錯誤。統(tǒng)計效力(統(tǒng)計檢驗力)1- 1 兩類錯誤的關系:(1)不一定等于1.(2)其他條件不變,兩者不能同時增大或者減小。(3)兩者地位不一樣。我們應盡量避免第一類錯誤。(4)影響錯誤的因素有總體標準差(正比)和樣本容量(反比) 單側(cè)檢驗與雙側(cè)檢驗 單側(cè)檢驗:強調(diào)方向性。 雙側(cè)檢驗:只強調(diào)差異,不強調(diào)方向性。單總體均值的假設檢驗:X _ LL方差已知,正態(tài)分布;Z=壯N(0,1)。用這個統(tǒng)計公式,然后
12、查表。方差未知,t分布。其中,s- (N:)” N兩總體均值差異的顯著性檢驗:(1)相關樣本,使用t分布統(tǒng)計量(2)獨立樣本,方差已知,使用正態(tài)分布統(tǒng)計量;(X! -X2)-(丄1 - ' '2 )2 2:N1N2(3)獨立樣本,方差未知,但是齊性,使用t分布統(tǒng)計量(Xi X2)-(片一込)|NiN2 spV N N2:t(Ni N2 -2),其中,(Ni1)S2 (2-1)& q汕譏_2總體分布的假設檢驗(屬于非參數(shù)檢驗):卡方檢驗設有N個被試,按變量X的取值可以分成k類,第i類有Oi個觀測值,則檢驗統(tǒng)計量為:? (Oi -Ei)2yEi2:x (K -1)八、方差分
13、析方差分析的邏輯:把觀察值的總變異分解為兩個或多個部分, 除隨機誤差外,其 余各部分變異可由某個或某幾個因素或它們的交互作用來解釋。 F分布的統(tǒng)計推 斷可闡明某一或某些因素或因素間交互作用是否對觀察值有影響。單因素方差分析的邏輯與步驟:(1)模型與假設(2)平方和的分解與F檢驗(3)關聯(lián)強度與效應值(4)多重比較(5)前提假設方差分析的前提條件:總體服從正態(tài)分布;變異可加性;方差齊性;獨立性。單因素完全隨機設計的方差分析:關聯(lián)強度與效應值:實驗處理引致的效應的大小或者數(shù)據(jù)的變異有多少部分是由實驗處理造成的 關聯(lián)強度:因變量的變異被自變量解釋的百分比。事后比較:F檢驗顯著說明各組均值并不相同(至
14、少兩組不同),但不能回答到底 哪幾組不同。通過對各組均值之間的配對比較來進一步檢驗到底哪些均值之間存 在差異。事后比較的方法:(1) 費舍最小顯著差異法:對檢驗兩總體均值是否相等的t檢驗方法的總體方 差估計加以修正(用MSE代替)。(2)S-N-K,q檢驗:把各組均值排序,用每一比較的兩個均值在排序序列種相 差的等級數(shù)來確定不同的q臨界值。(3)HSD檢驗:與SNK法類似,不同之處在于不論各組均值的大小次序,均 使用同一臨界值。(4)Bonferroni校正(以t分布作為檢驗分布,對檢驗水準進行調(diào)整),不適用于比 較的次數(shù)很多的情況。方差分析結果的解釋與報告 單因素方差分析結果(范例):方差分
15、析的結果(見表2)顯示,教學方法對閱讀理解的成績有顯著影響,F(xiàn)(2, 15)=4.44, MSE=34.94, p=0.031<0.05, Etap2=0.37。進一步的多重比較顯示, 當使用教學方法2時,被試的成績顯著高于使用方法1( p=0.015)或方法3時(p=0.030);但是,方法1和方法3之間則無顯著差異(p=0.737)。雙因素結果方差分析(范例):標題提示與閱讀速度對成績的影響方差分析的結果顯示,標題提示對成績有顯著影響,F(xiàn)(2,66)=3.856,2MSE=2.475,p=0.026<0.05,Eta p =0.105。事后比較結果顯示,當標題提示為正 確與中性
16、時,成績顯著高于標題提示為誤導時的成績(p<0.05),但前兩者無顯方差分析還顯示,閱讀速度對成績有顯著影響,F(xiàn)(1,66)=21.573, MSE=2.475, p=0.000<0.01,Eta p2 =0.246,閱讀速度為常速時的成績比快速時更高。更重要的是,交互作用顯著,F(xiàn)(2,66)=3.575, MSE=2.475, p=0.034<0.05,Eta p2 =0.098,也就是說,標題提示對成績的影響會隨著閱讀速度的不同而不同。 簡單主效應檢驗顯示,閱讀速度為快速時,標題提示為正確時的成績顯著高于標 題提示為中性(p=0.031)和誤導時(p=0.001)的成績,
17、但后兩者無顯著差異(p=0.247);而當閱讀速度為常速時,標題提示對成績無顯著影響F(1,66)=1.560,2MSE=2.475, p=0.218, Eta p =0.045。兩因素完全隨機設計的方差分析:適用情形:有2個自變量,自變量A有p個水平,自變量B有q個水平,共有 p*q種處理。比單因素多了一個交互作用的離均差平方和。交互作用:交互作用顯著以后,還要做進一步的簡單主效應的檢驗。多重比較:小結:F檢驗:主效應與交互作用是否顯著。 多重比較:對顯著的主效應進行多重比較。簡單主效應檢驗:檢驗因素 A(B)在B(A)各個水平上的簡單主效應,若顯著,繼 續(xù)就簡單主效應進行多重比較。九、相關
18、相關量數(shù)相關系數(shù):兩列變量間相關程度的數(shù)字表現(xiàn)形式作為樣本的統(tǒng)計量用r表示,作為總體參數(shù)一般用p表示。 正相關:兩列變量變動方向相同負相關:兩列變量中有一列變量變動時,另一列變量呈現(xiàn)出與前一列變量方向相 反的變動零相關:兩列變量之間沒有關系,各自按照自己的規(guī)律或無規(guī)律變化1 .積差相關也就是Pearson相關。(1)前提 數(shù)據(jù)要成對出現(xiàn),即若干個體中每個個體都有兩種不同的觀測值,并且每隊數(shù)據(jù)與其它對子相互獨立 兩列變量各自總體的分布都是正態(tài)的,至少接近正態(tài) 兩個相關的變量是連續(xù)變量,也即兩列數(shù)據(jù)都是測量數(shù)據(jù) 兩列變量之間的關系應是直線性的2. 等級相關也就是Spearman相關(1) 適用范圍
19、 當研究考察的變量為順序型數(shù)據(jù)時, 若原始數(shù)據(jù)為等比貨等距,則先轉(zhuǎn)化為順 序型數(shù)據(jù) 當研究考察的變量為非線性數(shù)據(jù)時(2) 公式將原始數(shù)據(jù)轉(zhuǎn)化為順序型數(shù)據(jù),仍然用 Pears on相關公式計算即可。3. 肯德爾等級相關(1) 肯德爾W系數(shù)也叫肯德爾和諧系數(shù),原始數(shù)據(jù)資料的獲得一般采用等級評定法, 即讓K個被試 對N件實物進行等級評定。其原理是評價者評價的一致性除以最大變異可能性。(2) 肯德爾U系數(shù)#其與肯德爾W系數(shù)所處理的問題相同,但評價者采用對偶比較法,即將N件事物 兩兩配對分別進行比較4. 點二列相關與二列相關(1)點二列相關 適用于一列數(shù)據(jù)為等距正態(tài)變量,另一列為離散型二分變量。是與二分
20、稱名變量的一個值對應的連續(xù)變量的平均數(shù) 是與二分稱名變量的另一個值對應的連續(xù)變量的平均數(shù) p與q是二分稱名變量兩個值各自所占的比率 st是連續(xù)變量的標準差(2)二列相關適用于兩列變量都是正態(tài)等距變量,但其中一列變量被人為地分成兩類 y為標準正態(tài)曲線中p值對應的高度,查正態(tài)分布表能得到相關系數(shù):度量兩個變量相關程度大小的數(shù)字特征 變量類型與該用的相關方法:兩個定序變量斯皮爾曼等級相關兩定類變量卡方獨立性檢驗一定類,一個定序卡方獨立性檢驗定類(序),定距點二列相關,單因素方差分析兩定距皮爾遜相關(積差相關) 各種統(tǒng)計方法的適用條件:T檢驗:(1)總體正態(tài)分布(2)方差齊性(3)變量相互獨立方差分析
21、:(1)正態(tài)(2)方差齊性(3)獨立性(4)變異可加性積差相關:(1)兩個變量都是連續(xù)的(2)正態(tài)分布(3)變量之間為線性關系 回歸:(1)正態(tài)(2)線性關系(3)獨立性(4)誤差等分散 積差相關的計算協(xié)方差:協(xié)方差是兩個變量離均差乘積的均值。兩個變量離均差的成績能夠反映 兩個變量的一致性。協(xié)方差是兩個變量線性關系的指示器, 但不能直接用它來表 示相關的大小,因為有不同的測量單位,故將其標準化。rxy方差是協(xié)方差的特例。cov(X X)(Y -Y)SxSyN * Sx Sy相關系數(shù)值的大小不表示相關是否顯著。 相關的程度與r值不成正比 卡方檢驗:x2八(f e)f為實際頻數(shù),e為理論頻數(shù),e理
22、論頻數(shù)二所占比率*人數(shù)點二列相關:一個連續(xù)變量與另一個二分稱名變量的相關程度。(男女,高低)二列相關:兩列數(shù)據(jù)均為正態(tài)分布(男女兩個類別);十、回歸回歸:指由一個變量的變化去預測另一個變量的變化, 描述一個變量隨另一變量 做不同程度變化的單向關系?;貧w分析的目的就是要找出一個錯誤最小的方法來用 X預測丫。回歸分析的步驟:(1)建立并求解回歸模型的方程(2)檢驗與評價回歸方程的有效性 針對整個回歸方程針對各個回歸系數(shù)(3)利用回歸方程作出預測與控制建立回歸方程:Y=a+bXb為回歸系數(shù),丫為實際的丫的預測值a -bX、(Xi X)(Y 丫)2、(Xi -X)回歸系數(shù)與相關系數(shù):xy = . bxybyx檢驗與評價:是一個估計總體參數(shù)的置信區(qū)間和假設檢驗的問題估計誤差標準差(標準誤):SyxJ (Y-Y)2N 2回歸方程的顯著性檢驗:回歸方程參數(shù)的置信區(qū)間與檢驗:t檢驗 回歸系數(shù)的b的檢驗:(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年有色金屬分選機項目發(fā)展計劃
- 羊奶粉企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報告
- 票據(jù)質(zhì)押企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 磁懸浮旅客列車運輸企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 園藝工具批發(fā)企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報告
- 非實木制門企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 2025年四氫苯酐項目合作計劃書
- 2025年度食品行業(yè)退貨及賠償服務協(xié)議
- 二零二五年度文化旅游資源開發(fā)比例分成合同
- 企業(yè)注冊合同履約金協(xié)議
- 招聘技巧話術培訓
- 第九章 壓強 單元練習(含答案)-2024-2025學年人教版物理八年級下冊
- 職稱評定述職報告
- 2025-2030年中國黑豬行業(yè)市場發(fā)展狀況及投資戰(zhàn)略研究報告
- 2024年醫(yī)師定期考核考題《臨床練習》
- 法律職業(yè)倫理知到智慧樹章節(jié)測試課后答案2024年秋溫州大學
- 英語-遼寧省大連市2024-2025學年高三上學期期末雙基測試卷及答案
- 2024安徽教師統(tǒng)一招聘考試《小學英語》試卷真題及答案
- 2024年考研數(shù)學(一)試題卷及答案
- 16-SC-提高附著式升降腳手架安全驗收一次合格率4:3
- 尼康NikonCOOLPIXP500數(shù)碼相機(中文)說明書
評論
0/150
提交評論