SPSS常見統(tǒng)計(jì)問題與統(tǒng)計(jì)基礎(chǔ)_第1頁
SPSS常見統(tǒng)計(jì)問題與統(tǒng)計(jì)基礎(chǔ)_第2頁
SPSS常見統(tǒng)計(jì)問題與統(tǒng)計(jì)基礎(chǔ)_第3頁
SPSS常見統(tǒng)計(jì)問題與統(tǒng)計(jì)基礎(chǔ)_第4頁
SPSS常見統(tǒng)計(jì)問題與統(tǒng)計(jì)基礎(chǔ)_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

計(jì)算機(jī)在食品科學(xué)中的應(yīng)用

——軟件應(yīng)用技巧河南農(nóng)業(yè)大學(xué)趙改名計(jì)劃內(nèi)容安排(共商討)論文中常見的統(tǒng)計(jì)問題及統(tǒng)計(jì)基礎(chǔ)ExcelSPSSWordAdobeAcrobat表格設(shè)計(jì)技巧圖像處理技巧JMP和DesignExperts功能簡介投稿SCI論文注意事項(xiàng)常見的統(tǒng)計(jì)問題及統(tǒng)計(jì)基礎(chǔ)不進(jìn)行統(tǒng)計(jì)分析,憑直觀數(shù)據(jù)下結(jié)論不考慮數(shù)據(jù)類型只管按連續(xù)變量進(jìn)行分析不考慮數(shù)據(jù)分布和方差同質(zhì)性(方差齊性),直接統(tǒng)計(jì)分析不考慮樣本大小,直接分析下結(jié)論標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤不分用T檢驗(yàn)進(jìn)行多重比較分析多重比較時(shí)不考慮整體方差分析結(jié)果僅靠相關(guān)分析輕易下結(jié)論回歸分析不進(jìn)行回歸效果診斷圖表選用不當(dāng)不統(tǒng)計(jì)下結(jié)論的問題如肉品抑菌劑試驗(yàn),假如三組處理肉樣的微生物總數(shù)測定結(jié)果平均為1×104個(gè)·g-1、3×104個(gè)·g-1和5×104個(gè)·g-1。雖然表面差異很大,如果作圖差別也很明顯,但由于沒有統(tǒng)計(jì)分析,樣本大小、標(biāo)準(zhǔn)差或標(biāo)準(zhǔn)誤均不清楚,更沒有下結(jié)論的可靠性概率,就不能說第一種抑菌劑比第三種或比第二種效果更好??疾閿?shù)據(jù)類型正確地進(jìn)行資料的分類是資料整理的前提。在調(diào)查或試驗(yàn)中,由觀察、測量所得的數(shù)據(jù)按其性質(zhì)的不同,一般可以分為數(shù)量性狀資料、質(zhì)量性狀資料和半定量(等級(jí))資料三大類。數(shù)量性狀是指能夠以量測或計(jì)數(shù)的方式表示其特征的性狀。觀察測定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料,分為計(jì)量資料和計(jì)數(shù)資料兩種。計(jì)量資料也稱為連續(xù)性變異資料。計(jì)數(shù)資料也稱為不連續(xù)性變異資料或間斷性變異資料。質(zhì)量性狀是指能觀察到而不能直接測量的性狀,如顏色、風(fēng)味等。這類性狀本身不能直接用數(shù)值表示,須對(duì)其觀察結(jié)果作數(shù)量化處理,常用統(tǒng)計(jì)次數(shù)法和評(píng)分法處理。半定量或等級(jí)資料是指將觀察單位按所考察的性狀或指標(biāo)的等級(jí)順序分組,然后清點(diǎn)各組觀察單位的次數(shù)而得的資料。這類資料既有次數(shù)資料的特點(diǎn),又有程度或量的不同。如產(chǎn)品等級(jí),肉的質(zhì)量等級(jí)等。不同的數(shù)據(jù)類型要用不同的分析方法和檢驗(yàn)措施。統(tǒng)計(jì)需要解決的主要問題建立模型——分布模型確立模型參數(shù)估計(jì)假設(shè)檢驗(yàn)——利用模型對(duì)無效假設(shè)進(jìn)行檢驗(yàn)平均數(shù)差異性要檢驗(yàn)——t檢驗(yàn)、方差分析參數(shù)間關(guān)系分析——其它統(tǒng)計(jì)手段,如相關(guān)、回歸、主成分、聚類、判別等中心極限定理告訴我們:不論x變量是連續(xù)型還是離散型,也無論x服從何種分布,一般只要n>30,就可認(rèn)為的分布是正態(tài)的。若x的分布不很偏倚,在n>20時(shí),的分布就近似于正態(tài)分布了。數(shù)據(jù)分布類型方差齊性問題當(dāng)樣品分布屬于或接近正態(tài)分析時(shí),此時(shí)抽樣方差是均一的,即齊性方差,都可以對(duì)數(shù)據(jù)進(jìn)行方差分析的參數(shù)檢驗(yàn)處理;相反,如果樣品分布與正態(tài)分布相差太大,或經(jīng)方差檢驗(yàn)方差均勻性不好,即存在非齊性方差,只能用非參數(shù)檢驗(yàn)處理。同樣的處理,非參數(shù)檢驗(yàn)結(jié)果可信度比參數(shù)檢驗(yàn)結(jié)果低20%左右,除非不得已,一般不用非參數(shù)檢驗(yàn)。參數(shù)檢驗(yàn)?zāi)P瓦x擇——

一個(gè)正態(tài)母體的均值檢驗(yàn)σ2已知,用U檢驗(yàn)法(正態(tài)分析法);σ2未知,但為大樣本(n≥45),用U檢驗(yàn)法;σ2未知,且為小樣本,用T檢驗(yàn)法;參數(shù)檢驗(yàn)?zāi)P瓦x擇——

兩個(gè)正態(tài)母體的均值檢驗(yàn)σ12和σ22已知,用U檢驗(yàn)法(正態(tài)分析法);σ12和σ22未知,但均為大樣本,用U檢驗(yàn)法;σ12和σ22未知,σ12=σ22=σ,且兩個(gè)樣本容量不大時(shí),用T檢驗(yàn)法;σ12和σ22未知,且σ12≠σ22,但n1=n2時(shí),用T檢驗(yàn)法;參數(shù)檢驗(yàn)?zāi)P瓦x擇——

一個(gè)正態(tài)母體的方差檢驗(yàn)μ已知,用χ2檢驗(yàn)μ未知,用樣品均值取代μ,仍用χ2檢驗(yàn)參數(shù)檢驗(yàn)?zāi)P瓦x擇——

兩個(gè)正態(tài)母體的方差檢驗(yàn)μ1和μ2已知,用F檢驗(yàn)μ1和μ2未知,用樣品均值取代μ1和μ2

,仍用F檢驗(yàn)樣本大小與結(jié)論可靠性平均數(shù)抽樣調(diào)查的樣本含量估計(jì)

目前對(duì)調(diào)查研究所需樣本含量,還沒有一個(gè)精確的估計(jì)方法。一般要求樣本含量占抽樣總體的5%為最小量,對(duì)變異較小的群體,則可低于5%。斯丹(C.Stein)認(rèn)為,調(diào)查樣本含量與調(diào)查要求的準(zhǔn)確性高低及所研究對(duì)象的變異度大小有關(guān)。因此,需要提出我們能夠接受的允許誤差,并初步了解調(diào)查指標(biāo)變異度的大小。由樣本平均數(shù)與總體平均數(shù)差異顯著性檢驗(yàn)的t檢驗(yàn)公式推出的樣本含量計(jì)算公式為:

式中:n為樣本含量;為自由度n-1、兩尾概率為a的臨界t值;

S為標(biāo)準(zhǔn)差,由經(jīng)驗(yàn)或小型調(diào)查估得;

δ為允許誤差,可根據(jù)調(diào)查要求的準(zhǔn)確性確定;1-a為置信度。在首次計(jì)算時(shí),可先用df=∞時(shí)(當(dāng)置信度為95%時(shí),tα=t0.05=1.96;置信度為99%時(shí),tα=t0.01=2.58)值代入,若算得n<30,再用df=n-1的ta代入計(jì)算,直到n穩(wěn)定為止。百分?jǐn)?shù)抽樣調(diào)查樣本含量估計(jì)

由樣本百分?jǐn)?shù)與總體百分?jǐn)?shù)差異顯著性檢驗(yàn)檢驗(yàn)公式推出樣本含量計(jì)算公式為:式中:n為樣本含量;p為總體的百分?jǐn)?shù);

q=1-p;為兩尾概率為a的臨界u值:u0.05=1.96,u0.01=2.58;d為允許誤差(-p),為樣本百分率;1-α為置信度。配對(duì)設(shè)計(jì)中重復(fù)數(shù)的估計(jì)

由配對(duì)設(shè)計(jì)t檢驗(yàn)公式導(dǎo)出:式中:

n為試驗(yàn)所需動(dòng)物對(duì)子數(shù),即重復(fù)數(shù);

Sd為差數(shù)標(biāo)準(zhǔn)誤,根據(jù)以往的試驗(yàn)或經(jīng)驗(yàn)估計(jì);

ta為自由度n-1、兩尾概率為a的臨界t值;為要求預(yù)期達(dá)到差異顯著的平均數(shù)差值();1-a為置信度。非配對(duì)試驗(yàn)重復(fù)數(shù)的估計(jì)

對(duì)于隨機(jī)分為兩組的試驗(yàn),若n1=n2,可由非配對(duì)t檢驗(yàn)公式導(dǎo)出:

式中:n為每組試驗(yàn)動(dòng)物頭數(shù),即重復(fù)數(shù);

ta為df=2(n-1)、兩尾概率為a的臨界t值;S為標(biāo)準(zhǔn)差,根據(jù)以往的試驗(yàn)或經(jīng)驗(yàn)估計(jì);()為預(yù)期達(dá)到差異顯著的平均數(shù)差值;1-a為置信度。多個(gè)處理比較試驗(yàn)中重復(fù)數(shù)的估計(jì)

當(dāng)試驗(yàn)處理數(shù)k≥3時(shí),各處理重復(fù)數(shù)可按誤差自由度dfe≥12的原則來估計(jì)。因?yàn)楫?dāng)dfe超過12時(shí),F(xiàn)表中的F值減少的幅度已很小了。完全隨機(jī)設(shè)計(jì)

由dfe=k(n-1)≥12,得重復(fù)數(shù)的估算公式為:n≥12/k+1若k=3,則n≥5;k=4,則n≥4;……。但當(dāng)處理數(shù)k>6時(shí),重復(fù)數(shù)仍應(yīng)不少于3。隨機(jī)單位組設(shè)計(jì)

以dfe=(k-1)(n-1)≥12,得重復(fù)數(shù)的估算公式為:

n≥12/(k-1)+1若k=3,則n≥7;k=4,則n≥5;……。但當(dāng)處理數(shù)k>7時(shí),重復(fù)數(shù)仍應(yīng)不少于3。兩個(gè)百分?jǐn)?shù)比較試驗(yàn)中樣本含量估計(jì)

設(shè)兩樣本含量相等:n1=n2=n,n的計(jì)算公式可由兩個(gè)樣本百分?jǐn)?shù)差異顯著性檢驗(yàn)u檢驗(yàn)公式推得:

式中:n為每組試驗(yàn)的動(dòng)物頭數(shù);為合并百分?jǐn)?shù),由樣本百分?jǐn)?shù)計(jì)算,;為預(yù)期達(dá)到差異顯著的百分?jǐn)?shù)差值;ua為自由度等于∞、兩尾概率為a的臨界u值:u0.05=1.96,u0.01=2.581-a為置信度。標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤平均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤和變異系數(shù)是幾個(gè)相互關(guān)聯(lián),共同說明數(shù)據(jù)性質(zhì)和常用參數(shù)或統(tǒng)計(jì)量。平均數(shù)通常使用算術(shù)平均數(shù),但有時(shí)也使用幾何平均數(shù)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤使用場合不同在比較單位不同的數(shù)據(jù)時(shí),變異系數(shù)也是常用的統(tǒng)計(jì)量標(biāo)準(zhǔn)差樣本方差S2的平方根叫樣本標(biāo)準(zhǔn)差,記為S,反映了測定結(jié)果的準(zhǔn)確性,即:標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤(平均數(shù)抽樣總體的標(biāo)準(zhǔn)差)的大小反映樣本平均數(shù)的抽樣誤差的大小,即精確性的高低。標(biāo)準(zhǔn)誤大,說明各樣本平均數(shù)間差異程度大,樣本平均數(shù)的精確性低。在實(shí)際工作中,總體標(biāo)準(zhǔn)差σ往往是未知的,因而無法求得。此時(shí),可用樣本標(biāo)準(zhǔn)差S估計(jì)σ。于是,以估計(jì)。記為,稱作樣本標(biāo)準(zhǔn)誤或均數(shù)標(biāo)準(zhǔn)誤。樣本標(biāo)準(zhǔn)誤是平均數(shù)抽樣誤差的估計(jì)值。若樣本中各觀測值為,,…,,則

注意,樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩個(gè)統(tǒng)計(jì)量。二者的區(qū)別在于:樣本標(biāo)準(zhǔn)差S是反映樣本中各觀測值,,…,變異程度大小的一個(gè)指標(biāo),它的大小說明了對(duì)該樣本代表性的強(qiáng)弱。樣本標(biāo)準(zhǔn)誤是樣本平均數(shù)的標(biāo)準(zhǔn)差,它是抽樣誤差的估計(jì)值,其大小說明了樣本間變異程度的大小及精確性的高低。

對(duì)于大樣本資料,常將樣本標(biāo)準(zhǔn)差S與樣本平均數(shù)配合使用,記為±S,用以說明所考察性狀或指標(biāo)的優(yōu)良性與穩(wěn)定性。

對(duì)于小樣本資料,常將樣本標(biāo)準(zhǔn)誤與樣本平均數(shù)配合使用,記為±,用以表示所考察性狀或指標(biāo)的優(yōu)良性與抽樣誤差的大小。變異系數(shù)變異系數(shù)是衡量資料中各觀測值變異程度的另一個(gè)統(tǒng)計(jì)量。標(biāo)準(zhǔn)差與平均數(shù)的比值稱為變異系數(shù),記為C·V(%)。變異系數(shù)可以消除單位和(或)平均數(shù)不同對(duì)兩個(gè)或多個(gè)資料變異程度比較的影響。均值比較均值比較是統(tǒng)計(jì)分析最重要內(nèi)容之一。單因素兩組均值或成對(duì)數(shù)據(jù)均值比較要用T檢驗(yàn),而多因素均值比較或單因素多組數(shù)據(jù)均值的多重比較則必需用方差分析。用T檢驗(yàn)進(jìn)行多重比較不但復(fù)雜,而且不能得出共用方差,誤差較大。方差分析整體效果顯著是進(jìn)行多重比較的基礎(chǔ),因此,進(jìn)行多重比較前必需考查方差分析結(jié)果,方差分析結(jié)果不顯著,則多重比較沒有意義。相關(guān)與回歸分析問題相關(guān)分析常見的問題是僅憑相關(guān)系數(shù)下結(jié)論。如干腌火腿食鹽含量與外界氣溫高度相關(guān),但不能說明兩者的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論