




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)基礎(chǔ)和prism軟件使用仝鑫魏健2015-12目錄線性回歸和prism軟件應(yīng)用t檢驗(yàn)、F檢驗(yàn)(方差分析)和prism軟件應(yīng)用假設(shè)檢驗(yàn)(參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn))統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)TheGaussianDistributionTheGaussianfunctiondescribingthisshapeisdefinedasfollows:wheremrepresentsthepopulationmeanandsthestandarddeviation.Fewbiologicaldistributions,ifany,reallyfollowtheGaussiandistribution一、統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)TheCentralLimitTheoremIfyoursamplesarelargeenough,thedistributionofmeanswillfollowaGaussiandistributionevenifthepopulationisnotGaussian.N=10orsoisgenerallyenough一、統(tǒng)計(jì)量(DescriptiveStatistics:columnstatisticsinprism)MeasuresofLocationAtypicalorcentralvaluethatbestdescribesthedata(centraltendency).Mean(平均值)Median(中數(shù))Mode(眾數(shù))Geometricmean(幾何均數(shù))MeasuresofDispersionDescribespread(variation)ofthedataaroundthatcentralvalue.Range(范圍)Variance(方差)StandardDeviation(標(biāo)準(zhǔn)偏差)StandardError(樣本間標(biāo)準(zhǔn)誤=SD/n?Coefficientofvariation(變異系數(shù))ConfidenceInterval(置信區(qū)間)Nosingleparametercanfullydescribedistributionofdatainthesample.Moststatisticssoftwarewillprovideacomprehensivetabledescribingthedistribution.MeasuresofLocation:MeanMeanMorecommonlyreferredtoas“theaverage”.Itisthesumofthedatapointsdividedbythenumberofdatapoints.MigrationAssayCell#Distancetravelled(Microns)14922731324245786807628399200M=76.78microns=77micronsMeasuresofDispersion:VarianceVarianceDefinedastheaverageofthesquaredistanceofeachvaluefromthemean.Tocalculatevariance,itisfirstnecessarytocalculatethemeanscorethenmeasuretheamountthateachscoredeviatesfromthemean.Theformulaforcalculatingvarianceis:MeasuresofDispersion:
StandardDeviationStandardDeviationThemostcommonandusefulmeasureofdispersion.Tellsyouhowtightlyeachsampleisclusteredaroundthemean.Whenthesamplesaretightlybunchedtogether,theGaussiancurveisnarrowandthestandarddeviationissmall.Whenthesamplesarespreadapart,theGaussiancurveisflatandthestandarddeviationislarge.Theformulatocalculatestandarddeviationis:SD=squarerootofthevariance.標(biāo)準(zhǔn)偏差(SD)
和標(biāo)準(zhǔn)誤(SEM)Standarddeviationreferstotheamountyouexpectanindividualmeasurementtovaryfromtheaverage.標(biāo)準(zhǔn)差(standarddeviation)衡量的是樣本值對(duì)樣本平均值的離散程度,反應(yīng)個(gè)體間變異的大小,是量度數(shù)據(jù)精密度的指標(biāo)。Standarderrorofthemeanishowmuchyouexpectavalueaveragedfromseveralmeasurementstovaryfromthetruemean.標(biāo)準(zhǔn)誤(standarderror)衡量的是樣本平均值對(duì)總體平均值的離散程度,反映抽樣誤差的大小,是量度結(jié)果精密度的指標(biāo)。Shouldweshowstandarddeviationorstandarderror?UseStandardDeviationIfthescatteriscausedbybiologicalvariabilityandyouwanttoshowthatvariability.Forexample:Youaliquot10plateseachwithadifferentcelllineandmeasureintegrinexpressionofeach.UsestandarderrorIfthevariabilityiscausedbyexperimentalimprecisionandyouwanttoshowtheprecisionofthecalculatedmean.Then
showthe95%confidenceintervalofthemean.Forexample:Youaliquot10platesofthesamecelllineandmeasureintegrinexpressionofeach.PrecisionoftheMean在統(tǒng)計(jì)學(xué)中,樣本的置信區(qū)間(Confidenceintervals)是對(duì)這個(gè)樣本的總體某參數(shù)的區(qū)間估計(jì)。展現(xiàn)的是這個(gè)參數(shù)的真實(shí)值有一定概率落在測(cè)量結(jié)果的周圍的程度。“一定概率”:稱為置信水平。當(dāng)求取90%置信區(qū)間時(shí)Z=1.645
當(dāng)求取95%置信區(qū)間時(shí)Z=1.96
當(dāng)求取99%置信區(qū)間時(shí)Z=2.576TheformulaforcalculatingCI:CI=X±(SEMxZ)XisthesamplemeanandZisthecriticalvalueforthenormaldistribution.Forthe95%CI,Z=1.96.Forourdataset: 95%CI=77±(19x1.96)=77±32 CI95%=45-109Thismeansthatthere’sa95%chancethattheCIyoucalculatedcontainsthepopulationmean.CI:APracticalExampleDatasetADatasetB8090855290308844796892778855856288758688DatasetADatasetBMean86.164.1SD4.119.3SEM1.36.1Low95%CI83.250.3High95%CI89.077.9Betweenthesetwodatasets,whichmeandoyouthinkbestreflectsthepopulationmeanandwhy?InterpretCIofameanSD/SEM/95%CIerrorbarsSDSEM95%CI二、TheNullHypothesis(假設(shè)檢定)AppearsintheformHo:m1=m2Where; Ho=nullhypothesis
m1=meanofpopulation1
m2=meanofpopulation2AnalternateformisHo:m1-m2=0Thenullhypothesisispresumedtrueuntilstatisticalevidenceintheformofahypothesistestprovesotherwise.(非此即彼)檢驗(yàn)統(tǒng)計(jì)量用于假設(shè)檢驗(yàn)問題的統(tǒng)計(jì)量稱為檢驗(yàn)統(tǒng)計(jì)量。
與參數(shù)估計(jì)相同,需要考慮:總體是否正態(tài)分布;大樣本還是小樣本;總體方差已知還是未知。假設(shè)檢驗(yàn)的一些基本概念假設(shè)檢驗(yàn)的一些基本概念thedifferenceyouobservedfromsampling≠truedifferenceofpopulation.Allyoucandoiscalculateprobabilities(Pvalue:[0,1]).BeforethinkingaboutPvalues,youshould:1)Assessthescience.·2)Reviewtheassumptionsoftheanalysisyouchose
Pvalues(SmallPandbigPseepage35and37)顯著性水平(thresholdsignificancelevel)用樣本推斷H0是否正確,必有犯錯(cuò)誤的可能。原假設(shè)H0正確,而被我們拒絕,犯這種錯(cuò)誤的概率或風(fēng)險(xiǎn)用表示。把稱為假設(shè)檢驗(yàn)中的顯著性水平,即決策中的風(fēng)險(xiǎn)。例:=0.05時(shí)的接受域和拒絕域接受域:原假設(shè)為真時(shí)允許范圍內(nèi)的變動(dòng),應(yīng)該接受原假設(shè)。拒絕域:當(dāng)原假設(shè)為真時(shí)只有很小的概率出現(xiàn),因而當(dāng)統(tǒng)計(jì)量的結(jié)果落入這一區(qū)域便應(yīng)拒絕原假設(shè),這一區(qū)域便稱作拒絕域。假設(shè)檢驗(yàn)的一些基本概念雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)假設(shè)檢驗(yàn)根據(jù)實(shí)際的需要可以分為:雙側(cè)檢驗(yàn)(雙尾):指只強(qiáng)調(diào)差異而不強(qiáng)調(diào)方向性的檢驗(yàn)。單側(cè)檢驗(yàn)(單尾):強(qiáng)調(diào)某一方向性的檢驗(yàn)。左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)檢驗(yàn)中的單側(cè)檢驗(yàn)示意圖
拒絕域拒絕域
(a)右側(cè)檢驗(yàn)(b)左側(cè)檢驗(yàn)假設(shè)檢驗(yàn)的一些基本概念假設(shè)檢驗(yàn)中的兩類錯(cuò)誤假設(shè)檢驗(yàn)是依據(jù)樣本提供的信息進(jìn)行推斷的,即由部分來推斷總體,因而假設(shè)檢驗(yàn)不可能絕對(duì)準(zhǔn)確,是可能犯錯(cuò)誤的。兩類錯(cuò)誤:
錯(cuò)誤(I型錯(cuò)誤):H0為真時(shí)卻被拒絕,棄真錯(cuò)誤;
錯(cuò)誤(II型錯(cuò)誤):H0為假時(shí)卻被接受,取偽錯(cuò)誤。
假設(shè)檢驗(yàn)中各種可能結(jié)果的概率:接受H0,拒絕H1拒絕H0,接受H1H0為真
1-(正確決策)(棄真錯(cuò)誤)H0為偽
(取偽錯(cuò)誤)1-(正確決策)(1)與是兩個(gè)前提下的概率。即是拒絕原假設(shè)H0時(shí)犯錯(cuò)誤的概率,這時(shí)前提是H0為真;是接受原假設(shè)H0時(shí)犯錯(cuò)誤的概率,這時(shí)前提是H0為偽。所以+不等于1。
(2)對(duì)于固定的n,與一般情況下不能同時(shí)減小。對(duì)于固定的n,越小,Z/2越大,從而接受假設(shè)區(qū)間(-Z/2,Z/2)越大,H0就越容易被接受,從而“取偽”的概率就越大;反之亦然。即樣本容量一定時(shí),“棄真”概率和“取偽”概率不能同時(shí)減少,一個(gè)減少,另一個(gè)就增大。
與
(3)要想減少與,一個(gè)方法就是要增大樣本容量n。與StatisticalPower(統(tǒng)計(jì)功效)HypothesisTestingObservePhenomenonProposeHypothesisDesignStudyCollectandAnalyzeDataInterpretResultsDrawConclusionsvvvStatisticsareanimportantPartofthestudydesignNonparametrictestsandparametrictests
(參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn))ANOVA,ttests,andmanystatisticaltests:sampleddatafrompopulationsthatfollowaGaussianbell-shapeddistribution.manykindsofbiologicaldatafollowabell-shapeddistributionthatisapproximatelyGaussian.aGaussiandistribution:Normalitytest(正態(tài)性檢驗(yàn)):Normalitytestscanhelpyoudecidewhentousenonparametrictests,butthedecisionshouldnotbeanautomaticone.examinethefrequencydistributionorthecumulativefrequencydistribution.使用服從T分布的統(tǒng)計(jì)量檢驗(yàn)正態(tài)總體平均值的方法。
是定量資料分析中最常用的假設(shè)檢驗(yàn)方法
t檢驗(yàn)和prism軟件應(yīng)用三、t檢驗(yàn)、F檢驗(yàn)(方差分析)和prism軟件應(yīng)用t檢驗(yàn)類型1、樣本均數(shù)與已知某總體均數(shù)μ比較的t檢驗(yàn)usethecolumnstatisticsanalysis2、配對(duì)設(shè)計(jì)(paireddesign)均數(shù)比較的t檢驗(yàn)?zāi)康模和茢鄡蓚€(gè)未知總體均數(shù)μ1與μ2是否有差別,用配對(duì)設(shè)計(jì)。3、兩個(gè)獨(dú)立樣本(unpaireddesign)均數(shù)比較的t檢驗(yàn)?zāi)康模和茢鄡蓚€(gè)未知總體的均數(shù)μ1與μ2是否有差別,用成組設(shè)計(jì)。適用于樣本均數(shù)與已知總體均數(shù)μ0的比較,其比較目的是檢驗(yàn)樣本均數(shù)所代表的總體均數(shù)μ是否與已知總體均數(shù)μ0有差別。已知總體均數(shù)μ0一般為標(biāo)準(zhǔn)值、理論值或經(jīng)大量觀察得到的較穩(wěn)定的指標(biāo)值。單樣t檢驗(yàn)的應(yīng)用條件是總體標(biāo)準(zhǔn)未知的小樣本資料(如n<50),且服從正態(tài)分布。
一、樣本均數(shù)與已知某總體均數(shù)的比較(單樣本t檢驗(yàn))二、配對(duì)設(shè)計(jì)均數(shù)比較的t檢驗(yàn)(配對(duì)t檢驗(yàn))配對(duì)設(shè)計(jì)處理分配方式主要有三種情況:①兩個(gè)同質(zhì)受試對(duì)象分別接受兩種處理,如把同窩、同性別和體重相近的動(dòng)物配成一對(duì),或把同性別和年齡相近的相同病情病人配成一對(duì);②同一受試對(duì)象或同一標(biāo)本的兩個(gè)部分,隨機(jī)分配接受兩種不同處理;③自身對(duì)比(self-contrast)。即將同一受試對(duì)象處理(實(shí)驗(yàn)或治療)前后的結(jié)果進(jìn)行比較,如對(duì)高血壓患者治療前后、運(yùn)動(dòng)員體育運(yùn)動(dòng)前后的某一生理指標(biāo)進(jìn)行比較。案例16L1Tm1tratioTestingifpairsfollowaGaussiandistribution獨(dú)立樣本:又稱非配對(duì)樣本或成組樣本。是指一組數(shù)據(jù)與另一組數(shù)據(jù)沒有任何關(guān)系,也就是說,兩樣本資料是相互獨(dú)立的。兩組的樣本容量盡可能相同,可以提高檢驗(yàn)的精確度。其均數(shù)差異顯著性的t檢驗(yàn),又分為兩總體方差相等(方差齊性)和方差不等兩種檢驗(yàn)方法(Levene’sTestforequalityofvariance)。若兩總體方差不等,即方差不齊,可采用t’檢驗(yàn),或進(jìn)行變量變換,或用秩和檢驗(yàn)方法處理。三、兩個(gè)獨(dú)立樣本均數(shù)比較的t檢驗(yàn)(兩獨(dú)立樣本的t檢驗(yàn))案例26L1rs和16L1rsTm1nonparametrictestChoosingwhentouseanonparametrictestisnotstraightforwardTheMann-WhitneytestWilcoxonmatchedpairstestunpaireddata總結(jié)應(yīng)用條件:t檢驗(yàn):1.小樣本(n<50)計(jì)量資料2.樣本來自正態(tài)分布總體3.總體標(biāo)準(zhǔn)差未知4.兩樣本均數(shù)比較時(shí),要求兩樣本相應(yīng)的總體方差相等(方差齊性)2023/2/1把所有觀察值之間的變異分解為幾個(gè)部分。即把描寫觀察值之間的變異的離均差平方和分解為某些因素的離均差平方和及隨機(jī)抽樣誤差的離均差平方和,進(jìn)而計(jì)算其相應(yīng)的均方差,構(gòu)成F統(tǒng)計(jì)量。分類:?jiǎn)我蛩胤讲罘治觯阂蛩刂挥幸粋€(gè),這個(gè)因素的水平≥2。多因素(≥2)方差分析:因素≥2,各因素的水平≥2方差分析(ANOVA,F(xiàn)檢驗(yàn))和prism軟件應(yīng)用
在試驗(yàn)中所考慮的因素只有一個(gè)時(shí),稱為單因素實(shí)驗(yàn)。它是最簡(jiǎn)單的一種,它適用于只研究一個(gè)試驗(yàn)因素的資料,目的在于正確判斷該試驗(yàn)因素各處理的相對(duì)效果(各水平的優(yōu)劣)1.各樣本是相互獨(dú)立的隨機(jī)樣本;2.各樣本數(shù)據(jù)均服從正態(tài)分布;3.相互比較的各樣本的總體方差相等,即方差齊性(homogeneityofvariance)。單因素方差分析(onewayANOVA)ordinaryone-wayANOVARepeatedmeasuresone-wayANOVANonparameters:Kruskal-Wallistest;Fredman’stest案例3NaCl濃度對(duì)6L1rs顆粒影響NaCl濃度對(duì)11L1rs顆粒影響Fratio2023/2/1多因素方差分析(twowayANOVA)總體思路:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年標(biāo)準(zhǔn)攝影棚租賃合同示范文本
- 2025年水果分銷合作合同文件
- 2025年兒童撫養(yǎng)合同修改樣本
- 2025年商務(wù)中心出租合同標(biāo)準(zhǔn)版
- 2025年勞動(dòng)合同和解(勞動(dòng)爭(zhēng)議和諧解決)
- 一年級(jí)道德與法治下冊(cè) 第二單元 我和大自然 7《可愛的動(dòng)物》怎樣才是真喜歡教學(xué)實(shí)錄 新人教版
- 木結(jié)構(gòu)建筑的文化價(jià)值與保護(hù)考核試卷
- 模具制造中的節(jié)能技術(shù)考核試卷
- 舊貨交易的支付安全與信任機(jī)制考核試卷
- 殘疾人創(chuàng)業(yè)支持與市場(chǎng)開拓考核試卷
- 2025年人工智能技術(shù)研發(fā)與應(yīng)用合作協(xié)議9篇
- 二零二五年度家庭健康安全管理合同3篇
- 外貿(mào)英語口語900句
- 2025年金鯧魚市場(chǎng)調(diào)查報(bào)告
- 2024-2030年中國石油瀝青市場(chǎng)發(fā)展?fàn)顩r及投資前景規(guī)劃研究報(bào)告
- 《X線管裝置》課件
- 戰(zhàn)傷并發(fā)癥的護(hù)理
- 事業(yè)單位工作人員退休(職)登記表
- 前程無憂招聘測(cè)評(píng)題庫及答案
- 2024解析:第十章 浮力綜合應(yīng)用-基礎(chǔ)練(解析版)
- 【MOOC】社會(huì)調(diào)查與研究方法-北京大學(xué) 中國大學(xué)慕課MOOC答案
評(píng)論
0/150
提交評(píng)論