應用統(tǒng)計分析復習要點說明_第1頁
應用統(tǒng)計分析復習要點說明_第2頁
應用統(tǒng)計分析復習要點說明_第3頁
應用統(tǒng)計分析復習要點說明_第4頁
應用統(tǒng)計分析復習要點說明_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

/《應用統(tǒng)計學》復習要點〔要求:每人攜帶具有開方功能的計算器一、名詞解釋1.統(tǒng)計學收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學。2.方差分析方差分析是通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等.研究分類型自變量對數(shù)值型因變量的影響.分為單因素方差分析和雙因素方差分析。3.假設檢驗假設檢驗是事先對總體參數(shù)或分布形式作出某種假設.然后利用樣本信息來判斷原假設是否成立。分為參數(shù)假設檢驗和非參數(shù)假設檢驗。一般采用邏輯上的反證法.依據(jù)統(tǒng)計上的小概率原理。4.置信區(qū)間置信區(qū)間是指由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間。在統(tǒng)計學中.一個概率樣本的置信區(qū)間〔Confidenceinterval是對這個樣本的某個總體參數(shù)的區(qū)間估計。置信區(qū)間展現(xiàn)的是這個參數(shù)的真實值有一定概率落在測量結(jié)果的周圍的程度。5.置信水平置信水平是指總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)內(nèi)的概率。6.抽樣分布抽樣分布:從已知的總體中以一定的樣本容量進行隨機抽樣.由樣本的統(tǒng)計數(shù)所對應的概率分布稱為抽樣分布。抽樣分布是統(tǒng)計推斷的理論基礎(chǔ)。7.方差分析方差分析是通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等.研究分類型自變量對數(shù)值型因變量的影響.分為單因素方差分析和雙因素方差分析。8.相關(guān)分析相關(guān)分析〔correlationanalysis.相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系.并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度.是研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。9.推斷統(tǒng)計推斷統(tǒng)計是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法。包含兩個內(nèi)容:參數(shù)估計.即利用樣本信息推斷總體特征;假設檢驗.即利用樣本信息判斷對總體的假設是否成立。二、計算題1.在某地區(qū)隨機抽取120家企業(yè).按照利潤額進行分組后結(jié)果如下:按利潤額分組〔萬元企業(yè)數(shù)〔個300以下19300~40030400~50042500~60018600以上11合計120計算120家企業(yè)利潤額的平均數(shù)和標準差〔注:第一組和最后一組的組距按相鄰組計算。解答:2.某銀行為縮短顧客到銀行辦理業(yè)務等待的時間.準備了兩種排隊方式進行試驗。為比較哪種排隊方式使顧客等待的時間更短.兩種排隊方式各隨機抽取9名顧客.得到第一種排隊方式的平均等待時間為7.2分鐘.標準差為1.97分鐘.第二種排隊方式的等待時間〔單位:分鐘如下:5.56.66.76.87.17.37.47.87.8計算第二種排隊時間的平均數(shù)和標準差。比較兩種排隊方式等待時間的離散程度。如果讓你選擇一種排隊方式.你會選擇哪一種?試說明理由。3.某大學為了解學生每天上網(wǎng)的時間.在全校學生中隨機抽取36人.調(diào)查他們每天上網(wǎng)的時間〔單位:小時.得到的數(shù)據(jù)如下:3.33.16.25.82.34.14.42.05.42.66.41.82.11.91.25.14.34.24.71.41.22.93.52.45.43.64.50.83.21.53.50.55.73.62.32.5求該校大學生平均上網(wǎng)時間的置信區(qū)間.置信水平分別為90%.95%和99%?!沧ⅲ簔<0.1>、z<0.05>和z<0.01>統(tǒng)計量值分別為1.65、1.96和2.584.利用下面的信息.構(gòu)建總體均值μ的置信區(qū)間。<1>總體服從正態(tài)分布.且已知σ=500.n=15.=8900.置信水平為95%?!沧ⅲ簔統(tǒng)計量值為1.96<2>總體不服從正態(tài)分布.且已知σ=500.n=35.=8900.置信水平為95%?!沧ⅲ簔統(tǒng)計量值為1.96總體不服從正態(tài)分布.σ未知.n=35.=8900.s=500.置信水平為90%?!沧ⅲ簔統(tǒng)計量值為1.65總體不服從正態(tài)分布.σ未知.n=35.=8900.s=500.置信水平為99%?!沧ⅲ簔統(tǒng)計量值為2.585.對消費者的一項調(diào)查表明.17%的人早餐飲料是牛奶。某城市的牛奶生產(chǎn)商認為.該城市的人早餐飲用牛奶的比例更高。為驗證這一說法.生產(chǎn)商隨機抽取550人的一個隨機樣本.其中115人早餐飲用牛奶。在α=0.05的顯著性水平下.檢驗該生產(chǎn)商的說法是否屬實?〔注:z統(tǒng)計量值為1.966.一項包括了200個家庭的調(diào)查顯示.每個家庭每天看電視的平均時間為7.25小時.標準差為2.5小時。據(jù)報道.10年前每天每個家庭看電視的平均時間是6.7小時。取顯著性水平α=0.01.這個調(diào)查能否證明"如今每個家庭每天收看電視的平均時間增加了"?〔注:z統(tǒng)計量值為1.967.下面是7個地區(qū)20XX的人均國內(nèi)生產(chǎn)總值GDP〔Y和人均消費水平〔X的統(tǒng)計數(shù)據(jù)〔注:此題對應的t統(tǒng)計量值為2.57:地區(qū)人均GDP〔千元Y人均消費水平〔千元XY-E<Y>X-E<X><Y-E<Y>>×<X-E<X>><X-E<X>>2<Y-E<Y>>2北京22.4607.32610.2122.81028.6997.899104.276XX11.2264.490-1.022-0.0260.0260.0011.045上海34.54711.54622.2997.030156.76949.427497.226XX4.8512.396-7.397-2.12015.6794.49354.722XX5.4442.208-6.804-2.30815.7025.32546.300XX2.6621.608-9.586-2.90827.8738.45491.900XX4.5492.035-7.699-2.48119.0996.15359.281合計∑85.73931.609263.84781.751854.751計算相關(guān)系數(shù).說明二者之間的關(guān)系。人均GDP作自變量.人均消費水平作因變量.利用最小二乘法求出估計的回歸方程.并解釋回歸系數(shù)的實際意義。計算判定系數(shù)和估計標準誤差.并解釋其意義。檢驗回歸方程線性關(guān)系的顯著性?!拨?0.05如果某地區(qū)的人均GDP為5千元.預測其人均消費水平。某地區(qū)的人均GDP為5000元.預測其人均消費水平為2278.10657元求人均GDP為5千元時.人均消費水平95%的置信區(qū)間和預測區(qū)間。人均GDP為5000元時.人均消費水平95%的置信區(qū)間為[1990.74915.2565.46399].預測區(qū)間為[1580.46315.2975.74999]。8.隨機抽取7家超市.得到其廣告費支出〔X和銷售額〔Y數(shù)據(jù)如下:〔注:此題對應的t統(tǒng)計量值為2.57超市銷售額〔萬元Y廣告費支出〔萬元XY-E<Y>X-E<X><Y-E<Y>>×<X-E<X>><X-E<X>>2<Y-E<Y>>2A191-23-7.143164.28651.020529B322-10-6.14361.42937.735100C4442-4.143-8.28617.1634D406-2-2.1434.2864.5924E5210101.85718.5713.449100F5314115.85764.42934.306121G54201211.857142.286140.592144合計∑29457447288.8571002計算相關(guān)系數(shù).說明二者之間的關(guān)系。r=63.86/<6.424*11.964>=0.831⑵廣告費用支出作自變量.銷售額作因變量.利用最小二乘法求出估計的回歸方程.并解釋回歸系數(shù)的實際意義。計算判定系數(shù)和估計標準誤差.并解釋其意義。檢驗回歸方程線性關(guān)系的顯著性。〔α=0.05如果某超市的廣告費用支出為5萬元.預測其銷售額。據(jù)此進行計算〔x為廣告費=37.1364求廣告費用支出為5萬元時.超市銷售額95%的置信區(qū)間和預測區(qū)間。三、論述題1.簡述樣本量與置信水平、總體方差、估計誤差的關(guān)系。估計總體均值時樣本量n為其中:其中:樣本量n與置信水平1-α、總體方差、估計誤差E之間的關(guān)系為與置信水平成正比.在其他條件不變的情況下.置信水平越大.所需要的樣本量越大;與總體方差成正比.總體的差異越大.所要求的樣本量也越大;與與總體方差成正比.樣本量與估計誤差的平方成反比.即可以接受的估計誤差的平方越大.所需的樣本量越小。2.簡述評價估計量的三個標準?!?5分1、無偏性:估計量抽樣分布的數(shù)學期望等于被估計的總體參數(shù)2、有效性:對同一總體參數(shù)的兩個無偏點估計量.有更小標準差的估計量更有效3、一致性:隨著樣本量的增大時.點估計量的值越來越接近被估總體的參數(shù)。3.簡要說明殘差分析在回歸分析中的作用?!?5分殘差是因變量的觀測值y與根據(jù)估計的回歸方程求出的預測值之差.它反映了用估計的回歸方程去預測y而引起的誤差。4.簡要誤差分解的概念和基本原理?!?5分1.誤差概念:精確值與近似值之差稱為誤差.也叫絕對誤差。2.產(chǎn)生誤差的主要原因①模型誤差:在解決實際問題時.在一定條件下抓住主要因素將現(xiàn)實系統(tǒng)理想化的數(shù)學描述稱為實際問題的數(shù)學模型.這種數(shù)學描述常常是近似的.數(shù)學模型與實際系統(tǒng)之間存在誤差.這種誤差稱為模型誤差。②觀測誤差:數(shù)學模型中往往含有一些由觀測得到的物理量〔如溫度、電阻、長度或由物理量估算出的模型參數(shù).這些觀測物理量或模型參數(shù)常常與實際數(shù)據(jù)存在誤差。這種由觀察產(chǎn)生的誤差稱為觀測誤差。③截斷誤差:數(shù)值計算中用有限運

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論