版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
本資料來源本資料來源統(tǒng)計學(xué)教學(xué)課件天津財經(jīng)學(xué)院統(tǒng)計系高建國統(tǒng)計學(xué)天津財經(jīng)學(xué)院統(tǒng)計系第1章總論統(tǒng)計學(xué)是搜集數(shù)據(jù)、整理數(shù)據(jù)并從數(shù)據(jù)中獲取有用信息的一門方法論科學(xué)。我們從數(shù)據(jù)中獲取的有用信息是來說明社會經(jīng)濟現(xiàn)象總體
數(shù)量特征的。有限總體和無限總體(1)認識事物的現(xiàn)實狀況;(2)認識隨機現(xiàn)象的統(tǒng)計規(guī)律;(3)減少人們對某種系統(tǒng)知識的無知而產(chǎn)生的認識上的不確定性。第1章總論統(tǒng)計學(xué)是搜集數(shù)據(jù)、整理數(shù)據(jù)并從第2章數(shù)據(jù)的搜集一、一些基本概念總體單位總體標(biāo)志指標(biāo)數(shù)量指標(biāo)質(zhì)量指標(biāo)數(shù)量標(biāo)志品質(zhì)標(biāo)志數(shù)據(jù)的搜集也就是統(tǒng)計調(diào)查,它是保證我們獲取有用信息的關(guān)鍵。變量分為連續(xù)變量和離散變量,數(shù)量型和屬性變量第2章數(shù)據(jù)的搜集一、一些基本概念總體單例1:調(diào)查天津市工業(yè)企業(yè)2001年增加值的規(guī)模??傮w是“全部工業(yè)企業(yè)”,總體單位是“每一工業(yè)企業(yè)”,標(biāo)志是“每一工業(yè)企業(yè)的增加值”——數(shù)量標(biāo)志,指標(biāo)是“增加值總和”——數(shù)量指標(biāo)。例2:調(diào)查天津市學(xué)齡兒童入學(xué)情況??傮w是“所有兒童”,總體單位是“每一個兒童”,標(biāo)志是“是否入學(xué)”——品質(zhì)標(biāo)志,指標(biāo)是“入學(xué)率”——質(zhì)量指標(biāo)。例3:調(diào)查天津市2001年居民年收入情況??傮w是“所有居民”,總體單位是“每位居民”,標(biāo)志是“每位居民的年收入”——數(shù)量標(biāo)志,指標(biāo)是年均收入———質(zhì)量指標(biāo)。例1:調(diào)查天津市工業(yè)企業(yè)2001年增加值的規(guī)模。例2:調(diào)查天二、統(tǒng)計分組1.將統(tǒng)計調(diào)查所獲取的零散的不系統(tǒng)的資料,按照一定的研究目的和任務(wù),進行加工和整理的一種行之有效的統(tǒng)計方法。它可以幫助我們完成4種任務(wù)。2.分組時應(yīng)該正確選擇分組標(biāo)志,以免不能準(zhǔn)確的完成4種任務(wù);同時應(yīng)遵循互斥性和包容性原則,以免重復(fù)或遺漏。3.組距式分組中,應(yīng)該弄清一些概念:組數(shù)、組距及組距的類型(如等組距、異組距、開口組距、閉口組距)、組限(上限、下限、如何確定組限)、組中值(它的假定性、開口組距的組中值如何計算、用組中值計算的平均數(shù)是一個準(zhǔn)確值嗎)。三、統(tǒng)計調(diào)查方案是在背景分析的前提下,制定出的周密完整的,以指導(dǎo)調(diào)查工作順利完成的一項計劃任務(wù)書。一項完整的統(tǒng)計調(diào)查方案包括8方面的內(nèi)容。二、統(tǒng)計分組1.將統(tǒng)計調(diào)查所獲取的零散的不系統(tǒng)的資料,按照一第3章數(shù)據(jù)和統(tǒng)計指標(biāo)的基本類型一、數(shù)據(jù)的類型
它分為總體總量和標(biāo)志總量(兩者要成對出現(xiàn)才能判斷,比如職工人數(shù)如何判斷,只有將它和工資總額或者和工業(yè)企業(yè)數(shù)結(jié)合在一起才能判斷出它的歸屬,即它和工資總額結(jié)合在一起,它是總體總量;它和工業(yè)企業(yè)數(shù)結(jié)合在一起,它是標(biāo)志總量);時期數(shù)又稱流量指標(biāo)和時點數(shù)又稱存量指標(biāo)(兩者判斷的正確與否對序時平均數(shù)的計算有至關(guān)重要的影響,序時平均數(shù)的計算將在第13章里講解,而如何判斷呢,二、指標(biāo)的類型
有數(shù)量型數(shù)據(jù)(用數(shù)來表示且數(shù)的計算有意義)和品質(zhì)型數(shù)據(jù)(用文字來表示也可用數(shù)來表示但數(shù)的計算沒有意義)。1.總量指標(biāo)第3章數(shù)據(jù)和統(tǒng)計指標(biāo)的基本類型一、數(shù)據(jù)的類型應(yīng)根據(jù)其特點即(1)與時間長短是否相關(guān),(2)前后時間上的數(shù)值相加是否有意義來判斷)。2.平均指標(biāo)
在同質(zhì)總體內(nèi),通過“填平補齊”,“取長補短”的方式,獲得的描繪總體一般水平的指標(biāo)。3.相對指標(biāo)
它有5種形式:動態(tài)相對指標(biāo),比較相對指標(biāo),計劃完成相對指標(biāo),結(jié)構(gòu)相對指標(biāo),強度相對指標(biāo)。
平均指標(biāo)和相對指標(biāo)統(tǒng)稱為比率型變量,我們在第4章里將涉及到這個概念,到時在詳談。應(yīng)根據(jù)其特點即(1)與時間長短是否相關(guān),(2)前后時間上的數(shù)第4章數(shù)據(jù)的描述性整理一、數(shù)據(jù)分布狀態(tài)的描述方法1.分布列:有品質(zhì)型和數(shù)量型分布列。它們是通過統(tǒng)計表來描述數(shù)據(jù)的分布狀態(tài)。
在這里還應(yīng)該弄清楚以下概念:次數(shù)又叫頻數(shù)、頻率、頻數(shù)密度、頻率密度。因為這些概念可以幫助我們了解數(shù)據(jù)的分布狀態(tài)。2.分布圖:有棒圖、直方圖、折線圖、曲線圖。它們是通過統(tǒng)計圖來描述數(shù)據(jù)的分布狀態(tài)。它們與分布列相比更加直觀。
畫圖時如果是等組距,那么可用頻數(shù)或頻率來做圖;如果是異組距,那么應(yīng)該用頻數(shù)密度或頻率密度來做圖。第4章數(shù)據(jù)的描述性整理一、數(shù)據(jù)分布狀態(tài)的描述方法二、數(shù)據(jù)分布的特征及特征數(shù)分布特征分布特征數(shù)位置特征平均數(shù)、中位數(shù)、眾數(shù)離散特征全距、平均差、標(biāo)準(zhǔn)差、離散系數(shù)偏斜特征偏態(tài)系數(shù)峰度特征峰度系數(shù)
三、幾種常用的位置特征數(shù)(一)平均數(shù)常見的有算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)。幾何平均數(shù)在第13章里會詳細加以解釋,這里主要講解前兩個。二、數(shù)據(jù)分布的特征及特征數(shù)分布特征對于絕對數(shù)和比率變量如何計算平均數(shù),我們可這樣做:1.先確定變量。根據(jù)題意平均“誰”,“誰”就是變量。比如,求平均日產(chǎn)量,則“日產(chǎn)量”就是變量;又如,求50家企業(yè)的平均計劃完成百分比,則“計劃完成百分比”就是變量。2.判別“所確定變量”的類型是絕對數(shù)變量,還是比率變量。3.如果是絕對數(shù)變量,那么權(quán)數(shù)是次數(shù)(頻數(shù))或頻率,并采用加權(quán)算術(shù)平均數(shù)的公式來計算。如:“日產(chǎn)量”是絕對數(shù)變量,則權(quán)數(shù)是各組的人數(shù)或人數(shù)比重。4.如果是比率變量,那么要找出比率變量的基本比式,然后再根據(jù)已知資料來確定權(quán)數(shù)和計算公式。如:“計劃完成百分比”是比率變量,其基本比式是實際數(shù)與對于絕對數(shù)和比率變量如何計算平均數(shù),我們可這樣做:1.先確定計劃數(shù)的比值。那么權(quán)數(shù)和公式這樣選擇:(1)若已知資料是比率變量和基本比式的分母資料,則權(quán)數(shù)為分母資料,用f表示,并采用加權(quán)算術(shù)平均數(shù)。(2)若已知資料是比率變量和基本比式的分子資料,則權(quán)數(shù)為分子資料,用M表示,并采用加權(quán)調(diào)和平均數(shù)。例如:通過調(diào)查獲取了15個企業(yè)的產(chǎn)值計劃執(zhí)行情況,如下表(單位:萬元)計劃完成% 企業(yè)數(shù) 計劃產(chǎn)值80——902 10090——1003 200100——1106 400110以上4300
合計 15 1000計算15個企業(yè)的平均計劃完成百分比。計劃數(shù)的比值。那么權(quán)數(shù)和公式這樣選擇:(1)若已知資料是比率(1)在這道題中,我們平均的是“計劃完成百分比”,那么,它就是變量,用x表示,變量值為各組的組中值。(2)該變量的性質(zhì)是比率變量,其基本比式是實際產(chǎn)值與計劃產(chǎn)值之比。(3)從已知資料中可知條件是比率變量和基本比式的分母資料,則權(quán)數(shù)是分母資料“計劃產(chǎn)值”,用f來表示,采用加權(quán)算術(shù)平均數(shù)公式來計算即可。(二)中位數(shù)
平均數(shù)的著眼點在于抵消各觀察值之間的數(shù)量差異,表明將各個觀察值“截長補短”以后的平均水平。中位數(shù)的著眼點在于尋求全部觀察值按其大小順序排列,居中間位置的一般水平。例如:人口的年齡分布往往近似J型:嬰兒數(shù)最多,隨著年齡的增大,人數(shù)逐漸下降,到了百歲左右,所剩的人(1)在這道題中,我們平均的是“計劃完成百分比”,那么,它就(三)眾數(shù)
眾數(shù)的著眼點在于尋求各組中頻數(shù)最多的觀察值。用來反映要了解的現(xiàn)象中最普通、最常見的數(shù)值水平。數(shù)就很少了。如果計算年齡的算術(shù)平均數(shù),老年人口數(shù)雖然較少,但其年齡數(shù)值很高,這樣一來,計算的平均年齡就會偏向老年一方。因此,各國的人口統(tǒng)計資料中,平均年齡的計算一般采用中位數(shù)。
比如,一位食品部經(jīng)理想按照預(yù)期的銷售量來分配貨物架的空間。從這個意義上來說,我們應(yīng)該依據(jù)眾數(shù),而不是平均數(shù)或中位數(shù)來確定,即過去具有最高銷售量的食品將得到最大限度的貨物架空間。
又如,如果你的業(yè)務(wù)是提供足球運動衫的號碼,那么,哪一種度量對你來說更為有用:平均數(shù)、中位數(shù)或眾數(shù)?當(dāng)然是眾數(shù)。(三)眾數(shù)眾數(shù)的著眼點在于尋求各組中頻數(shù)最四、離散特征數(shù)有4種:一是全距:在實際生產(chǎn)中稱之為極差,用R表示。
二是平均差:有簡單式和加權(quán)式之分。當(dāng)平均數(shù)是簡單算術(shù)平均數(shù)時,平均差便采用簡單式;當(dāng)平均數(shù)是加權(quán)算術(shù)平均數(shù)時,平均差便采用加權(quán)式。
三是標(biāo)準(zhǔn)差(方差):也有簡單式和加權(quán)式之分。和平均差一樣,選擇哪種形式要依賴于平均數(shù)的計算。
四是離散系數(shù):有全距系數(shù)、平均差系數(shù)和標(biāo)準(zhǔn)差系數(shù)。一般地,標(biāo)準(zhǔn)差系數(shù)的應(yīng)用場合較多。
例1.甲、乙兩個企業(yè)平均每月的勞動生產(chǎn)率都是8000元,它們的標(biāo)準(zhǔn)差分別是320元和240元,那么哪個企業(yè)的勞動生產(chǎn)率的代表性更強?
對于這種情況,因為甲乙兩個企業(yè)的總體平均水平是相同的,所以,我們可以直接根據(jù)標(biāo)準(zhǔn)差的大小來判別乙企四、離散特征數(shù)有4種:一是全距:在實際生產(chǎn)中稱之為極差,用R業(yè)的勞動生產(chǎn)率的代表性強。
例2.A、B兩個商場2000年平均每月的銷售額分別為16000元和8000元,它們的標(biāo)準(zhǔn)差各為320元和240元,那么哪個商場的銷售額穩(wěn)定些?
例3.對某系一年級的100名男生進行調(diào)查,得到平均身高為172厘米,平均體重68公斤,各自的標(biāo)準(zhǔn)差分別為6厘米和4公斤,那么100名男生的身高和體重何者離散較嚴重?
對于例2和例3這兩種情況,由于面對的一個是兩個總體水平相差很懸殊,一個是兩個總體的性質(zhì)或計量單位不同,我們不能直接根據(jù)已知的標(biāo)準(zhǔn)差的大小來判別總體內(nèi)變量值的離散程度,應(yīng)該計算兩個總體各自的標(biāo)準(zhǔn)差系數(shù)。結(jié)果是例2中,A商場的標(biāo)準(zhǔn)差系數(shù)是2%,B商場的標(biāo)準(zhǔn)差系數(shù)是3%,即A商場的銷售額穩(wěn)定。例3中,身高的標(biāo)準(zhǔn)差系數(shù)是3.49%,體重的標(biāo)準(zhǔn)差系數(shù)是5.88%,即100名男生體重的離散較嚴重。業(yè)的勞動生產(chǎn)率的代表性強。例2.A、B兩個商場200第5章隨機試驗和隨機變量一、隨機現(xiàn)象在給定條件下,不能確切預(yù)見其結(jié)果的現(xiàn)象。1.由于存在著不能確定的和不能完全預(yù)見的偶然性的影響因素,隨機現(xiàn)象便產(chǎn)生了。2.隨機現(xiàn)象具有一定的規(guī)律性。規(guī)律值附近發(fā)生的可能大,規(guī)律值遠處發(fā)生的可能小。3.要保證給定的條件是相同的。二、隨機試驗(可重復(fù)、不可重復(fù))、事件(基本事件、復(fù)合事件;必然事件、不可能事件)三、概率第5章隨機試驗和隨機變量一、隨機現(xiàn)象在給定條件下,不有主觀概率和客觀概率之分。在以后章節(jié)中涉及到的概率是指客觀概率,即大量觀察條件下頻率的穩(wěn)定值。四、隨機變量及其分布
書中127頁第1個例子的隨機變量是“可能出現(xiàn)的點數(shù)”,第2個例子的隨機變量是“等待時間”,第3個例子的隨機變量是“取出球的顏色”。
從上述3個例子中可以看到例1和例3是離散型隨機變量,例2是連續(xù)型隨機變量。
我們通過“分布”來刻畫隨機變量的特征。也可以通過特征數(shù)來認識隨機變量的特征。有主觀概率和客觀概率之分。在以后章節(jié)中涉及到的概率是指客觀概第6章有限總體概率抽樣一、一般問題
抽取樣本時我們應(yīng)該作到:對每一次抽取行為都應(yīng)精心組織,使得此時尚留在總體中的所有單位都有可能被抽到,且有確定的,不等于零的被抽中的概率。
例如,一個籠子里裝有800只兔子,調(diào)查人員閉上眼睛將手伸入籠中抓取兔子的行為,是不是符合隨機抽取的原則。
正確的作法是:在800只兔子身上編上號碼,并做好800個鬮,放在盒子里充分攪勻,從盒子里隨機抽取一個號碼,號碼是幾,就從籠子中抓出相同號碼的兔子。這就符合隨機抽取的原則了。
如果向例子中所描述的那樣“閉上眼抓兔子”那屬于隨便抓取,因為在籠口附近的兔子被抓住的可能大于遠離籠口的兔子。第6章有限總體概率抽樣一、一般問題
等概率和不等概率抽樣的共同點:各單位都有確定的不等于零的被抽中的概率。二、一些基本概念
例:某微波爐生產(chǎn)廠家想要了解微波爐進入居民家庭生活的深度。為此從某地區(qū)已購買了微波爐的2200個居民戶中用簡單隨機抽樣方法以戶為單位抽取了30戶,詢問每戶一個月使用微波爐的時間。調(diào)查結(jié)果依次為(分鐘):45090050700400520600340280800750550201100440460580650430460450400360370560610710200試估計該地區(qū)已購買了微波爐的居民戶平均一戶一個月使用微波爐的時間,并以95.45%的置信概率做保證對平均使用微波爐的時間進行區(qū)間估計。等概率和不等概率抽樣的共同點:各單位都有確定的根據(jù)該例子我們來了解一下一些概念。1.題中的N=2200就是“有限總體”,n=30就是“概率樣本”。2.30戶居民的平均使用微波爐的時間:(分鐘)和方差是“統(tǒng)計量”。3.我們用樣本統(tǒng)計量作為對有限總體指標(biāo)的估計,用來表示,稱之為“估計量”。4.點估計:用樣本估計量及其觀察值來表達對總體指標(biāo)的估計。即5.區(qū)間估計:用一個取值區(qū)間來表達對總體指標(biāo)的估計。這個數(shù)值區(qū)間叫作置信區(qū)間。根據(jù)該例子我們來了解一下一些概念。1.題中的N=2200該題的置信區(qū)間為至
區(qū)間的左端為置信下限,右端為置信上限。式中的臨界值z,根據(jù)置信概率來確定。本題的樣本容量為30,屬大樣本,應(yīng)查標(biāo)準(zhǔn)正態(tài)分布表,不過本題給的置信概率所對應(yīng)的臨界值為常見值,即z=2。那么,將所知數(shù)據(jù)帶入置信區(qū)間得:
下限
上限該題的置信區(qū)間為如果我們的樣本容量n小于30,那么在確定臨界值時要改用自由度為n-1的t分布雙尾面積。即如果我們的已知資料是無限總體,樣本容量時,置信區(qū)間為,與有限總體相比少一個小尾巴。書后習(xí)題6.6和6.7便是無限總體。另外,對于對“總體總值、總體比例和相應(yīng)單位數(shù)目”的進行估計時,估計的情景和上述例子相似,可“以次類推”。如果我們的樣本容量n小于30,那么在確定臨界值時要改如果我們第7章顯著性檢驗的基本問題
顯著性檢驗又稱假設(shè)檢驗。就是事先對無限總體的參數(shù)或分布作出一個假設(shè),然后利用樣本信息來判斷這個假設(shè)是否合理。例如,咖啡的分袋包裝生產(chǎn)線按裝袋凈重150克的技術(shù)標(biāo)準(zhǔn)控制操作?,F(xiàn)從生產(chǎn)線抽取簡單隨機樣本n=100袋,測得其平均重量為克,樣本標(biāo)準(zhǔn)差s=0.872克。問該生產(chǎn)線是否處于控制狀態(tài)?(顯著水平為0.1)
根據(jù)上述問題,我們怎么引入顯著性檢驗這一問題呢?在給定的條件下,從生產(chǎn)線上生產(chǎn)的袋裝茶葉所組成的總體為無限總體,而裝袋凈重要符合技術(shù)標(biāo)準(zhǔn)的150克是對總體所做的假設(shè),我們稱之為原假設(shè),用來表示,但是如果裝袋凈重與技術(shù)標(biāo)準(zhǔn)的150克有出入,如何與原假設(shè)相協(xié)調(diào),那么還提出了備擇假設(shè),用表示。這樣原假設(shè)和備擇假設(shè)合在一起,就涵蓋了我們第7章顯著性檢驗的基本問題顯著性檢驗所研究的總體特征的所有可能性。結(jié)合例子,可以這樣表示原假設(shè)和備擇假設(shè)。其中,原假設(shè)指觀察到的差異只反映機會差異,即通過樣本數(shù)據(jù)計算的袋裝茶葉的平均凈重和總體平均凈重之間的差異,只是一個偶然變動造成的,不會影響整條生產(chǎn)線的質(zhì)量;備擇假設(shè)指觀察到的差異是真實的,即“樣本”的平均凈重和總體的平均凈重之間的差異,表明生產(chǎn)線上生產(chǎn)的袋裝茶葉的凈重已偏離了質(zhì)量技術(shù)標(biāo)準(zhǔn),應(yīng)該予以調(diào)整。
根據(jù)備擇假設(shè)確定是雙尾檢驗還是單尾檢驗。拒絕域位置
原假設(shè)
備擇假設(shè)雙尾
左單尾
右單尾所研究的總體特征的所有可能性。結(jié)合例子,可以這樣表示原假設(shè)和該題中的備擇假設(shè)為因此應(yīng)該采用雙尾檢驗。在原假設(shè)成立的情況下,我們?nèi)绾蝸順?gòu)造統(tǒng)計量呢?具體情況如下:
已知條件
統(tǒng)計量1.總體為正態(tài)分布,總體方差已知,不論樣本大小
(公式中的方差要用已知總體方差而不用)。2.總體分布未知,總體方差已知,大樣本
(公式中的方差要用已知總體方差而不用)。3.總體為正態(tài)分布,總體方差未知,小樣本4.總體分布未知,總體方差未知,大樣本
(這里要和第2種情況區(qū)別開,即方差用,而統(tǒng)計量用Z,而不是t。該題中的備擇假設(shè)為因此例題中的已知條件符合第4種情況,所以應(yīng)計算Z統(tǒng)計量,即:接下來根據(jù)給定的顯著水平和所構(gòu)造的統(tǒng)計量是Z還是t,是雙尾還是單尾,來確定臨界值。如果是Z統(tǒng)計量、雙尾,那么就查標(biāo)準(zhǔn)正態(tài)分布表:;若是單尾那么就查標(biāo)準(zhǔn)正態(tài)分布表:。如果是t統(tǒng)計量、雙尾,那么就查自由度為n-1的t分布表:;若是單尾,則查自由度為n-1的t分布表:。例題中所構(gòu)造的統(tǒng)計量是Z、雙尾,則應(yīng)查標(biāo)準(zhǔn)正態(tài)分布表例題中的已知條件符合第4種情況,所以應(yīng)計算Z統(tǒng)計量,即:有了臨界值,我們就可以依此來確定拒絕域和接受域。若是Z統(tǒng)計量、雙尾,則拒絕域為,;接受域為,本例題符合該條件,則將上面確定的臨界值1.645代入得,拒絕域為接受域為對于Z統(tǒng)計量、單尾;t統(tǒng)計量、雙尾或單尾過程和上述確定Z統(tǒng)計量、雙尾一樣,這里就不在重述。最后,將算出的統(tǒng)計量的具體值和確定的臨界值比較,即若,則落入拒絕域,結(jié)論為:樣本水平和總體水平之間存在著真實差異;若,則落入接受域,結(jié)論為樣本水平和總體水平之間的差異是機會差異。同樣對于對于Z統(tǒng)計量、單尾;t統(tǒng)計量、雙尾或單尾過程和上述確定Z統(tǒng)計量、雙尾一樣,這里就不在重述。有了臨界值,我們就可以依此來確定拒絕域和接受域。若是對于Z統(tǒng)例題中的統(tǒng)計量的具體數(shù)值那么落入拒絕域,則說明生產(chǎn)線生產(chǎn)的袋裝茶葉的平均重量已偏離了質(zhì)量技術(shù)標(biāo)準(zhǔn),應(yīng)予以調(diào)整。我們將上述過程根據(jù)例題再完整的敘述一下:1.提出假設(shè):2.構(gòu)造統(tǒng)計量:3.依給定的顯著水平,確定臨界值和拒絕域以及接受域4.作出判斷:因則落入拒絕域,則說明生產(chǎn)線生產(chǎn)的袋裝茶葉的平均重量已偏離了質(zhì)量技術(shù)標(biāo)準(zhǔn),應(yīng)予以調(diào)整。例題中的統(tǒng)計量的具體數(shù)值第8章兩個總體的比較第9章方差分析第10章皮爾遜檢驗
當(dāng)我們熟悉了“第7章顯著性檢驗”的問題后,第8、9、10三章就好處理了。因為這三章也是顯著性檢驗問題,只不過是檢驗的對象發(fā)生了變化,即兩總體(第8章)、多總體(第9章方差分析)以及獨立性檢驗和擬合優(yōu)度檢驗(第10章)。所以,我們將它們放在一起來講,使同學(xué)們的整體感更強些。第8章兩個總體的比較第9章方差分析第10章兩個總體
多總體比較
(方差分析)皮爾遜檢驗均值比較比例比較擬合優(yōu)度檢驗獨立性檢驗1.提出假設(shè)不全相等
服從正態(tài)分布不服從正態(tài)分布
變量之間獨立兩者不獨立2.構(gòu)造統(tǒng)計量3.給定顯著水平,確定臨界值和拒絕域根據(jù)備擇假設(shè)做雙尾或單尾檢驗.給定顯著水平確定臨界值和拒絕域同左因F的比值恒為正,則為右單尾,給定顯著性水平,確定臨界值和拒絕域。因值恒為正,則為右單尾,給定顯著水平,確定臨界值和拒絕域
同左4.根據(jù)上述結(jié)果作出結(jié)論若是雙尾拒絕原假設(shè)接受原假設(shè)若是單尾,略同左如果那么拒絕原假設(shè),如果那么接受原假設(shè)。如果則拒絕原假設(shè),若則接受原假設(shè)。同左均值比較比例比較擬合優(yōu)度檢驗獨立性檢驗服從
另外,(1)要注意方差分析中的因變量是數(shù)量型變量,自變量可以是品質(zhì)型變量,也可以是數(shù)量型變量;而獨立性檢驗中的因變量和自變量都是品質(zhì)型變量。(2)要理解方差分析中因子和處理的含義。每一“處理”就是一個總體。(3)要將方差分析表中的各數(shù)字的來源及它們之間的關(guān)系弄清。如:方差來源離差平方和自由度均方差F值組間變差SSR=7112.1423組內(nèi)變差MSE=2341.863總變差20另外,(1)要注意方差分析中的因變量是數(shù)量型變量如何將表中數(shù)字填全呢?1.組內(nèi)變差的自由度(m-1)=總變差的自由度(n-1)-組間變差的自由度(n-m)=20-3=17,2.因組內(nèi)均方差MSE=組內(nèi)方差SSE/m-1=2341.863所以組內(nèi)方差SSE=組內(nèi)均方差*自由度(m-1)=2341.863*17=39811.6673.總變差SST=組內(nèi)變差SSE+組間變差SSR=39811.667+7112.142=46923.814.組間均方差MSR=組間變差SSR/m-1=7112.142/3=2370.7145.F=MSR/MSE=2370.714/2341.863=1.06如何將表中數(shù)字填全呢?第12章統(tǒng)計指數(shù)
指數(shù)是反映復(fù)雜經(jīng)濟現(xiàn)象總體(即復(fù)雜總體)變動的特殊相對數(shù)。如果有限總體中的各個單位不能直接相加匯總得到總體單位總量,這樣的有限總體叫復(fù)雜總體。與之相對應(yīng)的是簡單總體。我們引入“同度量因素”這一概念,復(fù)雜總體中的各個單位就變得可以直接相加了。同度量因素是指使不能相加的事物過渡到可以直接相加的因素。弄清同度量因素的作用和選擇時應(yīng)遵循的條件,對同度量的理解更深刻。指數(shù)編制的基本途徑有兩個:一是綜合的方法,形成綜合指數(shù);一是平均的方法,形成平均指數(shù)。第12章統(tǒng)計指數(shù)指數(shù)是反映復(fù)雜經(jīng)濟現(xiàn)象總
在這一章節(jié)中要能準(zhǔn)確地區(qū)分數(shù)量指標(biāo)和質(zhì)量指標(biāo),這有助于計算指數(shù),還要能夠準(zhǔn)確地判斷分析對象是總量指標(biāo)還是平均指標(biāo),這有助于我們進行因素分析。我們以因素分析為例。例如,某企業(yè)工資和人數(shù)資料:分析由于各組平均工資和職工人數(shù)的變化對工資總額的影響。我們的分析對象是“工資總額”,這一指標(biāo)是總量指標(biāo),工資總額=職工人數(shù)*平均工資。應(yīng)選擇兩因素的綜合指數(shù)因素分析。職工分組工資總額(元)職工人數(shù)(人)基期報告期基期報告期中老年人青年人2100080003120025200300200400600合計29000564005001000在這一章節(jié)中要能準(zhǔn)確地區(qū)分數(shù)量指標(biāo)和質(zhì)量指標(biāo)
接上例,如果我們的問題是:分析職工總體內(nèi)部人數(shù)構(gòu)成和各組平均工資的變化對總平均工資的影響。那么我們的分析對象“總平均工資”是加權(quán)算術(shù)平均數(shù)(平均指標(biāo))??偲骄べY=工資總額/職工人數(shù)。應(yīng)選擇加權(quán)算術(shù)平均數(shù)變動的因素分析即接上例,如果我們的問題是:分析職工總體內(nèi)部人數(shù)構(gòu)
如習(xí)題12.14中題目的要求是(1)分析產(chǎn)量和單位成本的變動對總成本的影響。(2)分析產(chǎn)量和價格的變動對總產(chǎn)值的影響。要求(1)和(2)中的分析對象分別是“總成本”和“總產(chǎn)值”,這兩個指標(biāo)是都是總量指標(biāo)??偝杀?產(chǎn)量q*單位成本p;總產(chǎn)值=產(chǎn)量q*價格p。應(yīng)選擇綜合指數(shù)變動的因素分析。即:如習(xí)題12.19中題目的要求是對全廠的勞動生產(chǎn)率的變動進行因素分析。要求中的分析對象是“勞動生產(chǎn)率”,這一指標(biāo)是加權(quán)算術(shù)平均數(shù)(平均指標(biāo))勞動生產(chǎn)率=總產(chǎn)值或總產(chǎn)量/職工人數(shù)。應(yīng)選擇加權(quán)算術(shù)平均如習(xí)題12.14中題目的要求是(1)分析產(chǎn)量數(shù)變動的因素分析。即
平均指數(shù)是指個體指數(shù)的平均數(shù)。它在實際工作中應(yīng)用非常廣泛。那是因為(1)平均指數(shù)可以使用附加權(quán)數(shù),這就為通過分類選樣觀察一部分商品來計算全部商品的總指數(shù)提供了可能。(2)平均指數(shù)可以使用比重權(quán)數(shù),這個比重可以用抽樣調(diào)查資料來估計,同時通過比重權(quán)數(shù)可以反映總體中各個部分的相對重要性。習(xí)題12.2和12.3就是常見的平均指數(shù)在實際中的應(yīng)用,我們應(yīng)予以掌握。數(shù)變動的因素分析。即平均指數(shù)是指個體指數(shù)的平均
我們還可以根據(jù)指數(shù)進行推算或剔除價值量指標(biāo)中的價格因素。指數(shù)推算的例子:如習(xí)題12.9題目(1)的要求是以價格水平提高后同樣多的人民幣少購商品10%,求價格指數(shù)?該題目中的指數(shù)體系是:銷售額指數(shù)=銷售量指數(shù)*價格指數(shù)則價格指數(shù)=銷售額指數(shù)/銷售量指數(shù),根據(jù)題目中已知條件可知“以同樣多的人民幣”是銷售額指數(shù)100%,少購商品10%是銷售量指數(shù)110%,則將數(shù)據(jù)代入指數(shù)體系中得價格指數(shù)=100%/110%=90.91%.剔除價值量指標(biāo)中的價格因素的例子:如書中例12.8。題目的要求是剔除職工人均月生活費收入中價格因素的影響。1991年的人均月生活費收入為428.5元,但該年的價格水平也有所上升為100.5%,要想真實的衡量收入的提高情況,應(yīng)剔除價格的變化即:428.5/100.5%=426.4。我們還可以根據(jù)指數(shù)進行推算或剔除價值量指標(biāo)中的第13章時間數(shù)列數(shù)據(jù)研究
本章涉及三部分內(nèi)容:一是序時平均數(shù)的計算;二是增量與速度的計算;三是預(yù)測。一、序時平均數(shù)的計算1.“絕對數(shù)”的序時平均數(shù)的計算在這一問題中,關(guān)鍵是要能夠準(zhǔn)確地判斷出所要平均的絕對數(shù)的時間所屬性質(zhì)是“時期數(shù)”還是“時點數(shù)”。因為它們的計算公式有很大差別。比如,某企業(yè)2001年第一季度每月的鋼產(chǎn)量如表(萬噸)根據(jù)資料計算每月平均鋼產(chǎn)量。月份一二三鋼產(chǎn)量404642第13章時間數(shù)列數(shù)據(jù)研究本章涉及三部分
我們知道該題被平均的對象“鋼產(chǎn)量”是一“時期數(shù)”,用來表示,那么應(yīng)采用即平均鋼產(chǎn)量又如,某商店的商品庫存資料如下:(萬元)計算該商店第一季度的平均庫存額。我們知道該題被平均的對象“庫存額”是一“時點數(shù)”,用來表示,且各時點間的間隔都相等,那么采用月份一月初二月初三月初四月初庫存額20404060我們知道該題被平均的對象“鋼產(chǎn)量”是一“時期數(shù)即“首末折半”公式。代入數(shù)字得如果各時點間的間隔不相等,應(yīng)該用間隔的長短作權(quán)數(shù),采用書中(13.4)式來計算。這里就不詳述。2.“比”類型變量的序時平均數(shù)的計算某商店2001年第一季度各月商品流轉(zhuǎn)資料計算第一季平均每月流轉(zhuǎn)次數(shù)。1234商品銷售額(萬元)60120200---月初商品庫存額(萬元)20404060商品流轉(zhuǎn)次數(shù)(次)234---1234商品銷售額(萬元)60120200---月初商品庫存根據(jù)題目的要求我們可以采用如下步驟:(1)找出“比”類型變量的基本公式,如“周轉(zhuǎn)次數(shù)”這一“比”類型變量的基本公式=商品銷售額/平均商品庫存額。(2)正確判別基本公式中分子、分母的時間所屬性質(zhì)是時期數(shù)還是時點數(shù),時間間隔是否相等。本題的分子“商品銷售額”是時期數(shù),分母“庫存額”是時點數(shù),且間隔相等,(3)根據(jù)正確判別出的分子分母的時間所屬性質(zhì),分別對分子分母計算序時平均數(shù)。
分子的序時平均數(shù)
分母的序時平均數(shù)(4)將求得的分子分母的序時平均數(shù)按基本公式加以對比,根據(jù)題目的要求我們可以采用如下步驟:便是“比”類型變量的序時平均數(shù)。即二是增量與速度的計算年份199619971998199920002001國內(nèi)生產(chǎn)總值(億元)增長量(億元)逐期+3566累計+24447發(fā)展速度(%)環(huán)比110.15定基增長速度(%)環(huán)比7.80定基15.41增長1%的絕對值(億元)678.85便是“比”類型變量的序時平均數(shù)。即二是增量與速度的計算年1.將表中所缺數(shù)字填全,不能填寫的地方用“------”表示。其實,當(dāng)你將表中空缺填全后,增長量如何計算、發(fā)展速度和增長速度之間的關(guān)系自然而然就會明白。2.當(dāng)完成了上述工作之后還可以計算:(1)1996年至2001年間的平均增長量。(2)1996年至2001年間的平均發(fā)展速度和平均增長速度。(水平法)三、預(yù)測1.時間數(shù)列的類型:(1)水平型移動平均修勻適用的對象、意圖、思路。指數(shù)平滑平均修勻的公式指數(shù)平滑預(yù)測的公式1.將表中所缺數(shù)字填全,不能填寫的地方用“------”表示演講完畢,謝謝觀看!演講完畢,謝謝觀看!本資料來源本資料來源統(tǒng)計學(xué)教學(xué)課件天津財經(jīng)學(xué)院統(tǒng)計系高建國統(tǒng)計學(xué)天津財經(jīng)學(xué)院統(tǒng)計系第1章總論統(tǒng)計學(xué)是搜集數(shù)據(jù)、整理數(shù)據(jù)并從數(shù)據(jù)中獲取有用信息的一門方法論科學(xué)。我們從數(shù)據(jù)中獲取的有用信息是來說明社會經(jīng)濟現(xiàn)象總體
數(shù)量特征的。有限總體和無限總體(1)認識事物的現(xiàn)實狀況;(2)認識隨機現(xiàn)象的統(tǒng)計規(guī)律;(3)減少人們對某種系統(tǒng)知識的無知而產(chǎn)生的認識上的不確定性。第1章總論統(tǒng)計學(xué)是搜集數(shù)據(jù)、整理數(shù)據(jù)并從第2章數(shù)據(jù)的搜集一、一些基本概念總體單位總體標(biāo)志指標(biāo)數(shù)量指標(biāo)質(zhì)量指標(biāo)數(shù)量標(biāo)志品質(zhì)標(biāo)志數(shù)據(jù)的搜集也就是統(tǒng)計調(diào)查,它是保證我們獲取有用信息的關(guān)鍵。變量分為連續(xù)變量和離散變量,數(shù)量型和屬性變量第2章數(shù)據(jù)的搜集一、一些基本概念總體單例1:調(diào)查天津市工業(yè)企業(yè)2001年增加值的規(guī)模。總體是“全部工業(yè)企業(yè)”,總體單位是“每一工業(yè)企業(yè)”,標(biāo)志是“每一工業(yè)企業(yè)的增加值”——數(shù)量標(biāo)志,指標(biāo)是“增加值總和”——數(shù)量指標(biāo)。例2:調(diào)查天津市學(xué)齡兒童入學(xué)情況??傮w是“所有兒童”,總體單位是“每一個兒童”,標(biāo)志是“是否入學(xué)”——品質(zhì)標(biāo)志,指標(biāo)是“入學(xué)率”——質(zhì)量指標(biāo)。例3:調(diào)查天津市2001年居民年收入情況??傮w是“所有居民”,總體單位是“每位居民”,標(biāo)志是“每位居民的年收入”——數(shù)量標(biāo)志,指標(biāo)是年均收入———質(zhì)量指標(biāo)。例1:調(diào)查天津市工業(yè)企業(yè)2001年增加值的規(guī)模。例2:調(diào)查天二、統(tǒng)計分組1.將統(tǒng)計調(diào)查所獲取的零散的不系統(tǒng)的資料,按照一定的研究目的和任務(wù),進行加工和整理的一種行之有效的統(tǒng)計方法。它可以幫助我們完成4種任務(wù)。2.分組時應(yīng)該正確選擇分組標(biāo)志,以免不能準(zhǔn)確的完成4種任務(wù);同時應(yīng)遵循互斥性和包容性原則,以免重復(fù)或遺漏。3.組距式分組中,應(yīng)該弄清一些概念:組數(shù)、組距及組距的類型(如等組距、異組距、開口組距、閉口組距)、組限(上限、下限、如何確定組限)、組中值(它的假定性、開口組距的組中值如何計算、用組中值計算的平均數(shù)是一個準(zhǔn)確值嗎)。三、統(tǒng)計調(diào)查方案是在背景分析的前提下,制定出的周密完整的,以指導(dǎo)調(diào)查工作順利完成的一項計劃任務(wù)書。一項完整的統(tǒng)計調(diào)查方案包括8方面的內(nèi)容。二、統(tǒng)計分組1.將統(tǒng)計調(diào)查所獲取的零散的不系統(tǒng)的資料,按照一第3章數(shù)據(jù)和統(tǒng)計指標(biāo)的基本類型一、數(shù)據(jù)的類型
它分為總體總量和標(biāo)志總量(兩者要成對出現(xiàn)才能判斷,比如職工人數(shù)如何判斷,只有將它和工資總額或者和工業(yè)企業(yè)數(shù)結(jié)合在一起才能判斷出它的歸屬,即它和工資總額結(jié)合在一起,它是總體總量;它和工業(yè)企業(yè)數(shù)結(jié)合在一起,它是標(biāo)志總量);時期數(shù)又稱流量指標(biāo)和時點數(shù)又稱存量指標(biāo)(兩者判斷的正確與否對序時平均數(shù)的計算有至關(guān)重要的影響,序時平均數(shù)的計算將在第13章里講解,而如何判斷呢,二、指標(biāo)的類型
有數(shù)量型數(shù)據(jù)(用數(shù)來表示且數(shù)的計算有意義)和品質(zhì)型數(shù)據(jù)(用文字來表示也可用數(shù)來表示但數(shù)的計算沒有意義)。1.總量指標(biāo)第3章數(shù)據(jù)和統(tǒng)計指標(biāo)的基本類型一、數(shù)據(jù)的類型應(yīng)根據(jù)其特點即(1)與時間長短是否相關(guān),(2)前后時間上的數(shù)值相加是否有意義來判斷)。2.平均指標(biāo)
在同質(zhì)總體內(nèi),通過“填平補齊”,“取長補短”的方式,獲得的描繪總體一般水平的指標(biāo)。3.相對指標(biāo)
它有5種形式:動態(tài)相對指標(biāo),比較相對指標(biāo),計劃完成相對指標(biāo),結(jié)構(gòu)相對指標(biāo),強度相對指標(biāo)。
平均指標(biāo)和相對指標(biāo)統(tǒng)稱為比率型變量,我們在第4章里將涉及到這個概念,到時在詳談。應(yīng)根據(jù)其特點即(1)與時間長短是否相關(guān),(2)前后時間上的數(shù)第4章數(shù)據(jù)的描述性整理一、數(shù)據(jù)分布狀態(tài)的描述方法1.分布列:有品質(zhì)型和數(shù)量型分布列。它們是通過統(tǒng)計表來描述數(shù)據(jù)的分布狀態(tài)。
在這里還應(yīng)該弄清楚以下概念:次數(shù)又叫頻數(shù)、頻率、頻數(shù)密度、頻率密度。因為這些概念可以幫助我們了解數(shù)據(jù)的分布狀態(tài)。2.分布圖:有棒圖、直方圖、折線圖、曲線圖。它們是通過統(tǒng)計圖來描述數(shù)據(jù)的分布狀態(tài)。它們與分布列相比更加直觀。
畫圖時如果是等組距,那么可用頻數(shù)或頻率來做圖;如果是異組距,那么應(yīng)該用頻數(shù)密度或頻率密度來做圖。第4章數(shù)據(jù)的描述性整理一、數(shù)據(jù)分布狀態(tài)的描述方法二、數(shù)據(jù)分布的特征及特征數(shù)分布特征分布特征數(shù)位置特征平均數(shù)、中位數(shù)、眾數(shù)離散特征全距、平均差、標(biāo)準(zhǔn)差、離散系數(shù)偏斜特征偏態(tài)系數(shù)峰度特征峰度系數(shù)
三、幾種常用的位置特征數(shù)(一)平均數(shù)常見的有算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)。幾何平均數(shù)在第13章里會詳細加以解釋,這里主要講解前兩個。二、數(shù)據(jù)分布的特征及特征數(shù)分布特征對于絕對數(shù)和比率變量如何計算平均數(shù),我們可這樣做:1.先確定變量。根據(jù)題意平均“誰”,“誰”就是變量。比如,求平均日產(chǎn)量,則“日產(chǎn)量”就是變量;又如,求50家企業(yè)的平均計劃完成百分比,則“計劃完成百分比”就是變量。2.判別“所確定變量”的類型是絕對數(shù)變量,還是比率變量。3.如果是絕對數(shù)變量,那么權(quán)數(shù)是次數(shù)(頻數(shù))或頻率,并采用加權(quán)算術(shù)平均數(shù)的公式來計算。如:“日產(chǎn)量”是絕對數(shù)變量,則權(quán)數(shù)是各組的人數(shù)或人數(shù)比重。4.如果是比率變量,那么要找出比率變量的基本比式,然后再根據(jù)已知資料來確定權(quán)數(shù)和計算公式。如:“計劃完成百分比”是比率變量,其基本比式是實際數(shù)與對于絕對數(shù)和比率變量如何計算平均數(shù),我們可這樣做:1.先確定計劃數(shù)的比值。那么權(quán)數(shù)和公式這樣選擇:(1)若已知資料是比率變量和基本比式的分母資料,則權(quán)數(shù)為分母資料,用f表示,并采用加權(quán)算術(shù)平均數(shù)。(2)若已知資料是比率變量和基本比式的分子資料,則權(quán)數(shù)為分子資料,用M表示,并采用加權(quán)調(diào)和平均數(shù)。例如:通過調(diào)查獲取了15個企業(yè)的產(chǎn)值計劃執(zhí)行情況,如下表(單位:萬元)計劃完成% 企業(yè)數(shù) 計劃產(chǎn)值80——902 10090——1003 200100——1106 400110以上4300
合計 15 1000計算15個企業(yè)的平均計劃完成百分比。計劃數(shù)的比值。那么權(quán)數(shù)和公式這樣選擇:(1)若已知資料是比率(1)在這道題中,我們平均的是“計劃完成百分比”,那么,它就是變量,用x表示,變量值為各組的組中值。(2)該變量的性質(zhì)是比率變量,其基本比式是實際產(chǎn)值與計劃產(chǎn)值之比。(3)從已知資料中可知條件是比率變量和基本比式的分母資料,則權(quán)數(shù)是分母資料“計劃產(chǎn)值”,用f來表示,采用加權(quán)算術(shù)平均數(shù)公式來計算即可。(二)中位數(shù)
平均數(shù)的著眼點在于抵消各觀察值之間的數(shù)量差異,表明將各個觀察值“截長補短”以后的平均水平。中位數(shù)的著眼點在于尋求全部觀察值按其大小順序排列,居中間位置的一般水平。例如:人口的年齡分布往往近似J型:嬰兒數(shù)最多,隨著年齡的增大,人數(shù)逐漸下降,到了百歲左右,所剩的人(1)在這道題中,我們平均的是“計劃完成百分比”,那么,它就(三)眾數(shù)
眾數(shù)的著眼點在于尋求各組中頻數(shù)最多的觀察值。用來反映要了解的現(xiàn)象中最普通、最常見的數(shù)值水平。數(shù)就很少了。如果計算年齡的算術(shù)平均數(shù),老年人口數(shù)雖然較少,但其年齡數(shù)值很高,這樣一來,計算的平均年齡就會偏向老年一方。因此,各國的人口統(tǒng)計資料中,平均年齡的計算一般采用中位數(shù)。
比如,一位食品部經(jīng)理想按照預(yù)期的銷售量來分配貨物架的空間。從這個意義上來說,我們應(yīng)該依據(jù)眾數(shù),而不是平均數(shù)或中位數(shù)來確定,即過去具有最高銷售量的食品將得到最大限度的貨物架空間。
又如,如果你的業(yè)務(wù)是提供足球運動衫的號碼,那么,哪一種度量對你來說更為有用:平均數(shù)、中位數(shù)或眾數(shù)?當(dāng)然是眾數(shù)。(三)眾數(shù)眾數(shù)的著眼點在于尋求各組中頻數(shù)最四、離散特征數(shù)有4種:一是全距:在實際生產(chǎn)中稱之為極差,用R表示。
二是平均差:有簡單式和加權(quán)式之分。當(dāng)平均數(shù)是簡單算術(shù)平均數(shù)時,平均差便采用簡單式;當(dāng)平均數(shù)是加權(quán)算術(shù)平均數(shù)時,平均差便采用加權(quán)式。
三是標(biāo)準(zhǔn)差(方差):也有簡單式和加權(quán)式之分。和平均差一樣,選擇哪種形式要依賴于平均數(shù)的計算。
四是離散系數(shù):有全距系數(shù)、平均差系數(shù)和標(biāo)準(zhǔn)差系數(shù)。一般地,標(biāo)準(zhǔn)差系數(shù)的應(yīng)用場合較多。
例1.甲、乙兩個企業(yè)平均每月的勞動生產(chǎn)率都是8000元,它們的標(biāo)準(zhǔn)差分別是320元和240元,那么哪個企業(yè)的勞動生產(chǎn)率的代表性更強?
對于這種情況,因為甲乙兩個企業(yè)的總體平均水平是相同的,所以,我們可以直接根據(jù)標(biāo)準(zhǔn)差的大小來判別乙企四、離散特征數(shù)有4種:一是全距:在實際生產(chǎn)中稱之為極差,用R業(yè)的勞動生產(chǎn)率的代表性強。
例2.A、B兩個商場2000年平均每月的銷售額分別為16000元和8000元,它們的標(biāo)準(zhǔn)差各為320元和240元,那么哪個商場的銷售額穩(wěn)定些?
例3.對某系一年級的100名男生進行調(diào)查,得到平均身高為172厘米,平均體重68公斤,各自的標(biāo)準(zhǔn)差分別為6厘米和4公斤,那么100名男生的身高和體重何者離散較嚴重?
對于例2和例3這兩種情況,由于面對的一個是兩個總體水平相差很懸殊,一個是兩個總體的性質(zhì)或計量單位不同,我們不能直接根據(jù)已知的標(biāo)準(zhǔn)差的大小來判別總體內(nèi)變量值的離散程度,應(yīng)該計算兩個總體各自的標(biāo)準(zhǔn)差系數(shù)。結(jié)果是例2中,A商場的標(biāo)準(zhǔn)差系數(shù)是2%,B商場的標(biāo)準(zhǔn)差系數(shù)是3%,即A商場的銷售額穩(wěn)定。例3中,身高的標(biāo)準(zhǔn)差系數(shù)是3.49%,體重的標(biāo)準(zhǔn)差系數(shù)是5.88%,即100名男生體重的離散較嚴重。業(yè)的勞動生產(chǎn)率的代表性強。例2.A、B兩個商場200第5章隨機試驗和隨機變量一、隨機現(xiàn)象在給定條件下,不能確切預(yù)見其結(jié)果的現(xiàn)象。1.由于存在著不能確定的和不能完全預(yù)見的偶然性的影響因素,隨機現(xiàn)象便產(chǎn)生了。2.隨機現(xiàn)象具有一定的規(guī)律性。規(guī)律值附近發(fā)生的可能大,規(guī)律值遠處發(fā)生的可能小。3.要保證給定的條件是相同的。二、隨機試驗(可重復(fù)、不可重復(fù))、事件(基本事件、復(fù)合事件;必然事件、不可能事件)三、概率第5章隨機試驗和隨機變量一、隨機現(xiàn)象在給定條件下,不有主觀概率和客觀概率之分。在以后章節(jié)中涉及到的概率是指客觀概率,即大量觀察條件下頻率的穩(wěn)定值。四、隨機變量及其分布
書中127頁第1個例子的隨機變量是“可能出現(xiàn)的點數(shù)”,第2個例子的隨機變量是“等待時間”,第3個例子的隨機變量是“取出球的顏色”。
從上述3個例子中可以看到例1和例3是離散型隨機變量,例2是連續(xù)型隨機變量。
我們通過“分布”來刻畫隨機變量的特征。也可以通過特征數(shù)來認識隨機變量的特征。有主觀概率和客觀概率之分。在以后章節(jié)中涉及到的概率是指客觀概第6章有限總體概率抽樣一、一般問題
抽取樣本時我們應(yīng)該作到:對每一次抽取行為都應(yīng)精心組織,使得此時尚留在總體中的所有單位都有可能被抽到,且有確定的,不等于零的被抽中的概率。
例如,一個籠子里裝有800只兔子,調(diào)查人員閉上眼睛將手伸入籠中抓取兔子的行為,是不是符合隨機抽取的原則。
正確的作法是:在800只兔子身上編上號碼,并做好800個鬮,放在盒子里充分攪勻,從盒子里隨機抽取一個號碼,號碼是幾,就從籠子中抓出相同號碼的兔子。這就符合隨機抽取的原則了。
如果向例子中所描述的那樣“閉上眼抓兔子”那屬于隨便抓取,因為在籠口附近的兔子被抓住的可能大于遠離籠口的兔子。第6章有限總體概率抽樣一、一般問題
等概率和不等概率抽樣的共同點:各單位都有確定的不等于零的被抽中的概率。二、一些基本概念
例:某微波爐生產(chǎn)廠家想要了解微波爐進入居民家庭生活的深度。為此從某地區(qū)已購買了微波爐的2200個居民戶中用簡單隨機抽樣方法以戶為單位抽取了30戶,詢問每戶一個月使用微波爐的時間。調(diào)查結(jié)果依次為(分鐘):45090050700400520600340280800750550201100440460580650430460450400360370560610710200試估計該地區(qū)已購買了微波爐的居民戶平均一戶一個月使用微波爐的時間,并以95.45%的置信概率做保證對平均使用微波爐的時間進行區(qū)間估計。等概率和不等概率抽樣的共同點:各單位都有確定的根據(jù)該例子我們來了解一下一些概念。1.題中的N=2200就是“有限總體”,n=30就是“概率樣本”。2.30戶居民的平均使用微波爐的時間:(分鐘)和方差是“統(tǒng)計量”。3.我們用樣本統(tǒng)計量作為對有限總體指標(biāo)的估計,用來表示,稱之為“估計量”。4.點估計:用樣本估計量及其觀察值來表達對總體指標(biāo)的估計。即5.區(qū)間估計:用一個取值區(qū)間來表達對總體指標(biāo)的估計。這個數(shù)值區(qū)間叫作置信區(qū)間。根據(jù)該例子我們來了解一下一些概念。1.題中的N=2200該題的置信區(qū)間為至
區(qū)間的左端為置信下限,右端為置信上限。式中的臨界值z,根據(jù)置信概率來確定。本題的樣本容量為30,屬大樣本,應(yīng)查標(biāo)準(zhǔn)正態(tài)分布表,不過本題給的置信概率所對應(yīng)的臨界值為常見值,即z=2。那么,將所知數(shù)據(jù)帶入置信區(qū)間得:
下限
上限該題的置信區(qū)間為如果我們的樣本容量n小于30,那么在確定臨界值時要改用自由度為n-1的t分布雙尾面積。即如果我們的已知資料是無限總體,樣本容量時,置信區(qū)間為,與有限總體相比少一個小尾巴。書后習(xí)題6.6和6.7便是無限總體。另外,對于對“總體總值、總體比例和相應(yīng)單位數(shù)目”的進行估計時,估計的情景和上述例子相似,可“以次類推”。如果我們的樣本容量n小于30,那么在確定臨界值時要改如果我們第7章顯著性檢驗的基本問題
顯著性檢驗又稱假設(shè)檢驗。就是事先對無限總體的參數(shù)或分布作出一個假設(shè),然后利用樣本信息來判斷這個假設(shè)是否合理。例如,咖啡的分袋包裝生產(chǎn)線按裝袋凈重150克的技術(shù)標(biāo)準(zhǔn)控制操作?,F(xiàn)從生產(chǎn)線抽取簡單隨機樣本n=100袋,測得其平均重量為克,樣本標(biāo)準(zhǔn)差s=0.872克。問該生產(chǎn)線是否處于控制狀態(tài)?(顯著水平為0.1)
根據(jù)上述問題,我們怎么引入顯著性檢驗這一問題呢?在給定的條件下,從生產(chǎn)線上生產(chǎn)的袋裝茶葉所組成的總體為無限總體,而裝袋凈重要符合技術(shù)標(biāo)準(zhǔn)的150克是對總體所做的假設(shè),我們稱之為原假設(shè),用來表示,但是如果裝袋凈重與技術(shù)標(biāo)準(zhǔn)的150克有出入,如何與原假設(shè)相協(xié)調(diào),那么還提出了備擇假設(shè),用表示。這樣原假設(shè)和備擇假設(shè)合在一起,就涵蓋了我們第7章顯著性檢驗的基本問題顯著性檢驗所研究的總體特征的所有可能性。結(jié)合例子,可以這樣表示原假設(shè)和備擇假設(shè)。其中,原假設(shè)指觀察到的差異只反映機會差異,即通過樣本數(shù)據(jù)計算的袋裝茶葉的平均凈重和總體平均凈重之間的差異,只是一個偶然變動造成的,不會影響整條生產(chǎn)線的質(zhì)量;備擇假設(shè)指觀察到的差異是真實的,即“樣本”的平均凈重和總體的平均凈重之間的差異,表明生產(chǎn)線上生產(chǎn)的袋裝茶葉的凈重已偏離了質(zhì)量技術(shù)標(biāo)準(zhǔn),應(yīng)該予以調(diào)整。
根據(jù)備擇假設(shè)確定是雙尾檢驗還是單尾檢驗。拒絕域位置
原假設(shè)
備擇假設(shè)雙尾
左單尾
右單尾所研究的總體特征的所有可能性。結(jié)合例子,可以這樣表示原假設(shè)和該題中的備擇假設(shè)為因此應(yīng)該采用雙尾檢驗。在原假設(shè)成立的情況下,我們?nèi)绾蝸順?gòu)造統(tǒng)計量呢?具體情況如下:
已知條件
統(tǒng)計量1.總體為正態(tài)分布,總體方差已知,不論樣本大小
(公式中的方差要用已知總體方差而不用)。2.總體分布未知,總體方差已知,大樣本
(公式中的方差要用已知總體方差而不用)。3.總體為正態(tài)分布,總體方差未知,小樣本4.總體分布未知,總體方差未知,大樣本
(這里要和第2種情況區(qū)別開,即方差用,而統(tǒng)計量用Z,而不是t。該題中的備擇假設(shè)為因此例題中的已知條件符合第4種情況,所以應(yīng)計算Z統(tǒng)計量,即:接下來根據(jù)給定的顯著水平和所構(gòu)造的統(tǒng)計量是Z還是t,是雙尾還是單尾,來確定臨界值。如果是Z統(tǒng)計量、雙尾,那么就查標(biāo)準(zhǔn)正態(tài)分布表:;若是單尾那么就查標(biāo)準(zhǔn)正態(tài)分布表:。如果是t統(tǒng)計量、雙尾,那么就查自由度為n-1的t分布表:;若是單尾,則查自由度為n-1的t分布表:。例題中所構(gòu)造的統(tǒng)計量是Z、雙尾,則應(yīng)查標(biāo)準(zhǔn)正態(tài)分布表例題中的已知條件符合第4種情況,所以應(yīng)計算Z統(tǒng)計量,即:有了臨界值,我們就可以依此來確定拒絕域和接受域。若是Z統(tǒng)計量、雙尾,則拒絕域為,;接受域為,本例題符合該條件,則將上面確定的臨界值1.645代入得,拒絕域為接受域為對于Z統(tǒng)計量、單尾;t統(tǒng)計量、雙尾或單尾過程和上述確定Z統(tǒng)計量、雙尾一樣,這里就不在重述。最后,將算出的統(tǒng)計量的具體值和確定的臨界值比較,即若,則落入拒絕域,結(jié)論為:樣本水平和總體水平之間存在著真實差異;若,則落入接受域,結(jié)論為樣本水平和總體水平之間的差異是機會差異。同樣對于對于Z統(tǒng)計量、單尾;t統(tǒng)計量、雙尾或單尾過程和上述確定Z統(tǒng)計量、雙尾一樣,這里就不在重述。有了臨界值,我們就可以依此來確定拒絕域和接受域。若是對于Z統(tǒng)例題中的統(tǒng)計量的具體數(shù)值那么落入拒絕域,則說明生產(chǎn)線生產(chǎn)的袋裝茶葉的平均重量已偏離了質(zhì)量技術(shù)標(biāo)準(zhǔn),應(yīng)予以調(diào)整。我們將上述過程根據(jù)例題再完整的敘述一下:1.提出假設(shè):2.構(gòu)造統(tǒng)計量:3.依給定的顯著水平,確定臨界值和拒絕域以及接受域4.作出判斷:因則落入拒絕域,則說明生產(chǎn)線生產(chǎn)的袋裝茶葉的平均重量已偏離了質(zhì)量技術(shù)標(biāo)準(zhǔn),應(yīng)予以調(diào)整。例題中的統(tǒng)計量的具體數(shù)值第8章兩個總體的比較第9章方差分析第10章皮爾遜檢驗
當(dāng)我們熟悉了“第7章顯著性檢驗”的問題后,第8、9、10三章就好處理了。因為這三章也是顯著性檢驗問題,只不過是檢驗的對象發(fā)生了變化,即兩總體(第8章)、多總體(第9章方差分析)以及獨立性檢驗和擬合優(yōu)度檢驗(第10章)。所以,我們將它們放在一起來講,使同學(xué)們的整體感更強些。第8章兩個總體的比較第9章方差分析第10章兩個總體
多總體比較
(方差分析)皮爾遜檢驗均值比較比例比較擬合優(yōu)度檢驗獨立性檢驗1.提出假設(shè)不全相等
服從正態(tài)分布不服從正態(tài)分布
變量之間獨立兩者不獨立2.構(gòu)造統(tǒng)計量3.給定顯著水平,確定臨界值和拒絕域根據(jù)備擇假設(shè)做雙尾或單尾檢驗.給定顯著水平確定臨界值和拒絕域同左因F的比值恒為正,則為右單尾,給定顯著性水平,確定臨界值和拒絕域。因值恒為正,則為右單尾,給定顯著水平,確定臨界值和拒絕域
同左4.根據(jù)上述結(jié)果作出結(jié)論若是雙尾拒絕原假設(shè)接受原假設(shè)若是單尾,略同左如果那么拒絕原假設(shè),如果那么接受原假設(shè)。如果則拒絕原假設(shè),若則接受原假設(shè)。同左均值比較比例比較擬合優(yōu)度檢驗獨立性檢驗服從
另外,(1)要注意方差分析中的因變量是數(shù)量型變量,自變量可以是品質(zhì)型變量,也可以是數(shù)量型變量;而獨立性檢驗中的因變量和自變量都是品質(zhì)型變量。(2)要理解方差分析中因子和處理的含義。每一“處理”就是一個總體。(3)要將方差分析表中的各數(shù)字的來源及它們之間的關(guān)系弄清。如:方差來源離差平方和自由度均方差F值組間變差SSR=7112.1423組內(nèi)變差MSE=2341.863總變差20另外,(1)要注意方差分析中的因變量是數(shù)量型變量如何將表中數(shù)字填全呢?1.組內(nèi)變差的自由度(m-1)=總變差的自由度(n-1)-組間變差的自由度(n-m)=20-3=17,2.因組內(nèi)均方差MSE=組內(nèi)方差SSE/m-1=2341.863所以組內(nèi)方差SSE=組內(nèi)均方差*自由度(m-1)=2341.863*17=39811.6673.總變差SST=組內(nèi)變差SSE+組間變差SSR=39811.667+7112.142=46923.814.組間均方差MSR=組間變差SSR/m-1=7112.142/3=2370.7145.F=MSR/MSE=2370.714/2341.863=1.06如何將表中數(shù)字填全呢?第12章統(tǒng)計指數(shù)
指數(shù)是反映復(fù)雜經(jīng)濟現(xiàn)象總體(即復(fù)雜總體)變動的特殊相對數(shù)。如果有限總體中的各個單位不能直接相加匯總得到總體單位總量,這樣的有限總體叫復(fù)雜總體。與之相對應(yīng)的是簡單總體。我們引入“同度量因素”這一概念,復(fù)雜總體中的各個單位就變得可以直接相加了。同度量因素是指使不能相加的事物過渡到可以直接相加的因素。弄清同度量因素的作用和選擇時應(yīng)遵循的條件,對同度量的理解更深刻。指數(shù)編制的基本途徑有兩個:一是綜合的方法,形成綜合指數(shù);一是平均的方法,形成平均指數(shù)。第12章統(tǒng)計指數(shù)指數(shù)是反映復(fù)雜經(jīng)濟現(xiàn)象總
在這一章節(jié)中要能準(zhǔn)確地區(qū)分數(shù)量指標(biāo)和質(zhì)量指標(biāo),這有助于計算指數(shù),還要能夠準(zhǔn)確地判斷分析對象是總量指標(biāo)還是平均指標(biāo),這有助于我們進行因素分析。我們以因素分析為例。例如,某企業(yè)工資和人數(shù)資料:分析由于各組平均工資和職工人數(shù)的變化對工資總額的影響。我們的分析對象是“工資總額”,這一指標(biāo)是總量指標(biāo),工資總額=職工人數(shù)*平均工資。應(yīng)選擇兩因素的綜合指數(shù)因素分析。職工分組工資總額(元)職工人數(shù)(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《認真學(xué)習(xí)》課件
- 《教你如何看化驗單》課件
- 體育類開題報告范文
- 2024學(xué)年齊魯名校高三語文(上)12月聯(lián)考試卷附答案解析
- 生物研究的報告范文
- 《保健蘆薈知識》課件
- 專題09 統(tǒng)計與概率(解析版)
- 部門供職報告范文
- 2025年防城港貨運從業(yè)資格證
- 范文研究報告
- 《管理會計》說課及試講
- 項目介紹書范文
- 2024年《建筑節(jié)能》理論考試題庫(濃縮500題)
- 部編版八年級上冊歷史問答式復(fù)習(xí)提綱
- 污水處理廠調(diào)試及試運行方案
- 考試 (82)附有答案
- 金葡萄石分級編制說明
- 會計師事務(wù)所的年度工作總結(jié)
- 六年級數(shù)學(xué)上冊期末考試題(A4打印版)
- 2024年中考作文十二大高頻熱點主題9-家國情懷(素材)
- 中國裝備智慧樹知到期末考試答案章節(jié)答案2024年上海電機學(xué)院
評論
0/150
提交評論