應(yīng)用統(tǒng)計(jì)學(xué)課件_第1頁
應(yīng)用統(tǒng)計(jì)學(xué)課件_第2頁
應(yīng)用統(tǒng)計(jì)學(xué)課件_第3頁
應(yīng)用統(tǒng)計(jì)學(xué)課件_第4頁
應(yīng)用統(tǒng)計(jì)學(xué)課件_第5頁
已閱讀5頁,還剩568頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)數(shù)據(jù)的收集與整理第一節(jié)統(tǒng)計(jì)數(shù)據(jù)收集第二節(jié)統(tǒng)計(jì)數(shù)據(jù)整理第三節(jié)統(tǒng)計(jì)數(shù)據(jù)表現(xiàn)形式第四節(jié)統(tǒng)計(jì)數(shù)據(jù)特征描述本章小節(jié)主要內(nèi)容第二章統(tǒng)計(jì)數(shù)據(jù)的收集與整理加工整理,歸并匯總,重新排列調(diào)查得到的原始統(tǒng)計(jì)資料發(fā)現(xiàn)數(shù)據(jù)的規(guī)律性,作進(jìn)一步的統(tǒng)計(jì)分析第一節(jié)統(tǒng)計(jì)數(shù)據(jù)收集一、收集資科的方式

取得統(tǒng)計(jì)數(shù)據(jù)有多種途徑,但概括起來不外乎是直接方式和間接方式。(一)統(tǒng)計(jì)資料的直接收集

直接獲取第一手統(tǒng)計(jì)資料的主要方法包括:統(tǒng)計(jì)調(diào)查和試驗(yàn)設(shè)計(jì)。統(tǒng)計(jì)調(diào)查的方式主要有

普查抽樣調(diào)查重點(diǎn)調(diào)查統(tǒng)計(jì)報(bào)表制度。調(diào)查方式方法統(tǒng)計(jì)調(diào)查的方式統(tǒng)計(jì)報(bào)表制度專門組織的統(tǒng)計(jì)調(diào)查普查重點(diǎn)調(diào)查抽樣調(diào)查…(一)統(tǒng)計(jì)資料的直接收集普查

普查是專門組織的一次性的全面調(diào)查,用來調(diào)查屬于—定時(shí)點(diǎn)上或時(shí)期內(nèi)的社會(huì)經(jīng)濟(jì)現(xiàn)象的總量。

抽樣調(diào)查

抽樣調(diào)查是一種非全面調(diào)查,它是按照隨機(jī)的原則,從總體中抽取一部分單位作為樣本來進(jìn)行觀測(cè)研究,以抽樣樣本的指標(biāo)去推算總體指標(biāo)的一種調(diào)查。重點(diǎn)調(diào)查

重點(diǎn)調(diào)查的組織方式有兩種:一種是專門組織的一次性調(diào)查;另一種是利用定期統(tǒng)計(jì)報(bào)表經(jīng)常性地對(duì)一些重點(diǎn)單位進(jìn)行調(diào)查。統(tǒng)計(jì)報(bào)表制度

統(tǒng)計(jì)報(bào)表制度是根據(jù)國家有關(guān)統(tǒng)計(jì)法的規(guī)定,依據(jù)自上而下統(tǒng)一規(guī)定的表格形式、項(xiàng)目及其指標(biāo)、報(bào)送時(shí)間與程序布置調(diào)查要求和任務(wù),自下而上逐級(jí)匯總上報(bào)的統(tǒng)計(jì)報(bào)表制度。(一)統(tǒng)計(jì)資料的直接收集試驗(yàn)設(shè)計(jì)

科學(xué)試驗(yàn)是進(jìn)行科學(xué)研究的重要手段,在許多學(xué)科中幾乎都起著積極的作用。統(tǒng)計(jì)中的試驗(yàn)設(shè)計(jì)是科學(xué)試驗(yàn)研究的組成部分之一。試驗(yàn)設(shè)計(jì),包括五個(gè)相互關(guān)聯(lián)的環(huán)節(jié),分別是:方案設(shè)計(jì)方案實(shí)施數(shù)據(jù)采集數(shù)據(jù)分析優(yōu)化生產(chǎn)

凡不是通過直接的統(tǒng)計(jì)調(diào)查和試驗(yàn),而是從其他各種渠道搜集的第二手資料,我們把它總稱為統(tǒng)計(jì)資料的間接收集。

間接資料的來源大體包括:統(tǒng)計(jì)年鑒、統(tǒng)計(jì)摘要、統(tǒng)計(jì)資料匯編、統(tǒng)計(jì)臺(tái)賬、統(tǒng)計(jì)公告、報(bào)紙、雜志、網(wǎng)上資料等。

(一)統(tǒng)計(jì)資料的間接收集二、收集資料的方法

數(shù)據(jù)資料的收集方法可以分為初級(jí)資料收集方法和次級(jí)資料收集方法或稱文案資料。初級(jí)資料收集方法訪問法

訪問法是按所擬調(diào)查事項(xiàng),有計(jì)劃地通過訪談詢問方式向被調(diào)查者提出問題,通過他們的回答來獲得有關(guān)信息資料的方法。

按訪問內(nèi)容的傳遞方式不同,可分為:

面談?wù){(diào)查、電話調(diào)查、郵寄調(diào)查、留置調(diào)查、日記調(diào)查和網(wǎng)上調(diào)查等方法。二、收集資料的方法觀測(cè)法

觀測(cè)法是指調(diào)查者通過直接觀測(cè)、跟蹤和記錄被調(diào)查者的情況來收集資料的—種調(diào)查方法。報(bào)告法

報(bào)告法是由報(bào)告單位根據(jù)原始記錄和核算資料,按照統(tǒng)計(jì)機(jī)關(guān)頒發(fā)的統(tǒng)—的表格和要求,按—定的報(bào)送程序提供資料的方法。次級(jí)資料收集方法

次級(jí)資料又稱二手資料,是指他人為了他自己的研究目的而調(diào)查、整理的資科。三、統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量問題

統(tǒng)計(jì)的整個(gè)工作過程就是對(duì)數(shù)據(jù)的加工過程,從原始數(shù)據(jù)的收集開始,經(jīng)過整理、顯示、樣本信息的獲取到總體數(shù)量規(guī)律性的科學(xué)推斷,都有一個(gè)減少誤差、提高數(shù)據(jù)質(zhì)量的問題。也就是說,統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量控制問題是貫穿于統(tǒng)計(jì)全過程的重要問題,因此,加強(qiáng)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的管理要體現(xiàn)在統(tǒng)計(jì)研究的全過程。主要任務(wù)資料審核、分組、匯總、制表、制圖等。分組頻數(shù)分布統(tǒng)計(jì)表統(tǒng)計(jì)圖第二節(jié)統(tǒng)計(jì)數(shù)據(jù)整理

第二節(jié)統(tǒng)計(jì)數(shù)據(jù)整理

一、統(tǒng)計(jì)分組

統(tǒng)計(jì)分組是根據(jù)統(tǒng)計(jì)研究目的,將總體按一定標(biāo)志區(qū)分為不同類型或不同性質(zhì)的組,使組與組之間有比較明顯的差別,而在同一組內(nèi)的單位具有相對(duì)的同質(zhì)性,即同一組內(nèi)各單位之間具有某些共同的特征。

(一)統(tǒng)計(jì)分組原則根據(jù)統(tǒng)計(jì)研究的目的選擇分組標(biāo)志選擇能夠反映現(xiàn)象總體本質(zhì)特征的標(biāo)志考慮現(xiàn)象所處的具體時(shí)間、地點(diǎn)、條件來分組滿足完備性、互斥性及一致性第二節(jié)統(tǒng)計(jì)數(shù)據(jù)整理

(二)統(tǒng)計(jì)分組的方法按標(biāo)志的特征分組

總體單位的各個(gè)標(biāo)志按分組標(biāo)志的特征分組區(qū)分為品質(zhì)標(biāo)志和數(shù)量標(biāo)志。按分組標(biāo)志數(shù)量分組

統(tǒng)計(jì)分組按分組標(biāo)志多少不同,可分為簡(jiǎn)單分組和復(fù)合分組。第二節(jié)統(tǒng)計(jì)數(shù)據(jù)整理簡(jiǎn)單分組簡(jiǎn)單分組是對(duì)研究對(duì)象按照一個(gè)標(biāo)志進(jìn)行的分組。例如某高校職工按照性別或者職稱進(jìn)行的分組,如表2.2.1、2.2.2所示。第二節(jié)統(tǒng)計(jì)數(shù)據(jù)整理復(fù)合分組

復(fù)合分組是對(duì)研究對(duì)象按兩個(gè)或兩個(gè)以上的標(biāo)志層疊起來進(jìn)行的分組。即先按一個(gè)標(biāo)志進(jìn)行分組,然后再按另一個(gè)標(biāo)志在已分好的各個(gè)組內(nèi)劃分成若干個(gè)小組。例如企業(yè)職工按性別分組后,在每組內(nèi)再按年齡分組,如表2.2.3所示。

第二節(jié)統(tǒng)計(jì)數(shù)據(jù)整理(三)統(tǒng)計(jì)分組體系統(tǒng)計(jì)分組體系有兩種:平行分組體系和復(fù)合分組體系,如圖2.2.1、2.2.2所示。(三)統(tǒng)計(jì)分組體系二、分布數(shù)列

將統(tǒng)計(jì)總體按某一標(biāo)志分組后,用來反映總體單位在各組中分配情況的數(shù)列叫分配數(shù)列。分配在各組的總體單位數(shù)叫次數(shù)或頻數(shù)。各組次數(shù)與總次數(shù)的比值稱為頻率。

(一)分布數(shù)列的分類根據(jù)分組標(biāo)志的不同,分配數(shù)列可以分為品質(zhì)分配數(shù)列和變量分配數(shù)列兩種。(一)分布數(shù)列的分類品質(zhì)數(shù)列按品質(zhì)標(biāo)志分組所形成的分布數(shù)列稱品質(zhì)分布數(shù)列或?qū)傩苑植紨?shù)列,簡(jiǎn)稱品質(zhì)數(shù)列。它是由總體各組名稱及各組總體單位數(shù)(次數(shù))組成,如表2.2.4所示。

(一)分布數(shù)列的分類

變量數(shù)列

按數(shù)量標(biāo)志分組形成的分布數(shù)列,稱為變量分配數(shù)列,簡(jiǎn)稱變量數(shù)列。它由各組變量值及各組總體單位數(shù)(次數(shù))組成。

變量數(shù)列按照用以分組的變量的表現(xiàn)形式,可分為單項(xiàng)數(shù)列和組距數(shù)列兩種。單項(xiàng)數(shù)列就是指以一個(gè)變量值代表一組而編制的變量數(shù)列,如表2.2.5所示。

確定組數(shù)k找出xmin與xmax計(jì)算組距h確定每組上下限將相應(yīng)數(shù)據(jù)歸并到各組(二)分布數(shù)列的編制Xmin

最小值,xmax

最大值某校200個(gè)學(xué)生大學(xué)英語考試成績的頻數(shù)分布表分?jǐn)?shù)人數(shù)(f)分?jǐn)?shù)人數(shù)(f)40—45176—812546—51082—874252—571288—931058—632994—991164—6928100—105370—7539總數(shù)200(二)分布數(shù)列的編制(二)分布數(shù)列的編制

組距數(shù)列的分類

組距數(shù)列可分為等距分組和異距分組。

等距分組即各組組距相等的分組。異距分組即各組組距不相等的分組。在標(biāo)志值變動(dòng)比較均勻的條件下,可采用等距分組。當(dāng)標(biāo)志值變動(dòng)很不均勻,如急劇的增大、下降,變動(dòng)幅度大時(shí),可采用異距分組。

組數(shù)的確定

組距數(shù)列中組距的大小與組數(shù)的多少成反比。組限和組中值

當(dāng)組距、組數(shù)確定后,只需劃分各組數(shù)量界限便可編制組距數(shù)列。

(二)分布數(shù)列的編制組限和組中值

由于變量有離散型與連續(xù)型兩種,因此,其組限的劃分也有所不同。離散變量其變量值可以依次列舉,而相鄰組兩個(gè)變量值之間沒有中間數(shù)值,因此,分組時(shí)相鄰組的組限必須間斷。

連續(xù)變量由于其變量值不能依次列舉,而且相鄰兩個(gè)變量值之間可以存在無限多的中間數(shù)值,因此,相鄰組的上限和下限無法用兩個(gè)確定的數(shù)值分別表示,這時(shí)相鄰的上、下限采用重疊的方法分組界定。

在統(tǒng)計(jì)工作中,為保證變量的分組不發(fā)生混亂,習(xí)慣上規(guī)定各組一般均只包括本組下限變量值的單位,而不包括上限變量值的單位,這就是“上限不在內(nèi)”原則。(二)分布數(shù)列的編制

若按照間斷式組限分組時(shí),則需要轉(zhuǎn)換成連續(xù)式組限后再計(jì)算組中值,閉口組時(shí)采用上(2.2.1)式計(jì)算。

若按照間斷式組限分組時(shí),則需要轉(zhuǎn)換成連續(xù)式組限后再計(jì)算組中值,閉口組時(shí)采用上(2.2.1)式計(jì)算,開口組時(shí)需要采用(2.2.2)式、(2.2.3)式以下近似算:第一組為××以下,缺少下限,則組中值=組上限-下一組組距/2(2.2.2)最末組為××以上,缺少上限,則組中值=組下限+上一組組距/2(2.2.3)(二)分布數(shù)列的編制間斷式組中值的計(jì)算事例如表2.2.6所示。

第三節(jié)統(tǒng)計(jì)數(shù)據(jù)表現(xiàn)形式一、統(tǒng)計(jì)表(一)統(tǒng)計(jì)表的結(jié)構(gòu)從形式上看,統(tǒng)計(jì)表的結(jié)構(gòu)是由表題、橫行標(biāo)題、縱欄標(biāo)題和指標(biāo)數(shù)值等要素構(gòu)成,統(tǒng)計(jì)表結(jié)構(gòu)的一般形式如圖2.4.1所示。

(一)統(tǒng)計(jì)表的結(jié)構(gòu)

例:2001年我國工業(yè)增加值的一個(gè)統(tǒng)計(jì)表示如表2.3.1所示。

按照統(tǒng)計(jì)表的主詞是否分組和分組的程度,分為簡(jiǎn)單表,分組表和復(fù)合表三種。

簡(jiǎn)單表簡(jiǎn)單表是統(tǒng)計(jì)表的主詞未經(jīng)任何分組的統(tǒng)計(jì)表。分組表分組表指統(tǒng)計(jì)表的主詞按某一標(biāo)志進(jìn)行分組。復(fù)合表復(fù)合表指統(tǒng)計(jì)表的主詞按兩個(gè)或兩個(gè)以上標(biāo)志進(jìn)行復(fù)合分組

(二)統(tǒng)計(jì)表的種類二、統(tǒng)計(jì)圖條形圖(Barchart)

條形圖常用于描述離散型數(shù)據(jù)的情況,是我們經(jīng)常見到的一種圖形,它是用寬度相等而高度為頻數(shù)(率)來表示各類數(shù)據(jù)的大小。

例2.3.1某高校2005年各院教師在國內(nèi)核心雜志上發(fā)表論文情況,如表2.3.2所示

條形圖(Barchart)

解:由表2.3.2中的數(shù)據(jù)應(yīng)用Excel軟件中的“插入”功能中的“圖表”功能繪成的條形圖如圖2.3.2所示。

直方圖(Histogram)

直方圖表征數(shù)據(jù)的頻數(shù)分布特征,它與條形圖在形式上有類似之處,都是用條形來表示數(shù)據(jù)特征,但直方圖中的條形之間是沒有間隔的。

例2.3.2某連鎖企業(yè)2005年度各分公司完成銷售計(jì)劃如表2.3.3所示,試?yán)L制直方圖。直方圖(Histogram)

解:應(yīng)用Spss軟件中的“Gragh”功能繪制的直方圖,如圖2.3.3所示。

餅分圖(Piechart)

餅分圖經(jīng)常用來表示各成分在總體中所占的百分比。例2.3.3某課題組為了科學(xué)評(píng)價(jià)某高校學(xué)科建設(shè)項(xiàng)目的績效,對(duì)構(gòu)建的學(xué)科建設(shè)績效評(píng)估指標(biāo)權(quán)重進(jìn)行了問卷調(diào)查,累計(jì)發(fā)放問卷調(diào)查表243份,回收有效問卷223份,其中,教授占65%,研究員占1%,副教授占12%,副研究員占1%,講師占20%,助教占1%,則樣本職稱分布如圖2.3.4所示。

洛倫茨曲線是20世紀(jì)初美國經(jīng)濟(jì)學(xué)家、統(tǒng)計(jì)學(xué)家洛倫茲(M.E.Lorentz)繪制成的描述收入和財(cái)富分配性質(zhì)的曲線,洛倫茲曲線如圖2.3.5所示。洛倫茨曲線SA50100人口累計(jì)百分比(%)50100圖2.3.5洛倫茨曲線OT洛倫茨曲線L收入累計(jì)百分比(%)SB洛倫茨曲線

為了更準(zhǔn)確地反映收入分配的變化程度,20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼(Gini)根據(jù)洛倫茨曲線,提出了計(jì)算收入分配公平程度的統(tǒng)計(jì)指標(biāo),稱為基尼系數(shù)。其公式為:

聯(lián)合國有關(guān)組織規(guī)定:G小于0.2表示收入絕對(duì)平均,在0.2~0.3之間表示比較平均,在0.3~0.4之間表示相對(duì)合理,在0.4~0.5之間表示收入差距較大,大于0.6表示收入差距懸殊?;嵯禂?shù)0.4為國際警戒線,超過了0.4則應(yīng)采取措施縮小收入差距。

箱形圖(Boxplot)

箱形圖也稱箱線圖,是由一組數(shù)據(jù)的最大值、最小值、中位數(shù)和兩個(gè)四分位數(shù)5個(gè)特征值繪制的一個(gè)箱子和兩條線段的圖形。如圖2.3.6所示。

箱形圖(Boxplot)

不同箱形形狀可反映出不同的分布特征,如圖所示。

箱形圖(Boxplot)

例2.3.42005年度某高校經(jīng)濟(jì)管理學(xué)科共有10篇博士學(xué)位論文需要評(píng)審,分別請(qǐng)?jiān)擃I(lǐng)域8位專家進(jìn)行審稿,論文得分?jǐn)?shù)據(jù)如表2.3.4所示。箱形圖(Boxplot)

解:應(yīng)用Spss軟件中的“Gragh”功能繪制的各博士學(xué)位論文得分情況的箱形圖,如圖2.3.8所示。圖2.3.810篇博士學(xué)位論文得分的箱形圖

第四節(jié)統(tǒng)計(jì)數(shù)據(jù)特征描述一、總量指標(biāo)

總量指標(biāo)是反映社會(huì)經(jīng)濟(jì)現(xiàn)象在一定時(shí)間、地點(diǎn)、條件下的總規(guī)?;蚩偹降慕y(tǒng)計(jì)指標(biāo)??偭恐笜?biāo)也稱為絕對(duì)指標(biāo)或絕對(duì)數(shù)。

(一)社會(huì)總產(chǎn)品

社會(huì)總產(chǎn)品也稱總產(chǎn)出。它是指一個(gè)國家或地區(qū)在一定時(shí)期(如一年)內(nèi)全部生產(chǎn)活動(dòng)的總成果,當(dāng)以貨幣表現(xiàn)時(shí),即為全部生產(chǎn)活動(dòng)成果的價(jià)值總量。

(二)增加值

增加值是企業(yè)或部門在一定時(shí)期(如一年)內(nèi)從事生產(chǎn)經(jīng)營活動(dòng)所增加的價(jià)值。它是總產(chǎn)出減去中間投入后的余額,因此,從價(jià)值構(gòu)成看,它包括全部新創(chuàng)造的價(jià)值和物質(zhì)消耗中本期固定資產(chǎn)折舊。一、總量指標(biāo)(三)國內(nèi)生產(chǎn)總值(GDP)

國內(nèi)生產(chǎn)總值是按市場(chǎng)價(jià)格計(jì)算的國內(nèi)生產(chǎn)總值的簡(jiǎn)稱。它是一個(gè)同家(或地區(qū))所有常住單位在一定時(shí)期內(nèi)生產(chǎn)活動(dòng)的最終成果。國內(nèi)生產(chǎn)總值有三種表現(xiàn)形態(tài),即價(jià)值形態(tài)、收入形態(tài)和產(chǎn)品形態(tài)。在實(shí)際核算中,國內(nèi)生產(chǎn)總值的三種表現(xiàn)形態(tài)表現(xiàn)為三種計(jì)算方法,即生產(chǎn)法、收入法和支出法。生產(chǎn)法

國內(nèi)生產(chǎn)總值=各部門增加值之和(2.4.1)

增加值=總產(chǎn)出一中間投入(2.4.2)收入法增加值=固定資產(chǎn)折舊+勞動(dòng)者報(bào)酬+生產(chǎn)稅凈額+營業(yè)盈余(2.4.3)支出法

國內(nèi)生產(chǎn)總值=最終消費(fèi)十資本形成總額十凈出口(2.4.4)國民總收入=國內(nèi)生產(chǎn)總值十國外要素收人凈額(2.4.5)國外要素收入凈額=來自國外的勞動(dòng)者報(bào)酬和財(cái)產(chǎn)收入-國外從本國獲得的勞動(dòng)者報(bào)酬和財(cái)產(chǎn)收入(2.4.6)一、總量指標(biāo)

例2.4.1

如表2.4.1所示的《國內(nèi)生產(chǎn)總值及其使用表》是國民經(jīng)濟(jì)核算體系中再生產(chǎn)核算表的重要組成部分,是—張平衡表。該表從生產(chǎn)、分配、使用三個(gè)不同角度充分揭示了國內(nèi)生產(chǎn)總值是衡量社會(huì)生產(chǎn)與使用的核心指標(biāo);它將國內(nèi)生產(chǎn)總值的三種計(jì)算方法集中體現(xiàn)在一張表中,既可以從不同角度對(duì)國內(nèi)生產(chǎn)總值指標(biāo)進(jìn)行觀測(cè)分析,又保證了指標(biāo)概念的完整性、邏輯關(guān)系的清晰性和技術(shù)方法的統(tǒng)一性。二、相對(duì)指標(biāo)

相對(duì)指標(biāo)又稱相對(duì)數(shù),它是兩個(gè)有聯(lián)系的指標(biāo)數(shù)值對(duì)比的結(jié)果。用來對(duì)比的兩個(gè)數(shù),既可以是絕對(duì)數(shù),也可以是平均數(shù)和相對(duì)數(shù)。(一)計(jì)劃完成相對(duì)指標(biāo)

1.根據(jù)總量指標(biāo)計(jì)算計(jì)劃完成相對(duì)指標(biāo)

例2.4.2

設(shè)某工廠某年計(jì)劃工業(yè)增加值為600萬元,實(shí)際完成660萬元,求增加值計(jì)劃完成相對(duì)數(shù)。二、相對(duì)指標(biāo)2.根據(jù)平均指標(biāo)計(jì)算計(jì)劃完成相對(duì)指標(biāo)

根據(jù)平均指標(biāo)計(jì)算計(jì)劃完成相對(duì)數(shù)的計(jì)算公式為:二、相對(duì)指標(biāo)

例2.4.3

某企業(yè)生產(chǎn)某產(chǎn)品,本年度計(jì)劃單位成本降低9%,實(shí)際降低12%,求成本降低率計(jì)劃完成相對(duì)數(shù)。

例2.4.4

某企業(yè)某月生產(chǎn)某產(chǎn)品,計(jì)劃每人每日平均產(chǎn)量為36件,實(shí)際每人每日平均產(chǎn)量為39件,求勞動(dòng)生產(chǎn)率計(jì)劃完成相對(duì)數(shù)。(二)結(jié)構(gòu)相對(duì)指標(biāo)

總體是在同一性質(zhì)基礎(chǔ)上由各種有差異的部分所組成的。結(jié)構(gòu)相對(duì)指標(biāo)就是利用分組法,將總體區(qū)分為不同性質(zhì)(即差異)的各部分,以部分?jǐn)?shù)值與總體數(shù)值對(duì)比而得出比重或比率,來反映總體內(nèi)部組成狀況的綜合指標(biāo)。其計(jì)算公式為

例2.4.5某公司男職工為員工總數(shù)的60%,女職工為員工總數(shù)的40%,它反映了該公司在男女性別上的構(gòu)成情況。(三)比較相對(duì)指標(biāo)

比較相對(duì)致也稱類比相對(duì)數(shù),是將兩個(gè)同類指標(biāo)做靜態(tài)對(duì)比得出的綜合指標(biāo),表明同類現(xiàn)象在不同條件(如在各國、各地、各單位)下的數(shù)量對(duì)比關(guān)系。其計(jì)算公式為:

例2.4.6

某年有甲、乙兩企業(yè)同時(shí)生產(chǎn)一種性能相同的產(chǎn)品,甲企業(yè)工人勞動(dòng)生產(chǎn)率為21776元,乙企業(yè)為30994元,求兩企業(yè)勞動(dòng)生產(chǎn)率比較相對(duì)數(shù)。解:兩企業(yè)勞動(dòng)生產(chǎn)率比較相對(duì)指標(biāo)=(四)比例相對(duì)指標(biāo)

比例相對(duì)指標(biāo)是將總體內(nèi)某一部分?jǐn)?shù)值與另一部分?jǐn)?shù)值對(duì)比所得到的相對(duì)數(shù),常用系數(shù)或倍數(shù)表示。計(jì)算公式為例2.4.7我國2003年國內(nèi)生產(chǎn)總值為116898.4億元,其中第—產(chǎn)業(yè)為17092.1億元,第二產(chǎn)業(yè)為61131.3億元,第三產(chǎn)業(yè)為38675.0億元,則第—產(chǎn)業(yè)生產(chǎn)總值:第二產(chǎn)業(yè)生產(chǎn)總值:第三產(chǎn)業(yè)生產(chǎn)總值=1:3.6:2.3(五)強(qiáng)度相對(duì)指標(biāo)

強(qiáng)度相對(duì)指標(biāo)是兩個(gè)性質(zhì)不同,但有一定聯(lián)系的總量指標(biāo)對(duì)比的結(jié)果,用來表明現(xiàn)象的強(qiáng)度、密度和普通程度的綜合指標(biāo)。

強(qiáng)度相對(duì)指標(biāo)的計(jì)算(五)強(qiáng)度相對(duì)指標(biāo)

例2.4.8某地區(qū)占地10.2萬平方公里,據(jù)統(tǒng)計(jì)2005年初和2005年底的人口分別為4216萬人和4372萬人,2005年國民收入總額為9768億元,求2005年的人口密度、平均人口數(shù)、人均國民收入。(五)強(qiáng)度相對(duì)指標(biāo)強(qiáng)度相對(duì)指標(biāo)的正逆指標(biāo)

強(qiáng)度相對(duì)數(shù)是兩個(gè)有聯(lián)系的不同事物的總量指標(biāo)數(shù)值的對(duì)比,因此,分子和分母可以互換,這就產(chǎn)生了有些強(qiáng)度相對(duì)數(shù)有正指標(biāo)和逆指標(biāo)兩種

例2.4.9某城市人口620萬人,有大學(xué)66所,求大學(xué)密度正指標(biāo)與大學(xué)密度負(fù)指標(biāo)。

動(dòng)態(tài)相對(duì)指標(biāo)是同類指標(biāo)在不同時(shí)期上的對(duì)比,其計(jì)算公式為

(五)動(dòng)態(tài)相對(duì)指標(biāo)

式(2.4.12)中,作為對(duì)比標(biāo)準(zhǔn)的時(shí)期叫做基期,而同基期比較的時(shí)期叫做報(bào)告期,有時(shí)也稱為計(jì)算期。動(dòng)態(tài)相對(duì)數(shù)的計(jì)算結(jié)果用百分?jǐn)?shù)或倍數(shù)表示。三、平均指標(biāo)(一)算術(shù)平均數(shù)

簡(jiǎn)單算術(shù)平均數(shù)(一)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)

加權(quán)算術(shù)平均數(shù)的簡(jiǎn)略形式為:(一)算術(shù)平均數(shù)

例2.4.10表2.4.2為某企業(yè)職工月平均工資的分組數(shù)據(jù),試計(jì)算職工的月平均工資。(二)調(diào)和平均數(shù)

調(diào)和平均數(shù)也稱“倒數(shù)平均數(shù)”,它是對(duì)變量的倒數(shù)求平均,然后再取倒數(shù)而得到的平均數(shù)(三)幾何平均數(shù)簡(jiǎn)單幾何平均數(shù)

例2.4.11某高校自2001-2005年學(xué)生人數(shù)如表2.4.3所示,求該校平均發(fā)展速度。解:

(三)幾何平均數(shù)加權(quán)幾何平均數(shù)

(三)幾何平均數(shù)

例2.4.12某銀行在過去15年中的年利率資料如表2.4.4所示,求15年的平均年利率。解:用幾何平均法求15年平均利率

(四)中位數(shù)

中位數(shù)是將總體中各單位標(biāo)志值按大小順序排列,居于中間位置的那個(gè)標(biāo)志值就是中位數(shù),用表示。

未分組資料中位數(shù)的確定

(四)中位數(shù)

例2.4.137名工人的日產(chǎn)量依次從小到大排列為16件、18件、22件、23件、26件、29件、31件;8名工人的日產(chǎn)量依次從小到大排列為16件、18件、22件、24件、26件、29件、31件、33件,分別求其中位數(shù)。

解:7名工人的日產(chǎn)量的中位數(shù)位次(用)為8名工人的日產(chǎn)量的中位數(shù)位次為

(四)中位數(shù)

分組資料中位數(shù)的確定

下限公式(向上累計(jì)時(shí))為上限公式(向下累計(jì)時(shí))

(四)中位數(shù)

例2.4.14

某車間共有工人130名,生產(chǎn)某種產(chǎn)品按日產(chǎn)量分組資料如表2.4.5所示,試確定該車間工人日產(chǎn)量的中位數(shù)。

(四)中位數(shù)

例2.4.15

某高校某學(xué)院學(xué)生體重的數(shù)據(jù)資料如表2.4.6所示,計(jì)算該學(xué)院學(xué)生體重的中位數(shù)。例2.4.15計(jì)算按下限公式計(jì)算:

按上限公式計(jì)算:(五)眾數(shù)

眾數(shù)是指總體中出現(xiàn)次數(shù)最多的標(biāo)志值,它能夠直觀地說明客觀現(xiàn)象分配中的集中趨勢(shì)。按單項(xiàng)數(shù)列確定眾數(shù)

只須觀測(cè)標(biāo)志值出現(xiàn)的次數(shù),把次數(shù)最多的組定為眾數(shù)組,該組的標(biāo)志值即為眾數(shù)。

按組距數(shù)列確定眾數(shù)的方法

下限公式:上限公式:(五)眾數(shù)(五)眾數(shù)圖-1比較眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的相對(duì)位置(六)各種平均數(shù)的適用范圍及其相互關(guān)系不同平均指標(biāo)的適用范圍

算術(shù)平均數(shù)易受極端變量值影響,使的代表性變??;當(dāng)組距數(shù)列為開口組時(shí),由于組中值不易確定,使的代表性變得不可靠。

幾何平均數(shù)適用于各個(gè)變量值的連乘積等于其發(fā)展總速度時(shí),求算其平均數(shù);求等比數(shù)列的平均數(shù)。眾數(shù)適用于總體的單位數(shù)較多,各標(biāo)志值的次數(shù)分配又有明顯的集中趨勢(shì)的的情況。中位數(shù)屬于位置平均數(shù),它與眾數(shù)一樣,都是從數(shù)據(jù)位置的角度來反映數(shù)據(jù)的代表水平,中位數(shù)不受極端值的影響,各個(gè)變量值相對(duì)其中位數(shù)的絕對(duì)離差之和為最小。

(六)各種平均數(shù)的適用范圍及其相互關(guān)系

算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者的關(guān)系

四、變異指標(biāo)

標(biāo)志變異指標(biāo)是評(píng)價(jià)平均數(shù)代表性的依據(jù),標(biāo)志變異指標(biāo)愈大,平均數(shù)代表性愈??;標(biāo)志變異指標(biāo)愈小,則平均數(shù)代表性愈大。

極差(range)極差也稱全距,是指總體分布中最大標(biāo)志值與最小標(biāo)志值之差,用以說明標(biāo)志值變動(dòng)范圍的大小,通常用來表示,其計(jì)算公式為

極差(range)

例2.4.16

某商場(chǎng)連續(xù)11天銷售某品牌手機(jī)的數(shù)量分別為:22、36、43、12、31、52、42、20、35、26、33,求極差。

解:將銷售數(shù)量由大到小排序?yàn)椋?2、20、22、26、31、33、35、36、42、43、52,則極差為:標(biāo)準(zhǔn)差(standarddeviation)和方差(variance)由未分組數(shù)據(jù)資料計(jì)算

標(biāo)準(zhǔn)差是總體各單位標(biāo)志值與平均數(shù)離差平方平均數(shù)的平方根,標(biāo)準(zhǔn)差的平方即為方差。設(shè)從某個(gè)總體中抽取的數(shù)據(jù)為,則稱為樣本標(biāo)準(zhǔn)差為樣本方差

標(biāo)準(zhǔn)差(standarddeviation)和方差(variance)

若某總體的全部元素就是,則稱為該總體的標(biāo)準(zhǔn)差

為該總體的方差標(biāo)準(zhǔn)差(standarddeviation)和方差(variance)由分組資料計(jì)算

例2.4.17

以例2.4.15中學(xué)生體重的樣本資料,計(jì)算學(xué)生體重的方差與平均差。

例2.4.18

某高校經(jīng)濟(jì)管理學(xué)院中的0401和0402兩個(gè)班各有9名學(xué)生選修了管理預(yù)測(cè)與決策方法課程,考試成績?nèi)绫?.4.7所示,試計(jì)算各班管理預(yù)測(cè)與決策方法成績的平均值和標(biāo)準(zhǔn)差。解:根據(jù)表2.4.7的數(shù)據(jù)資料計(jì)算得變異系數(shù)(coefficientofvariation)

離散系數(shù)是消除平均數(shù)影響后的標(biāo)志變異指標(biāo),用來對(duì)兩組數(shù)據(jù)的差異程度進(jìn)行相對(duì)比較,其形式為相對(duì)數(shù),因此,也稱為標(biāo)志變異相對(duì)數(shù)指標(biāo)。常見的離散系數(shù)是標(biāo)準(zhǔn)差系數(shù)。變異系數(shù)(coefficientofvariation)

例2.4.19

某電器公司中的兩個(gè)車間生產(chǎn)不同的產(chǎn)品,其中一車間生產(chǎn)手機(jī),二車間生產(chǎn)MP3,某月兩個(gè)車間產(chǎn)量的平均數(shù)和標(biāo)準(zhǔn)差資料如表2.4.8所示,試分析兩者標(biāo)志的變異程度。解:五、偏度與峰度偏度(Skewness)偏度是用于衡量分布的不對(duì)稱程度或偏斜程度的指標(biāo)

峰度(Kurtosis)五、偏度與峰度

例2.4.20

根據(jù)例2.4.15中學(xué)生體重的樣本資料,計(jì)算學(xué)生體重的峰度。本章小節(jié)統(tǒng)計(jì)資料的收集與整理是對(duì)數(shù)據(jù)的直接處理與分析,目的是計(jì)算數(shù)據(jù)的特征值、發(fā)現(xiàn)其數(shù)量規(guī)律性,進(jìn)而用樣本數(shù)據(jù)的特征值推斷未知總體的參數(shù)。統(tǒng)計(jì)調(diào)查方案的設(shè)計(jì)與統(tǒng)計(jì)資料的收集主要介紹如何用數(shù)據(jù)對(duì)客觀事物進(jìn)行計(jì)量,如何獲得數(shù)據(jù),以及對(duì)數(shù)據(jù)質(zhì)量的評(píng)價(jià)。統(tǒng)計(jì)整理是根據(jù)統(tǒng)計(jì)研究的目的,將調(diào)查所得到的資料進(jìn)行科學(xué)地分組、匯總、表現(xiàn)并對(duì)總體的數(shù)量特征加以描述,為統(tǒng)計(jì)分析準(zhǔn)備系統(tǒng)的、條理化的綜合資料的工作過程。統(tǒng)計(jì)資料整理的結(jié)果可以用不同的形式表現(xiàn),其中統(tǒng)計(jì)表和統(tǒng)計(jì)圖是表現(xiàn)統(tǒng)計(jì)資料的常用形式。最重要的數(shù)字描述性指標(biāo)有兩類,一類測(cè)量數(shù)據(jù)集的集中趨勢(shì)(平均值、中位數(shù)和眾數(shù)),另一類測(cè)量數(shù)據(jù)的變異性(極差和標(biāo)準(zhǔn)差)。抽樣分布第一節(jié)隨機(jī)樣本第二節(jié)抽樣分布

本章小節(jié)主要內(nèi)容第一節(jié)隨機(jī)樣本

在統(tǒng)計(jì)學(xué)中,我們研究的問題一般集中在研究對(duì)象的某一數(shù)量指標(biāo)。比如某型號(hào)的電子元器件的壽命、一批某種產(chǎn)品的合格率等。因而,需要考慮通過與這一數(shù)量指標(biāo)相聯(lián)系的隨機(jī)試驗(yàn),來對(duì)這一數(shù)量指標(biāo)進(jìn)行試驗(yàn)或觀測(cè)。

我們將試驗(yàn)的全部可能的觀測(cè)值稱為總體,每一個(gè)觀測(cè)值稱為個(gè)體,總體中所包含的個(gè)體數(shù)稱為總體的容量。容量為有限的稱為有限總體,否則稱為無限總體。3.1關(guān)于抽樣的基本概念

為什么要抽樣?

為了收集必要的資料,對(duì)所研究對(duì)象(總體)的全部元素逐一進(jìn)行觀測(cè),往往不很現(xiàn)實(shí)。抽樣原因元素多,搜集數(shù)據(jù)費(fèi)時(shí)、費(fèi)用大,不及時(shí)而使所得的數(shù)據(jù)無意義總體龐大,難以對(duì)總體的全部元素進(jìn)行研究檢查具有破壞性炮彈、燈管、磚等第一節(jié)隨機(jī)樣本簡(jiǎn)單隨機(jī)抽樣(x1,x2,……,xn):

簡(jiǎn)單隨機(jī)抽樣是指從總體中抽取樣本容量為n的樣本時(shí),x1,x2,……,xn這n個(gè)隨機(jī)變量必須具備以下兩個(gè)條件:這n個(gè)隨機(jī)變量與總體X具有相同的概率分布;它們之間相互獨(dú)立。第一節(jié)隨機(jī)樣本甲乙丙丁四個(gè)生產(chǎn)商,其產(chǎn)品質(zhì)量如下表所示:

如果僅從AB兩個(gè)生產(chǎn)商的產(chǎn)品中進(jìn)行抽樣,抽樣質(zhì)量就偏高;如果僅從CD兩個(gè)生產(chǎn)商的產(chǎn)品中進(jìn)行抽樣,抽樣質(zhì)量就偏低; 因此采用簡(jiǎn)單隨機(jī)抽樣保證隨機(jī)樣本與總體具有相同的概率分布。ABCD質(zhì)量高高低低樣本統(tǒng)計(jì)量與抽樣分布:

在簡(jiǎn)單隨機(jī)抽樣中,樣本具有隨機(jī)性,樣本的參數(shù),s2等也會(huì)隨著樣本不同而不同,故它們是樣本的函數(shù),記為g(x1,x2,……,xn),稱為樣本統(tǒng)計(jì)量。

統(tǒng)計(jì)量的概率分布稱為抽樣分布(Sample distribution)3.1關(guān)于抽樣的基本概念

第一節(jié)隨機(jī)樣本3.1關(guān)于抽樣的基本概念第二節(jié)

抽樣分布

一、

統(tǒng)計(jì)量

定義不含有任何未知參數(shù)的樣本的函數(shù),稱為統(tǒng)計(jì)量。顯然,統(tǒng)計(jì)量為隨機(jī)變量。幾個(gè)常用統(tǒng)計(jì)量樣本矩(樣本均值;樣本方差;原點(diǎn)矩,中心矩等)幾個(gè)常用統(tǒng)計(jì)量二、幾個(gè)常用的抽樣分布

抽樣分布的定義統(tǒng)計(jì)量的分布稱為抽樣分布。

來自正態(tài)總體的幾個(gè)常用統(tǒng)計(jì)量的分布,已有一些重要的結(jié)果(人們已經(jīng)獲得這些統(tǒng)計(jì)量的具體的分布密度函數(shù))。下面介紹來自正態(tài)總體的幾個(gè)常用統(tǒng)計(jì)量的分布。

第二節(jié)

抽樣分布

幾種概率分布正態(tài)分布

分布

F分布

t分布幾種與正態(tài)分布有關(guān)的概率分布1.正態(tài)分布若隨機(jī)變量X的概率密度函數(shù)記為

1.正態(tài)分布圖4-1一般正態(tài)分布1.正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布:

當(dāng)時(shí),

記為U∽N(0,1)圖3-1標(biāo)準(zhǔn)正態(tài)分布1.正態(tài)分布非標(biāo)準(zhǔn)正態(tài)分布向標(biāo)準(zhǔn)正態(tài)分布的轉(zhuǎn)化

標(biāo)準(zhǔn)化因子

則U∽N(0,1)1.正態(tài)分布

查表 當(dāng)u大于零時(shí),可查正態(tài)分布表 但如果u<0時(shí),則可由式φ(-u)=1-φ(u)求出1.正態(tài)分布線性性質(zhì): 如果,且相互獨(dú)立。對(duì)于常數(shù),有下式成立:2.分布設(shè)是來自總體的樣本,則稱統(tǒng)計(jì)量

為服從自由度為的分布,記為

的一個(gè)重要性質(zhì):可加性圖3-2χ2分布圖2.分布查表:對(duì)于給定的α,0<α<1,可在分布表中查得,即 例如

即指2.分布設(shè),,且設(shè)與獨(dú)立,則稱統(tǒng)計(jì)量

為服從自由度為的分布,記為。

可以證明,當(dāng)充分大時(shí),分布趨向于標(biāo)準(zhǔn)正態(tài)分布。3.

分布圖3-3n=∞正態(tài)分布n=10n=1t分布圖3.t分布(Students分布)查表或性質(zhì):

當(dāng)n很大時(shí),此時(shí),tα/2≈uα/2,t分布近似標(biāo)準(zhǔn)正態(tài)分布。3.t分布(Students分布)4.

分布

設(shè),且設(shè)獨(dú)立,則稱隨機(jī)變量

為服從自由度為的分布,記為

分布的上分位點(diǎn)滿足下列關(guān)系:圖3-4F分布圖F4.

F

分布

5.基于正態(tài)總體樣本的均值與方差的分布

有限總體 有限總體若采取有放回抽樣,則與無限總體等價(jià)。有限總體容量為N而采取無放回抽樣,且n/N≤0.1,仍可視為無限總體,而當(dāng)n/N>0.1時(shí)則 稱式為有限總體的修正系數(shù)。4.3樣本平均數(shù)的抽樣分布5.基于正態(tài)總體樣本的均值與方差的分布

從總體中抽取樣本容量為n的簡(jiǎn)單隨機(jī)樣本,當(dāng)樣本容量n≥30時(shí),樣本均值的抽樣分布可用正態(tài)概率分布近似。中心極限定理(四)基于正態(tài)總體樣本的均值與方差的分布

設(shè)來自正態(tài)總體的樣本,分別為樣本的均值和方差。則設(shè)為來自正態(tài)總體的樣本,為來自正態(tài)總體的樣本,分別為兩個(gè)樣本的均值和方差。則當(dāng)時(shí),則三、

樣本比例的抽樣分布

(一)重復(fù)抽樣下樣本比例的抽樣分布

可以證明,

(二)不重復(fù)抽樣下樣本比例的抽樣分布

可以證明,本章小結(jié)統(tǒng)計(jì)量是統(tǒng)計(jì)推斷的基本變量。統(tǒng)計(jì)量是不含有任何未知參數(shù)的樣本的函數(shù)。統(tǒng)計(jì)量的分布稱為抽樣分布。對(duì)于正態(tài)總體,我們給出了幾個(gè)常用的統(tǒng)計(jì)量的分布。對(duì)于實(shí)際應(yīng)用中的比率問題,給出了大樣本下的抽樣分布。思考題

思考題

思考題案例討論題

在1936年的美國總統(tǒng)選舉中有兩位候選人,即民主黨候選人羅斯福(F.D.Roosevelt)和共和黨候選人蘭登(G.A.London)。有一家文摘雜志通過從電話號(hào)碼簿和一些俱樂部成員的名單中選取1000萬人,以發(fā)出詢問信的方式進(jìn)行民意調(diào)查,共有240萬人作出了回答。據(jù)此資料,此文摘雜志預(yù)測(cè)蘭登將以獲得57%的選票獲勝,而羅斯福的得票率將是43%。而選舉結(jié)果羅斯福的得票率則是62%,蘭登僅得到38%的選票。為此,這家雜志社很快就倒閉了。自1916年以來,此家雜志每次所作的預(yù)測(cè)都是正確的,因而影響很大。這次它的預(yù)測(cè)基于巨大數(shù)字的240萬的答卷作出的,卻預(yù)測(cè)錯(cuò)誤。當(dāng)時(shí)有電話的家庭有1100萬戶,失業(yè)者有900萬人。有一個(gè)叫喬治.蓋洛普(GeorgeGallup)的人建立的一個(gè)調(diào)查組織從1000萬人中隨機(jī)選取了3000人,就提前知道了文摘將要得出的結(jié)論:蘭登將以56%的選票獲勝,這與文摘公布結(jié)果的僅差1%,而這個(gè)結(jié)論來自于3000人而非204萬人。蓋洛普從更大的范圍內(nèi)隨機(jī)選取了5000人,據(jù)此預(yù)測(cè)羅斯福將以56%得票率獲勝,而蘭登的得票率為44%。與實(shí)際結(jié)果差6%。討論題:(1)此文摘雜志社此次預(yù)測(cè)錯(cuò)誤的根本原因?(2)為什么蓋洛普預(yù)測(cè)成功?(3)預(yù)測(cè)的誤差是否隨著抽樣數(shù)量的增加而減少?(4)從這個(gè)案例分析中得到什么啟發(fā)?統(tǒng)計(jì)推斷第一節(jié)參數(shù)估計(jì)

第二節(jié)假設(shè)檢驗(yàn)

第三節(jié)

假設(shè)檢驗(yàn)中的兩個(gè)問題

本章小節(jié)主要內(nèi)容第一節(jié)參數(shù)估計(jì)

一、

點(diǎn)估計(jì)

設(shè)總體的分布函數(shù)的形式已知,但它含有一個(gè)或多個(gè)未知參數(shù),借助于總體的一個(gè)樣本來估計(jì)總體未知參數(shù)的值的問題稱為參數(shù)的點(diǎn)估計(jì)問題。常用的構(gòu)造估計(jì)量的方法:矩估計(jì)法和最大似然估計(jì)法。

(一)矩估計(jì)法

英國統(tǒng)計(jì)學(xué)家K.Pearson提出的矩估計(jì)法,其主要思想是:以樣本矩作為相應(yīng)的總體矩的估計(jì),以樣本矩的函數(shù)作為相應(yīng)的總體矩的函數(shù)的估計(jì)。

這里,表示總體的矩,它是總體分布參數(shù)的函數(shù),而是樣本的函數(shù)。由上述個(gè)方程組成的方程組,可以解出總體分布中的個(gè)未知參數(shù)。例1

設(shè)總體的均值及方差(不為零)都存在,且均未知。

又設(shè)是來自總體的一個(gè)樣本,試求的矩估計(jì)量。解由,得再以代替,即得的矩估計(jì)量分別為

(二)最大似然估計(jì)法

由R.A.Fisher引進(jìn)的最大似然估計(jì)法,無論從理論上還是從應(yīng)用上,至今仍然是一種重要且普遍適用的方法。估計(jì)過程:由所謂的似然函數(shù)(它是參數(shù)和樣本的函數(shù))

若則稱為參數(shù)的最大似然估計(jì)值,為的似然估計(jì)量。一般情況下,可由方程求得。求最大似然估計(jì)量的步驟為:(1)對(duì)給定的總體X,寫出似然函數(shù)(2)列出似然方程(3)求解上述方程,得關(guān)于

的解即為

的最大似然估計(jì)量。含多個(gè)參數(shù)令似然方程或最大似然解點(diǎn)估計(jì)的常用方法例2二、估計(jì)量的評(píng)選標(biāo)準(zhǔn)

(一)無偏性

設(shè)為參數(shù)的點(diǎn)估計(jì)量,若則稱為參數(shù)的無偏估計(jì)量。(二)有效性

設(shè)和是的無偏估計(jì)量,若對(duì)于的變化范圍內(nèi)的任意一個(gè)值,都有

且至少有一個(gè)使得不等號(hào)成立,則稱較有效。(三)相合性

無偏性與有效性都是基于樣本容量n固定的前提下提出的,我們希望隨著樣本容量的增大,一個(gè)估計(jì)量的值趨向于待估參數(shù)的真值。

設(shè)為參數(shù)的一個(gè)估計(jì)量,若對(duì)于其變化范圍內(nèi)的任意一個(gè),當(dāng)時(shí),依概率收斂于,則稱為的相合估計(jì)量。

如果對(duì)任意小的正數(shù),有則稱是的一致估計(jì)量,稱具有相合性,可以證明均具有相合性。(三)相合性(consistency)二、估計(jì)量的評(píng)選標(biāo)準(zhǔn)

注:具有無偏性。

,對(duì)于,具有無偏性三、

區(qū)間估計(jì)

定義設(shè)總體的分布函數(shù)中含有未知參數(shù)對(duì)于給定的,有兩個(gè)樣本統(tǒng)計(jì)量,使得則稱隨機(jī)區(qū)間是的置信度為的置信區(qū)間,分別稱為置信度為的雙側(cè)置信區(qū)間的置信下限和置信上限。

三、區(qū)間估計(jì)

區(qū)間估計(jì)的概念的樣本使得置信度1-α置信度1-α下θ的置信區(qū)間:三、區(qū)間估計(jì)

1-α是置信度,置信度也稱為置信概率α稱為顯著性水平則稱三、

區(qū)間估計(jì)例題例題確定未知參數(shù)置信區(qū)間的一般步驟(1)構(gòu)造一個(gè)樣本的函數(shù)W它包含待估未知參數(shù),而不含其它未知參數(shù),并且W的分布已知且不依賴于任何未知參數(shù);(2)對(duì)于給定的置信度,定出兩個(gè)常數(shù)a,b,使得

(3)若能由上式得到等價(jià)的不等式,其中,都是統(tǒng)計(jì)量,那么就是的一個(gè)置信度為的置信區(qū)間

正態(tài)總體參數(shù)的置信區(qū)間

1.單個(gè)正態(tài)總體的情況(1)的置信區(qū)間①已知時(shí),②未知時(shí),(2)方差的置信區(qū)間(僅以未知為例)例3

現(xiàn)從某天生產(chǎn)的洗衣粉中隨機(jī)地取16袋,稱得重量(以克計(jì))如下表所示。設(shè)洗衣粉的重量近似地服從正態(tài)分布,試求總體均值的置信度為0.95的置信區(qū)間。解這里,總體的方差未知,故總體均值的置信區(qū)間為:

而,經(jīng)過計(jì)算得,又查表得,故所求的置信區(qū)間為(500.4,507.1)。5065084995035045104975125145054934965065025094962.兩個(gè)正態(tài)總體的情況

實(shí)際中存在這樣的問題:已知產(chǎn)品的某一指標(biāo)服從正態(tài)分布,但由于原料、設(shè)備條件、操作人員不同,或工藝過程的改變等因素的影響,而引起總體均值、方差的改變。

我們要考察這些變化的大小,這就涉及兩個(gè)正態(tài)總體均值差或方差比的估計(jì)問題。設(shè)有兩個(gè)正態(tài)總體,樣本均值和方差分別為(1)兩個(gè)總體均值差的置信區(qū)間

①均已知,的置信區(qū)間未知但相等,的置信區(qū)間(2)兩個(gè)總體方差比的置信區(qū)間

這里僅討論未知的情形對(duì)于給定的置信度,的置信區(qū)間為四、大樣本下總體均值、比率的區(qū)間估計(jì)

(一)總體均值的區(qū)間估計(jì)

這里的大樣本,是指樣本的容量不小于301.總體方差已知時(shí)總體均值的置信區(qū)間

2.總體方差未知時(shí)總體均值的置信區(qū)間兩個(gè)正態(tài)總體參數(shù)的比較σ12≠σ22且兩樣本容量均≥30由S12和S22分別估計(jì)σ12和σ22,即可例5

某保險(xiǎn)公司有36個(gè)投保人的年齡資料如表表所示所示。試求投保人平均年齡的置信度為95%的置信區(qū)間。

233642343934354253284939394645393845274354363438363147444845443324405032解

這里總體的方差未知,但為大樣本情形。查標(biāo)準(zhǔn)正態(tài)分布表得,再由上表數(shù)據(jù),得,由此,可以得到投保人平均年齡的置信度為95%的置信區(qū)間為,即(39.96,42.04)

(二)總體比率的區(qū)間估計(jì)

由樣本比率的抽樣分布可以知,當(dāng)樣本容量足夠大時(shí)(一般指不小于30,且都大于5),樣本比率的抽樣分布近似正態(tài)分布。設(shè)總體比率為,則有

對(duì)于置信度,P的置信區(qū)間為例6

某公司要估計(jì)某天生產(chǎn)的某型號(hào)的全部產(chǎn)品的合格率。

為此隨機(jī)抽取了100件產(chǎn)品,經(jīng)檢驗(yàn)其中有94件為合格品。

對(duì)于置信度95%,試求該天此型號(hào)產(chǎn)品合格率的區(qū)間估計(jì)。

由題意,易得樣本合格率,從而得全部產(chǎn)品合格率置信度為95%的置信區(qū)間為

即(89.35%,98.65%)(三)兩個(gè)總體均值差的區(qū)間估計(jì)

對(duì)于給定的置信度,的置信區(qū)間這里,為來自與兩個(gè)總體的樣本均值;為樣本的方差。例7

為了評(píng)估甲乙兩種方法包裝某產(chǎn)品所需要的時(shí)間,在不同的方法下獨(dú)立地抽取兩個(gè)隨機(jī)樣本,經(jīng)整理計(jì)算得到下列資料。試在置信度95%下,給出這兩種方法下包裝某產(chǎn)品平均時(shí)間之差的置信區(qū)間。

由公式

得到這兩種方法下包裝某產(chǎn)品平均時(shí)間之差的置信度為

95%的置信區(qū)間為(3.86,10.14)甲方法乙方法樣本容量n與總體方差、允許誤差、置信度有以下關(guān)系:1.在給定的置信水平下,允許誤差越大,樣本容量就可以越小。2.樣本容量n與置信度成正比。估計(jì)總體均值時(shí),樣本容量的確定例一家廣告公司想估計(jì)某類商店去年所花的平均廣告費(fèi)有多少。經(jīng)驗(yàn)表明,總體方差約為1800000。如置信度取95%,并要使估計(jì)值處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)取多大的樣本?解:已知

這家廣告公司應(yīng)抽選28個(gè)商店作樣本(注意抽取樣本數(shù)總是整數(shù),所以n應(yīng)圓整成整數(shù))。

估計(jì)總體均值時(shí),樣本容量的確定第二節(jié)

假設(shè)檢驗(yàn)

一、

參數(shù)假設(shè)檢驗(yàn)

在總體的分布函數(shù)已知,但參數(shù)未知時(shí),如對(duì)總體分布中的未知參數(shù)提出假設(shè),則如何利用樣本提供的信息來檢驗(yàn)這個(gè)假設(shè),即接受此假設(shè)還是拒絕此假設(shè)。

這類統(tǒng)計(jì)問題我們稱之為參數(shù)的假設(shè)檢驗(yàn)問題。參數(shù)估計(jì)和參數(shù)檢驗(yàn)是利用樣本對(duì)總體的統(tǒng)計(jì)特性提供的信息,建立樣本的函數(shù),即估計(jì)量或檢驗(yàn)統(tǒng)計(jì)量,是從不同角度處理總體未知參數(shù)的兩種統(tǒng)計(jì)方法。

假設(shè)檢驗(yàn)的一般流程假設(shè)檢驗(yàn)是推斷性統(tǒng)計(jì)學(xué)中的一項(xiàng)重要內(nèi)容,它是先對(duì)研究總體的參數(shù)作出某種假設(shè),然后通過樣本的觀察來決定假設(shè)是否成立參數(shù)假設(shè)樣本觀察假設(shè)檢驗(yàn)具體的統(tǒng)計(jì)方法(一)

假設(shè)檢驗(yàn)的基本思想

設(shè)總體為,建立假設(shè)這里表示原假設(shè),表示備擇假設(shè)。假設(shè)檢驗(yàn)問題,就是要建立一個(gè)合理的法則,根據(jù)這一法則,利用已知樣本作出接受原假設(shè)(即拒絕備擇假設(shè)),還是拒絕原假設(shè)(即接受備擇假設(shè))的決策。

(一)

假設(shè)檢驗(yàn)的基本思想假設(shè)基本形式

H0:原假設(shè),H1:備擇假設(shè)

假設(shè)檢驗(yàn):運(yùn)用統(tǒng)計(jì)理論對(duì)上述假設(shè)進(jìn)行檢驗(yàn),在原假設(shè)與備擇假設(shè)中選擇其一。假設(shè)檢驗(yàn)基本原理

小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生。假設(shè)檢驗(yàn)的基本依據(jù)—小概率原理:假設(shè)檢驗(yàn)基本原理

承認(rèn)原假設(shè)小概率事件發(fā)生大概率事件發(fā)生拒絕原假設(shè)接受原假設(shè)進(jìn)行一次實(shí)驗(yàn)(二)

判斷“假設(shè)”的依據(jù)

實(shí)際推斷原理:概率很小的事件在一次試驗(yàn)中幾乎是不會(huì)發(fā)生的。如果原假設(shè)為真,則由一次抽樣計(jì)算而得的樣本觀測(cè)值,滿足不等式此事件幾乎是不會(huì)發(fā)生的。

現(xiàn)在在一次觀測(cè)中竟然出現(xiàn)了滿足上述不等式的樣本均值,則我們有理由懷疑原來的假設(shè)的正確性,因而拒絕原假設(shè)。

若出現(xiàn)的觀測(cè)值不滿足上述不等式,此時(shí)沒有足夠的理由拒絕,因此只能接受原假設(shè)。

第一類錯(cuò)誤:棄真(顯著水平α)第二類錯(cuò)誤:取偽顯著水平與兩類錯(cuò)誤(三)兩類錯(cuò)誤

對(duì)于一定的樣本容量n,不能同時(shí)做到兩類錯(cuò)誤的概率都很小。如果減小α錯(cuò)誤,就會(huì)增大犯β錯(cuò)誤的機(jī)會(huì);若減小β錯(cuò)誤,也會(huì)增大犯α錯(cuò)誤的機(jī)會(huì)。兩類錯(cuò)誤關(guān)系(三)兩類錯(cuò)誤

如何使使α、β同時(shí)變小?一個(gè)完整的假設(shè)檢驗(yàn)過程,通常包括以下四個(gè)步驟:提出原假設(shè)(Nullhypothesis)與備擇假設(shè)(Alternativehypothesis)作出統(tǒng)計(jì)判斷

參數(shù)假設(shè)檢驗(yàn)問題的步驟

確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值給定顯著性水平α正態(tài)總體參數(shù)假設(shè)檢驗(yàn)的步驟第一步:建立原假設(shè)H0和備擇假設(shè)H1常用的假設(shè)形式第二步:選擇檢驗(yàn)用的統(tǒng)計(jì)量u檢驗(yàn)t檢驗(yàn)F檢驗(yàn)

常用統(tǒng)計(jì)量正態(tài)總體參數(shù)假設(shè)檢驗(yàn)的步驟第四步:確定顯著水平α的值,查相應(yīng)的分布表得其臨界值以及拒絕域。第五步:作出拒絕還是接受原假設(shè)的統(tǒng)計(jì)判斷。正態(tài)總體參數(shù)假設(shè)檢驗(yàn)的步驟第三步:根據(jù)樣本觀測(cè)值計(jì)算檢驗(yàn)統(tǒng)計(jì)量的具體值;(四)單個(gè)總體參數(shù)的假設(shè)檢驗(yàn)

1.單個(gè)正態(tài)總體下參數(shù)的假設(shè)檢驗(yàn)

(1)

單個(gè)正態(tài)總體均值的檢驗(yàn)

①已知,關(guān)于的檢驗(yàn)(Z檢驗(yàn))檢驗(yàn)統(tǒng)計(jì)量:可以根據(jù)假設(shè)檢驗(yàn)的不同類型,確定檢驗(yàn)問題的拒絕域。例8

某廠生產(chǎn)某種型號(hào)的內(nèi)胎,從長期的生產(chǎn)經(jīng)驗(yàn)知道其扯斷強(qiáng)力服從均值=1380(N/㎝),標(biāo)準(zhǔn)差=50(N/㎝)的正態(tài)分布。該廠為提高產(chǎn)品的質(zhì)量,改變了原來的配方進(jìn)行現(xiàn)場(chǎng)生產(chǎn)試驗(yàn)。設(shè)新配方生產(chǎn)的內(nèi)胎其扯斷強(qiáng)力仍服從正態(tài)分布。由于在試驗(yàn)中除配方外,其他條件都保持不變,因此可以認(rèn)為新配方未改變此型號(hào)內(nèi)胎扯斷強(qiáng)力的方差。采用新配方的5次試驗(yàn),測(cè)得內(nèi)胎扯斷強(qiáng)力為(單位:N/㎝):1450,1460,1360,1430,1420,試問采用新配方,是否能提高內(nèi)胎的扯斷強(qiáng)力?解對(duì)這個(gè)假設(shè)檢驗(yàn)問題,需要檢驗(yàn)假設(shè)形如這樣的假設(shè)檢驗(yàn),稱為右邊檢驗(yàn)(類似也有左邊檢驗(yàn))。此檢驗(yàn)問題的拒絕域的形式為查表得,而經(jīng)計(jì)算得,,從而有

,即,據(jù)此,拒絕原假設(shè)。②未知,關(guān)于的檢驗(yàn)(t檢驗(yàn))檢驗(yàn)統(tǒng)計(jì)量:可以根據(jù)假設(shè)檢驗(yàn)的不同類型,確定此檢驗(yàn)問題的拒絕域例8

某種元件,按照標(biāo)準(zhǔn)其使用壽命不低于1000(小時(shí)),現(xiàn)從生產(chǎn)出的一批元件中隨機(jī)抽取25件,測(cè)得其平均壽命為950(小時(shí)),樣本標(biāo)準(zhǔn)差為100(小時(shí))。

假設(shè)該種元件壽命服從正態(tài)分布,對(duì)于置信度95%,試問這批元件是否可以認(rèn)為合格?

解此問題即要檢驗(yàn)拒絕域的形式為而由已知可得,,,又,即。故拒絕原假設(shè),認(rèn)為這批元件不合格。(2)單個(gè)正態(tài)總體的方差檢驗(yàn)

設(shè)未知,建立假設(shè):;:檢驗(yàn)統(tǒng)計(jì)量:拒絕域:或(2)單個(gè)正態(tài)總體的方差檢驗(yàn)

2.非正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)

這里討論的是在大樣本(樣本容量)情形下總體均值和總體比率的假設(shè)檢驗(yàn)??傮w均值和總體比率的假設(shè)檢驗(yàn)這里利用中心極限定理,在樣本容量充分大時(shí),樣本均值近似服從正態(tài)分布,從而可以構(gòu)造相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量和確定出檢驗(yàn)問題的拒絕域。對(duì)于總體比率的檢驗(yàn),在樣本容量充分大時(shí),樣本比率近似服從正態(tài)分布,也可以類似構(gòu)造檢驗(yàn)統(tǒng)計(jì)量及確定出拒絕域。2.非正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)

(1)總體的均值的假設(shè)檢驗(yàn)(1)總體的均值的假設(shè)檢驗(yàn)

例9

一個(gè)市場(chǎng)分析員認(rèn)為某市居民每戶每周平均在食品上的支出少于140元。一個(gè)由100個(gè)家庭組成的隨機(jī)樣本資料所給出的平均值為138元,標(biāo)準(zhǔn)差為10元,在顯著性水平0.05下,這些數(shù)據(jù)能否支持此分析員的看法?(1)總體的均值的假設(shè)檢驗(yàn)(2)總體比率的假設(shè)檢驗(yàn)(2)總體比率的假設(shè)檢驗(yàn)單個(gè)總體比率的假設(shè)檢驗(yàn)如果樣本容量n與原總體比率

時(shí),用u檢驗(yàn)法。(五)兩個(gè)正態(tài)總體下參數(shù)的假設(shè)檢驗(yàn)

1.有關(guān)平均值的假設(shè)檢驗(yàn)

設(shè)分別表示來自兩個(gè)具有相同方差的正態(tài)總體的樣本均值,則對(duì)于兩個(gè)總體均值的假設(shè)檢驗(yàn)問題,可以通過構(gòu)造檢驗(yàn)統(tǒng)計(jì)量

來確定拒絕域的形式。(五)兩個(gè)正態(tài)總體下參數(shù)的假設(shè)檢驗(yàn)

例11

2.方差的假設(shè)檢驗(yàn)

設(shè)分別表示來自兩個(gè)具有不同方差的正態(tài)總體的樣本方差,則對(duì)于兩個(gè)總體方差的假設(shè)檢驗(yàn)問題,可以通過構(gòu)造檢驗(yàn)統(tǒng)計(jì)量(在原假設(shè)為真的情形下)

根據(jù)備擇假設(shè)的不同類型可以確定出檢驗(yàn)問題的拒絕域。例例表4.2.2

正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)(顯著性水平為α)二、

非參數(shù)假設(shè)檢驗(yàn)(NonparametricTests)

前一節(jié)所討論的假設(shè)檢驗(yàn)問題,只是對(duì)服從正態(tài)分布的總體中的某些未知參數(shù)進(jìn)行假設(shè)檢驗(yàn)。

但在實(shí)際問題中,總體的分布函數(shù)的形式往往未知;或者知道的很少,甚至只知道是離散型或連續(xù)型。

本節(jié)討論總體分布函數(shù)的擬合問題,即研究檢驗(yàn)總體分布函數(shù)的非參數(shù)假設(shè)檢驗(yàn)問題。

(一)符號(hào)檢驗(yàn)法

這里只介紹檢驗(yàn)兩個(gè)總體分布函數(shù)是否相同的符號(hào)檢驗(yàn)法設(shè)有兩個(gè)總體,要檢驗(yàn)假設(shè)設(shè)有來自兩個(gè)總體的樣本將它們所對(duì)應(yīng)的樣本觀察值進(jìn)行比較,可以得到對(duì)應(yīng)值差的符號(hào),以記正、負(fù)號(hào)的個(gè)數(shù),則它們?yōu)殡S機(jī)變量。構(gòu)造檢驗(yàn)統(tǒng)計(jì)量就可以確定出檢驗(yàn)問題的拒絕域。符號(hào)檢驗(yàn)法步驟:比較樣本數(shù)據(jù)求出n:n=n++n-在顯著水平α下,根據(jù)n值查符號(hào)檢驗(yàn)表得其臨界值Sα(n)判別顯著性ai>bi記為“+”,“+”的個(gè)數(shù)記為n+ai<bi記為“-”,“-”的個(gè)數(shù)記為n-ai=bi記為“0”,“0”的個(gè)數(shù)記為n0

若S0=min{n+,n-}<Sα(n),則拒絕H0,接受H1;認(rèn)為f1(x)與f2(x)有顯著差異。若S0=min{n+,n-}>Sα(n),則接受H0,認(rèn)為f1(x)與f2(x)無顯著差異。例9

甲、乙兩分析人員分析同一物體中的某成分含量,測(cè)得數(shù)據(jù)如下表(單位:%)。

問兩人的分析結(jié)果有無顯著差異

(對(duì)于顯著性水平0.1)甲14.914.815.114.815.514.614.814.815.114.5乙14.314.915.214.715.214.714.714.615.214.5符號(hào)+––++–++–0甲15.014.914.715.015.114.915.214.715.415.3乙14.914.714.815.314.914.614.814.915.215.0符號(hào)++––+++–++解:由上表,可以得到數(shù)據(jù)間比較的符號(hào),若對(duì)比的數(shù)據(jù)相等,符號(hào)以0表示,結(jié)果見上表。再根據(jù)數(shù)據(jù)計(jì)算得

=12,=7,所以=19,且

=7。由顯著性水平=0.10及

=19,由附表查得。

因=7>5,于是接受原假設(shè),即認(rèn)為兩人的分析結(jié)果無顯著差異。由上面的分析可以看到,符號(hào)檢驗(yàn)法簡(jiǎn)單、直觀,且無須知道被檢驗(yàn)量的分布形式,但其精度較差,而且要求數(shù)據(jù)成對(duì)出現(xiàn)。(二)

秩和檢驗(yàn)法

設(shè)從總體中分別抽取容量為的獨(dú)立樣本。要檢驗(yàn)假設(shè)為討論方便,設(shè)。把兩個(gè)樣本的觀測(cè)數(shù)據(jù)合在一起按從小到大的次序排列,定義每個(gè)數(shù)據(jù)在排列中所對(duì)應(yīng)的序號(hào)為該數(shù)的秩,對(duì)于相同的數(shù)據(jù)則利用他們序數(shù)的平均值來做秩。將容量較少的樣本的各觀測(cè)值的秩之和記為,以作為檢驗(yàn)統(tǒng)計(jì)量。然后確定出相應(yīng)的拒絕域。(二)秩和檢驗(yàn)法例10

某廠用兩種材料制造燈泡,現(xiàn)有分別隨機(jī)抽取若干個(gè)進(jìn)行壽命試驗(yàn)的數(shù)據(jù)如下:?jiǎn)杻煞N材料對(duì)燈泡壽命的影響有無顯著的差異(取=0.20)。

甲1598169816801650174017901720

乙16981640157616401590秩12345678.5101112甲1598165016801698172017401790乙15761590164016401698

甲1598169816801650174017901720

乙16981640157616401590解:將全部數(shù)據(jù)按從小到大的次序排列,結(jié)果如下表所示。解:將全部數(shù)據(jù)按從小到大的次序排列,結(jié)果如下表所示。將數(shù)據(jù)少的乙組的數(shù)據(jù)個(gè)數(shù)用表示,另一組用表示。由此算得,即

=1+2+4+5+8.5=20.5

因=5,=7,=0.20,由附表查得=22,=43。由于,故認(rèn)為兩種材料對(duì)燈泡壽命的影響有顯著差異。

秩12345678.5101112甲1598165016801698172017401790乙15761590164016401698(三)

擬合優(yōu)度檢驗(yàn)法

實(shí)際上,有時(shí)連總體服從什么類型的分布都不知道,這就需要根據(jù)樣本來檢驗(yàn)總體分布的假設(shè)。

設(shè)是未知的總體分布函數(shù);又設(shè)是類型已知的分布函數(shù),但其中可能有未知的參數(shù)。要檢驗(yàn)假設(shè):

構(gòu)造統(tǒng)計(jì)量由此確定出相應(yīng)檢驗(yàn)問題的拒絕域。例11

一顆骰子擲了120次,得到下列結(jié)果試在=0.05下檢驗(yàn)這顆骰子是否均勻、對(duì)稱。解:

擲一顆骰子出現(xiàn)的點(diǎn)數(shù)是一個(gè)離散型的隨機(jī)變量X。這里要檢驗(yàn)假設(shè)由于已知的分布中不含未知參數(shù),又=20,則由

而,故接受原假設(shè)。

出現(xiàn)點(diǎn)數(shù)123456出現(xiàn)次數(shù)232621201515第三節(jié)假設(shè)檢驗(yàn)中的兩個(gè)問題

一、置信區(qū)間與假設(shè)檢驗(yàn)的關(guān)系第三節(jié)

假設(shè)檢驗(yàn)中的兩個(gè)問題

二、假設(shè)檢驗(yàn)中的值

一般也稱值為實(shí)測(cè)顯著性水平。值是當(dāng)原假設(shè)成立時(shí),得到所觀測(cè)數(shù)據(jù)的概率,是我們判斷原假設(shè)不真的有力依據(jù)。

二、假設(shè)檢驗(yàn)中的P值p-值的應(yīng)用例題:某商品標(biāo)簽上標(biāo)明其重量至少為3公斤以上,現(xiàn)抽取36瓶該產(chǎn)品組成的一個(gè)簡(jiǎn)單隨機(jī)樣本,得其樣本均值2.92公斤,已知總體標(biāo)準(zhǔn)差為0.18時(shí),在顯著性水平α=0.01的情況下檢驗(yàn)其商品標(biāo)簽所標(biāo)內(nèi)容是否真實(shí)?求解過程:(1)原假設(shè)H0:μ≥3,備擇假設(shè)H1:μ<3(2)檢驗(yàn)統(tǒng)計(jì)量為:

p-值的應(yīng)用

代入數(shù)據(jù)得:求解過程(續(xù)):(3)U=-2.67所對(duì)應(yīng)的p值為0.0038(4)0.0038<0.01,所以拒絕H0。

p-值的應(yīng)用

統(tǒng)計(jì)推斷中的兩個(gè)基本問題估計(jì)問題假設(shè)檢驗(yàn)問題點(diǎn)估計(jì)區(qū)間估計(jì)參數(shù)假設(shè)檢驗(yàn)統(tǒng)計(jì)量的構(gòu)建拒絕域的確定符號(hào)檢驗(yàn)秩和檢驗(yàn)擬合優(yōu)度檢驗(yàn)本章小結(jié)

矩估計(jì)法區(qū)間估計(jì)非參數(shù)假設(shè)檢驗(yàn)方差分析第一節(jié)單因素試驗(yàn)的方差分析

第二節(jié)雙因素試驗(yàn)的方差分析

本章小結(jié)主要內(nèi)容第一節(jié)單因素試驗(yàn)的方差分析

例5.1.3某燈泡廠用4種不同配料方案制成的燈絲生產(chǎn)了4批燈炮,在每批燈泡中隨機(jī)抽取若干只進(jìn)行壽命試驗(yàn)。我們關(guān)心的問題是這4種燈絲生產(chǎn)的燈泡其使用壽命有無顯著差異?這里要分析的因素是配料方案。例5.1.1設(shè)有m臺(tái)機(jī)器生產(chǎn)同一種產(chǎn)品,記錄每臺(tái)的日產(chǎn)量??梢钥吹?,不但不同機(jī)器的日產(chǎn)量可能各不相同,就是同一臺(tái)機(jī)器在不同的生產(chǎn)日中其產(chǎn)量也未必相同。我們關(guān)心的是,這種日產(chǎn)量的差異是由于不同機(jī)器造成的,還是由于隨機(jī)波動(dòng)造成的。這里考慮的因素是不同機(jī)器的生產(chǎn)能力。第一節(jié)單因素試驗(yàn)的方差分析

我們把要考察的指標(biāo)稱為試驗(yàn)指標(biāo)。如果在一個(gè)問題中有幾項(xiàng)試驗(yàn)指標(biāo),我們將分別對(duì)每一項(xiàng)試驗(yàn)指標(biāo)進(jìn)行分析。影響試驗(yàn)指標(biāo)的條件稱為因素,一般用大寫字母等表示。如果一項(xiàng)試驗(yàn)中只有一個(gè)因素在改變我們就稱為單因素試驗(yàn);因素所處的狀態(tài)稱為水平。

第一節(jié)單因素試驗(yàn)的方差分析

例5.1.4采用四種不同產(chǎn)地的原料萘,按同樣的工藝條件合成—萘酚,測(cè)定所得產(chǎn)品的熔點(diǎn)如表5.1.1所示,問原料萘的產(chǎn)地是否顯著影響產(chǎn)品的熔點(diǎn)?

設(shè)因素A有t個(gè)水平,在第i個(gè)水平下進(jìn)行了ni次相互獨(dú)立的試驗(yàn),結(jié)果如下:第一節(jié)單因素試驗(yàn)的方差分析方差分析的基本任務(wù)就是要檢驗(yàn)假設(shè)(1)(2)參數(shù)的檢驗(yàn)

方差分析的基本思想:構(gòu)造一個(gè)適當(dāng)?shù)慕y(tǒng)計(jì)量,來描述數(shù)據(jù)的波動(dòng)程度。將這個(gè)統(tǒng)計(jì)量分解為兩部分,一部分是純隨機(jī)誤差造成的影響,另一部分是除隨機(jī)誤差的影響外來自于因素效應(yīng)的影響。然后將這兩部分進(jìn)行比較,如果后者明顯比前者大,就說明因素的效應(yīng)是顯著的。

單因素試驗(yàn)方差分析表方差來源平方和自由度均方F比因素A誤差總和由此得到檢驗(yàn)問題的拒絕域的形式:該檢驗(yàn)法的直觀意義是:當(dāng)組間差異相對(duì)于組內(nèi)差異較大時(shí)就拒絕原假設(shè)。

例1

采用四種不同產(chǎn)地的原料萘,按同樣的工藝條件合成—萘酚,測(cè)定所得產(chǎn)品的熔點(diǎn)如下表所示,問原料萘的產(chǎn)地是否顯著影響產(chǎn)品的熔點(diǎn)

產(chǎn)地1

產(chǎn)地2

產(chǎn)地3

產(chǎn)地4

124.0123.0123.5123.0

123.0123.0

121.5121.0123.0

123.5121.0

解:經(jīng)過計(jì)算得到下列方差分析表由上表可知,接受原假設(shè),即原料萘的產(chǎn)地對(duì)萘酚熔點(diǎn)無顯著影響。方差來源

平方和

自由度

均方

F比

F臨界值原料產(chǎn)地誤差總和4.65725.979210.636437101.55240.85421.8174

3.07第二節(jié)雙因素試驗(yàn)的方差分析

一、雙因素等重復(fù)試驗(yàn)的方差分析

在實(shí)際中,影響一事物的因素有兩個(gè)或更多。下面我們討論雙因素的方差分析問題。雙因素方差分析的基本思路:若某一因素的幾個(gè)水平會(huì)引起事物很不同的結(jié)果,則這個(gè)因素就是重要的;若某一因素的幾個(gè)水平僅是導(dǎo)致事物相近的結(jié)果,則這個(gè)因素就是不重要的。設(shè)因素A有r個(gè)水平,因素B有s個(gè)水平。

試驗(yàn)結(jié)果

因素B因素AB1B2BsA1A2Ar此假設(shè)檢驗(yàn)問題為

方差分析表方差來源平方和自由度均方F比因素A因素B交互作用誤差總和此假設(shè)檢驗(yàn)的拒絕域分別為:在顯著性水平下,假設(shè)的拒絕域的形式為:假設(shè)的拒絕域的形式為:假設(shè)的拒絕域的形式為:

例2

某種火箭使用4種燃料(A),3種推進(jìn)器(B)進(jìn)行射程試驗(yàn)。在每種燃料與每種推進(jìn)器的組合下火箭各發(fā)射兩次,射程數(shù)據(jù)見下表。

試在顯著性水平下,檢驗(yàn)不同燃料(因素A)、不同推進(jìn)器(因素B)下射程是否有顯著差異?交互作用是否顯著?

B1B2B3A1A2A3A458.2,52.649.1,42.860.1,58.375.8,71.556.2,41.254.1,50.570.9,73.258.2,51.065.3,60.851.6,48.439.2,40.748.7,41.4解

經(jīng)過計(jì)算得到方差分析表由于3個(gè)假設(shè)檢驗(yàn)中的F值都大于其臨界值,故可以認(rèn)為燃料和推進(jìn)器這兩個(gè)因素對(duì)射程的影響是顯著的,且交互作用是顯著的。方差來源

平方和

自由度

均方

F比F臨界值因素A因素B交互作用A×B

誤差總和261.675370.9811768.693236.9502638.298326122387.225185.490294.78219.746FA=4.42FB=9.39FA×B=14.93.493.893.00二、雙因素?zé)o重復(fù)試驗(yàn)的方差分析

在上面的分析中,我們考慮了雙因素間有交互作用的情況。

為了檢驗(yàn)因素之間的交互作用是否顯著,對(duì)于兩個(gè)因素水平的每一組合至少要試驗(yàn)兩次。如在實(shí)際中已知因素之間無交互作用,或交互作用對(duì)試驗(yàn)指標(biāo)的影響很弱,則可以忽略交互作用。

此時(shí)我們上面討論的模型得到了簡(jiǎn)化,同時(shí)試驗(yàn)的次數(shù)(對(duì)因素水

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論