




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計學(xué)原理復(fù)習(xí)重點(diǎn)概述本課程主要包括三部分知識。第一部分統(tǒng)計基礎(chǔ)知識第一章和第二章數(shù)據(jù)收集部分。第二部分描述統(tǒng)計第二章統(tǒng)計數(shù)據(jù)整理部分(表格與圖形法)、第三章數(shù)據(jù)分布特征的描述(靜態(tài)數(shù)據(jù)描述法)和動態(tài)數(shù)據(jù)描述法,即第六章時間數(shù)列分析和第八章統(tǒng)計指數(shù)。第三部分推斷統(tǒng)計第四章抽樣估計和第五章假設(shè)檢驗(yàn)與方差分析。第一章緒論。本章介紹統(tǒng)計學(xué)及相關(guān)概念,勾勒了本課程的框架結(jié)構(gòu)——描述統(tǒng)計學(xué)和推斷統(tǒng)計學(xué)。是統(tǒng)計的三層含義,總體、樣本及指標(biāo)等概念。統(tǒng)計的三層含義及相互關(guān)系統(tǒng)計學(xué)是一門關(guān)于數(shù)據(jù)的科學(xué),是一門關(guān)于數(shù)據(jù)的收集、整理、分析、解釋和推斷的科學(xué)。(一)統(tǒng)計工作(統(tǒng)計的基本含義)即統(tǒng)計實(shí)踐活動,是人們對客觀事物的數(shù)據(jù)資料進(jìn)行搜集、整理、分析的工作活動的總稱。(二)統(tǒng)計資料是統(tǒng)計工作的成果,包括各種統(tǒng)計報表、統(tǒng)計圖形及文字資料等。(三)統(tǒng)計學(xué)是一門收集、整理、描述、顯示和分析統(tǒng)計數(shù)據(jù)的方法論的科學(xué),其目的是探索事物的內(nèi)在數(shù)量規(guī)律性,以達(dá)到對客觀事物的科學(xué)認(rèn)識。(四)三者關(guān)系統(tǒng)計學(xué)與統(tǒng)計實(shí)踐活動的關(guān)系是理論與實(shí)踐的關(guān)系,理論源于實(shí)踐,理論又高于實(shí)踐,反過來又指導(dǎo)實(shí)踐。統(tǒng)計工作和統(tǒng)計數(shù)據(jù)是工作和工作成果關(guān)系。統(tǒng)計實(shí)踐活動的產(chǎn)生與發(fā)展三個主要的統(tǒng)計學(xué)派1、政治算術(shù)學(xué)派代表人物:英國的威廉·配第(1623-1687)、約翰·格朗特(1620-1674)等。威廉·配第的代表著《政治算術(shù)》對當(dāng)時的英、荷、法等國的“國富和力量”進(jìn)行了數(shù)量的計算和比較;格朗特寫出了第一本關(guān)于人口統(tǒng)計的著作。他們開創(chuàng)了從數(shù)量方面研究社會經(jīng)濟(jì)現(xiàn)象的先例??梢哉f,威廉·配第是統(tǒng)計學(xué)的創(chuàng)始人。2、記述學(xué)派(國勢學(xué)派〕代表人物:德國的康令(1606-1681)阿亨瓦爾(1719-1772;1764年首創(chuàng)統(tǒng)計學(xué)一詞)他們在大學(xué)中開設(shè)“國勢學(xué)”課程,采用記述性材料,講述國家“顯著事項(xiàng)”,籍以說明管理國家的方法。特點(diǎn)是偏重于事物質(zhì)的解釋而忽視量的分析。3、數(shù)理統(tǒng)計學(xué)派代表人物:比利時的凱特勒(1796-1874)他把古典概率論引進(jìn)統(tǒng)計學(xué),發(fā)展了概率論,推廣了概率論在統(tǒng)計中的應(yīng)用。凱特勒把德國的國勢學(xué)派、英國的政治算術(shù)學(xué)派和意大利、法國的古典概率論家以融合改造為近代意義的統(tǒng)計學(xué)。他是數(shù)理統(tǒng)計學(xué)派的奠定人。代表著作:社會物理學(xué)有的教材分類古典統(tǒng)計學(xué)時期(17世紀(jì)中后期~18世紀(jì)中后期)1.政治算術(shù)學(xué)派:代表人物威廉·配第(政治經(jīng)濟(jì)學(xué)之父),首次運(yùn)用數(shù)量對比分析法,又稱“有名無實(shí)”的統(tǒng)計學(xué)。2.記述學(xué)派/國勢學(xué)派:“統(tǒng)計學(xué)是研究一國或多國的顯著事項(xiàng)之學(xué)”,以文字描述為主,又稱“有實(shí)無名”的統(tǒng)計學(xué)。3.圖表學(xué)派:用統(tǒng)計圖和統(tǒng)計表表現(xiàn)和保存統(tǒng)計資料。近代統(tǒng)計學(xué)時期(18世紀(jì)末~19世紀(jì)末)1.數(shù)理統(tǒng)計學(xué)派:創(chuàng)始人阿道夫·凱特勒,第一次將概率論引入社會經(jīng)濟(jì)現(xiàn)象的研究中,被譽(yù)為“近代統(tǒng)計學(xué)之父”。2.社會統(tǒng)計學(xué)派:代表人物恩格爾,采用大量觀察法研究社會經(jīng)濟(jì)現(xiàn)象總體?,F(xiàn)代統(tǒng)計學(xué)時期(20世紀(jì)初至今)1.主要成果:在隨機(jī)抽樣基礎(chǔ)上建立了推斷統(tǒng)計學(xué)。2.數(shù)理統(tǒng)計學(xué)的發(fā)展特點(diǎn)與趨勢(1)數(shù)學(xué)方法的廣泛應(yīng)用。(2)邊緣統(tǒng)計學(xué)的形成。(3)借助計算機(jī)手段,統(tǒng)計學(xué)的應(yīng)用日益廣泛和深入。統(tǒng)計學(xué)的分類從統(tǒng)計方法的構(gòu)成角度分:1、描述統(tǒng)計學(xué)(descriptivestatistics)研究如何取得、整理和表現(xiàn)數(shù)據(jù)資料,進(jìn)而通過綜合、概括與分析反映客觀現(xiàn)象的數(shù)量特征。包括數(shù)據(jù)的收集與整理、數(shù)據(jù)的顯示方法、數(shù)據(jù)分布特征的描述與分析方法等。2、推斷統(tǒng)計學(xué)(inferentialstatistics)研究如何根據(jù)樣本數(shù)據(jù)去推斷總體數(shù)量特征的方法。包括抽樣估計、假設(shè)檢驗(yàn)、方差分析及相關(guān)和回歸分析等。描述統(tǒng)計學(xué)和推斷統(tǒng)計學(xué)的關(guān)系描述統(tǒng)計學(xué)是統(tǒng)計學(xué)的基礎(chǔ)和統(tǒng)計研究工作的前提,推斷統(tǒng)計學(xué)則是現(xiàn)代統(tǒng)計學(xué)的核心和統(tǒng)計工作的關(guān)鍵。從統(tǒng)計方法的研究和應(yīng)用角度分:1、理論統(tǒng)計學(xué)(theoreticalstatistics)利用數(shù)學(xué)原理研究統(tǒng)計學(xué)的一般理論和方法的統(tǒng)計學(xué),如概率論與數(shù)理統(tǒng)計2、應(yīng)用統(tǒng)計學(xué)(appliedstatistics)*研究如何應(yīng)用統(tǒng)計方法解決實(shí)際問題,大多是以數(shù)理統(tǒng)計為基礎(chǔ)形成的邊緣學(xué)科。如自然科學(xué)領(lǐng)域的生物統(tǒng)計學(xué)、社會科學(xué)領(lǐng)域的社會經(jīng)濟(jì)統(tǒng)計學(xué)等。統(tǒng)計學(xué)與其他學(xué)科的關(guān)系(一)統(tǒng)計學(xué)與數(shù)學(xué)的關(guān)系1、區(qū)別(1)研究對象不同:數(shù)學(xué)研究抽象的量,統(tǒng)計研究具體的量。(2)研究方法不同:數(shù)學(xué)是演繹,統(tǒng)計是歸納和演繹的結(jié)合。2.、聯(lián)系數(shù)學(xué)為統(tǒng)計研究提供數(shù)學(xué)公式、模型和分析方法。(二、)統(tǒng)計學(xué)與其他學(xué)科的關(guān)系統(tǒng)計幾乎與所有學(xué)科都有聯(lián)系。統(tǒng)計方法可以幫助其他學(xué)科探索學(xué)科內(nèi)的數(shù)量規(guī)律性,但對這種數(shù)量規(guī)律性的解釋與進(jìn)一步的研究,只能由各學(xué)科自已的研究完統(tǒng)計指標(biāo)統(tǒng)計指標(biāo)是反映統(tǒng)計總體數(shù)量特征的概念和數(shù)值。如2002年我國國內(nèi)生產(chǎn)總值104790.6億元。統(tǒng)計指標(biāo)由兩項(xiàng)基本要素構(gòu)成,即指標(biāo)的概念(名稱)和指標(biāo)的取值。指標(biāo)的概念(名稱)是對所研究現(xiàn)象本質(zhì)的抽象概括,也是對總體數(shù)量特征的質(zhì)的規(guī)定性。確定統(tǒng)計指標(biāo)必須有一定的理論依據(jù),使之與社會經(jīng)濟(jì)或科學(xué)技術(shù)的范疇相吻合。同時,又必須對理論范疇和計算口徑加以具體化。指標(biāo)的數(shù)值反映所研究現(xiàn)象在具體時間、地點(diǎn)、條件下的規(guī)模和水平。在觀察指標(biāo)數(shù)值時,必須了解其具體的時間狀態(tài)、空間范圍、計量單位、計量方法等限定,同時注意由于上述條件的變化而引起數(shù)值的可比性問題。特性:數(shù)量性、具體性、綜合性指標(biāo)與標(biāo)志的關(guān)系標(biāo)志反映總體單位的屬性和特征,而指標(biāo)則反映總體的數(shù)量特征。標(biāo)志和指標(biāo)的關(guān)系是個別和整體的關(guān)系。需要通過對各單位標(biāo)志的具體表現(xiàn)進(jìn)行匯總和計算才能得到相應(yīng)的指標(biāo)??傮w和單位的概念會隨著研究目的不同而變化,因此指標(biāo)與標(biāo)志的概念也是相對而言的。例如,所要研究的是全國工業(yè)企業(yè)的情況,則各企業(yè)的職工人數(shù)、固定資產(chǎn)、工業(yè)增加值等都是總體單位(即各個企業(yè))的標(biāo)志,如果研究目的變成研究某一企業(yè)的職工狀況,則該企業(yè)變成一個總體,企業(yè)職工人數(shù)變成了統(tǒng)計指標(biāo),每個職工的文化程度、技術(shù)等級、性別等就成為標(biāo)志。統(tǒng)計數(shù)據(jù)(一)變量與變量值說明現(xiàn)象的某一數(shù)量特征的概念也被稱為變量,變量的具體取值是變量值,統(tǒng)計數(shù)據(jù)就是統(tǒng)計變量的具體表現(xiàn)。例如,固定資產(chǎn)是一個變量,各企業(yè)固定資產(chǎn)的具體數(shù)值是變量值。為了區(qū)別,在本書中,凡是變量均用大寫的英文字母表示,而變量值則用小寫英文字母表示。連續(xù)型變量是指變量的取值在數(shù)軸上連續(xù)不斷,無法一一列舉,即在一個區(qū)間內(nèi)可以取任意實(shí)數(shù)值。例如,氣象上的溫度、濕度,零件的尺寸等。離散型變量是指變量的其取值是整數(shù)值,可以一一列舉。例如,企業(yè)數(shù),職工人數(shù)等。確定性變量是受確定性因素影響的變量,即影響變量值變化的因素是明確的,是可解釋和可控制的。隨機(jī)變量則是受許多微小的不確定因素(又稱隨機(jī)因素)影響的變量。變量的取值無法事先確定。社會經(jīng)濟(jì)現(xiàn)象既有確定性變量也有隨機(jī)變量。統(tǒng)計學(xué)所研究的主要是隨機(jī)變量。(二)數(shù)據(jù)的計量尺度統(tǒng)計數(shù)據(jù)是總體單位標(biāo)志或統(tǒng)計指標(biāo)的具體數(shù)量表現(xiàn)。根據(jù)對研究對象計量的不同精確程度,人們將計量尺度由低到高、由粗略到精確分為四個層次:定類尺度、定序尺度、定距尺度和定比尺度。(三)數(shù)據(jù)的類型橫截面數(shù)據(jù)又稱為靜態(tài)數(shù)據(jù),它是指在同一時間對同一總體內(nèi)不同單位的數(shù)量進(jìn)行觀察而獲得的數(shù)據(jù)。時間序列數(shù)據(jù)又稱為動態(tài)數(shù)據(jù),它是指在不同時間對同一總體的數(shù)量表現(xiàn)進(jìn)行觀察而獲得的數(shù)據(jù)。例如,2005年全國各省市自治區(qū)的國內(nèi)生產(chǎn)總值就屬于橫截面數(shù)據(jù)。而“十五”期間我國歷年的國內(nèi)生產(chǎn)總值就屬于時間序列數(shù)據(jù)。(四)數(shù)據(jù)的表現(xiàn)形式絕對數(shù)。現(xiàn)象的規(guī)模、水平一般以絕對數(shù)形式表現(xiàn)。絕對數(shù)的計量單位一般為實(shí)物單位或價值單位,有時也采用復(fù)合單位。實(shí)物單位可以是自然計量單位,也可以是物理計量單位,如人口數(shù)用人計量,機(jī)器數(shù)用臺計量,對于一些化工產(chǎn)品和燃料,常常還折合成標(biāo)準(zhǔn)實(shí)物單位計量。復(fù)合計量單位是由兩種或兩種以上計量單位復(fù)合而成的,如以“噸公里”為貨物周轉(zhuǎn)量的計量單位,以“千瓦時”為用電量的計量單位。相對數(shù)。相對數(shù)由2個互相聯(lián)系的數(shù)值對比求得。常用的相對數(shù)包括:結(jié)構(gòu)相對數(shù)、動態(tài)相對數(shù)、比較相對數(shù)、強(qiáng)度相對數(shù)、利用程度相對數(shù)、計劃完成相對數(shù)等。平均數(shù)。平均數(shù)反映現(xiàn)象總體的一般水平或分布的集中趨勢。關(guān)于這部分的內(nèi)容,將在第三章作詳細(xì)介紹。第二章統(tǒng)計數(shù)據(jù)的收集與整理。本章介紹統(tǒng)計數(shù)據(jù)的搜集及整理。重點(diǎn)在于統(tǒng)計調(diào)查方式和統(tǒng)計數(shù)據(jù)整理(分組)。統(tǒng)計調(diào)查方式:1、普查:為某一特定目的而專門組織的一次性全面調(diào)查如:人口普查、工業(yè)普查等●特點(diǎn):(1)通常是周期性的或一次性的,涉及面廣、耗時、費(fèi)力,一般需間隔較長時間;(2)一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時間,以避免調(diào)查數(shù)據(jù)的重復(fù)或遺漏;(3)準(zhǔn)確性一般較高,較規(guī)范;(4)適用的對象較窄,只能調(diào)查一些最基本、最一般的現(xiàn)象。2、抽樣調(diào)查:從調(diào)查對象的總體中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果推斷總體數(shù)量特征。●特點(diǎn):(1)經(jīng)濟(jì)性強(qiáng):工作量小、可節(jié)省人、財、物力(2)時效性高:可迅速、及時地獲得所需要的信息(3)適應(yīng)面廣:可獲得更廣泛的信息,適用于各個領(lǐng)域、各種問題的調(diào)查;(4)準(zhǔn)確性高:用工量小,從而工作可做得更細(xì),誤差往往很小。3、統(tǒng)計報表按國家有關(guān)法規(guī)規(guī)定,自上而下地統(tǒng)一布置,自下而上地逐級提供基本統(tǒng)計數(shù)據(jù)?!裉攸c(diǎn):統(tǒng)一的表式、統(tǒng)一的指標(biāo)、統(tǒng)一的報送時間、統(tǒng)一的報送程序。●類型:(1)按報送調(diào)查范圍分:全面報表:調(diào)查對象中的每一個單位都填報非全面報表:只要求調(diào)查對象中的一部分單位填報(2)按報送時間間隔分日報、月報、季報、年報(3)按報送地域(機(jī)構(gòu))范圍分:國家報表、地方報表、部門報表4、重點(diǎn)調(diào)查從調(diào)查對象的全部單位中選擇少數(shù)重點(diǎn)單位進(jìn)行調(diào)查(適用于“同類”中的“大戶”)。5、典型調(diào)查從調(diào)查對象的全部單位中選擇一個或幾個有代表性的單位進(jìn)行調(diào)查。(不一定針對“大戶”)▼注意:重點(diǎn)調(diào)查、典型調(diào)查與抽樣調(diào)查的不同處在于:1、抽樣調(diào)查是隨機(jī)抽取調(diào)查單位,不存在對調(diào)查對象選擇的主觀性,因此可以根據(jù)抽樣結(jié)果推斷總體的數(shù)量特征;2、重點(diǎn)調(diào)查和典型調(diào)查不是隨機(jī)取樣,具有一定的主觀性,因此調(diào)查結(jié)果不能推斷總體。數(shù)據(jù)的搜集方法1、訪問調(diào)查(派員調(diào)查):調(diào)查者與被調(diào)查者通過面對面的交談獲取調(diào)查資料;2、郵寄調(diào)查:通過郵寄或其他方式將問卷送至被調(diào)查者,由被調(diào)查者填寫問卷并寄回或投放到指定收集點(diǎn);3、電話調(diào)查:調(diào)查者利用電話同受訪者進(jìn)行語言交流以獲取信息;4、座談會(集體訪談):將受訪者集中在調(diào)查現(xiàn)場,使其對調(diào)查主題發(fā)表意見以獲取調(diào)查資料;5、個別深度訪問:一次只有一名受訪者參加的特殊的定性研究。統(tǒng)計數(shù)據(jù)的整理(summarizingdata)是指對所搜集的數(shù)據(jù)進(jìn)行加工整理、使之系統(tǒng)化、條理化,以符合分析的需要。統(tǒng)計數(shù)據(jù)的整理通常包括:數(shù)據(jù)的預(yù)處理分類或分組匯總數(shù)據(jù)分組與頻數(shù)分布統(tǒng)計分組是將預(yù)處理過的數(shù)據(jù)按照某種特征或標(biāo)準(zhǔn)分成不同的組別?!蚪y(tǒng)計分組標(biāo)志:分組時所依據(jù)的特征或標(biāo)準(zhǔn),有品質(zhì)標(biāo)志和數(shù)量標(biāo)志?!蝾l數(shù)分布表:對分組后的數(shù)據(jù),計算各組中數(shù)據(jù)出現(xiàn)的次數(shù)或頻數(shù)所形成的匯總表。概念:頻數(shù)/次數(shù)分布;相對頻數(shù);百分?jǐn)?shù)頻數(shù)◎頻數(shù)分布或次數(shù)分布(Frequencydistribution):全部數(shù)據(jù)按其分組標(biāo)志在各組內(nèi)的分布狀況。分布在各組內(nèi)的數(shù)據(jù)個數(shù)稱為頻數(shù)或次數(shù)。Afrequencydistributionisatabularsummaryofasetofdatashowingthefrequency(ornumber)ofitemsineachofseveralnonoverlappingclasses.◎相對頻數(shù)(Relativefrequency)/頻率/比重:各組頻數(shù)與全部頻數(shù)之和的比重。Therelativefrequencyofaclassistheproportionofthetotalnumberofdataitemsbelongingtotheclass.(=Frequencyoftheclass/n)◎百分?jǐn)?shù)頻數(shù)(Percentagefrequency):istherelativefrequencymultipliedby100.數(shù)值數(shù)據(jù)的分組與頻數(shù)分布分組計頻基本步驟:確定組數(shù)??確定組距??(按組)整理成分布頻數(shù)表第一步,確定組數(shù)(Numberofclasses)。組數(shù)的確定一般視數(shù)據(jù)本身的特點(diǎn)及數(shù)據(jù)的多少而定經(jīng)驗(yàn)上以5~20之間為好,尤其注意不要確定太多的組數(shù),使得每組包含的數(shù)據(jù)太少。實(shí)際分組時常按斯特格斯(Sturges)提出的經(jīng)驗(yàn)公式來確定組數(shù)K:第二步,確定組距(Widthofclasses):組距是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定:組距=(最大值-最小值)/組數(shù)第三步,確定各組組限(Classlimits)并據(jù)此整理頻數(shù)分布表。1、分組所遵循的主要原則是“不重不漏”(eachdatavaluebelongstooneclassandonlyoneclass)。因此,最低組限(Thelowerclasslimit)£數(shù)據(jù)的最小值,最大組限(Theupperclasslimit)3數(shù)據(jù)的最大值;另外,數(shù)據(jù)在每組中的歸屬習(xí)慣上采用“上組限不在內(nèi)”。2、對離散型數(shù)據(jù),可采用相鄰兩組組限間斷的辦法解決“不重”的問題(如6~10,11~15,16~20等);3、對連續(xù)型數(shù)據(jù),往往采用相鄰兩組組限重疊,根據(jù)“上限不在內(nèi)原則”解決“不重”問題(如[5,10),[10,15),[15,20)等)。注意:1、在最大值與最小值與其他數(shù)據(jù)相差懸殊時,為避免空白組出現(xiàn),第一組和最后一組可采用“XX以下”及“XX以上”這樣的開口組;2、在組距分組時,如果各組組距相等則稱為等距分組,否則為不等距分組。不等距分組各組的頻數(shù)受組距大小不同的影響,因此需要計算頻數(shù)密度(=頻數(shù)/組距),才能準(zhǔn)確反映頻數(shù)分布的實(shí)際;3、有時為了統(tǒng)計需要,需進(jìn)一步計算累積頻數(shù)(某數(shù)值以上或以下的頻之?dāng)?shù)和)。統(tǒng)計分組的概念、原則、則和方法統(tǒng)計表(補(bǔ)充講義14頁word文檔)。分配數(shù)列/次數(shù)分布數(shù)列由兩個要素構(gòu)成,一是組別,二是各組次數(shù)或頻率。根據(jù)需要,可以編制簡單次數(shù)分布表和累計次數(shù)分布表。次數(shù)分布主要有鐘形分布、U形分布和J形分布。統(tǒng)計表和統(tǒng)計圖統(tǒng)計表和統(tǒng)計圖是顯示統(tǒng)計數(shù)據(jù)的兩種重要形式。統(tǒng)計表的結(jié)構(gòu)從形式看可分為總標(biāo)題、橫表目、縱標(biāo)目和指標(biāo)數(shù)值;從內(nèi)容上看可分為主詞和賓詞兩部分。統(tǒng)計圖主要有條形圖、直方圖、圓形圖等。第三章、數(shù)據(jù)分布特征的描述。本章主要介紹數(shù)據(jù)的集中趨勢和離散趨勢。重點(diǎn)是各種平均指標(biāo)及離散指標(biāo)概念、計算方法和適用條件。統(tǒng)計學(xué)中刻劃數(shù)據(jù)分布特征的最主要的代表有二:數(shù)據(jù)分布的集中趨勢與數(shù)據(jù)分布的離散程度。集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向,測度集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值。均值(Mean)均值就是一組數(shù)據(jù)的平均值(averagevalue),用來測度中心位置(centrallocation)。1、算術(shù)平均數(shù)簡單算術(shù)平均數(shù)加權(quán)算術(shù)平均加權(quán)算術(shù)平均往往適用于對分組后的數(shù)據(jù)求均值,這時Xi為各組變量代表值(往往取組中值),F(xiàn)i為各組變量值出現(xiàn)的頻數(shù)。算術(shù)均值具有如下性質(zhì):(1)各變量值與其均值的離差和為零:(2)各變量值與其均值的離差平方和最小:(3)對被平均的變量實(shí)施某種線性變換后,新變量的算術(shù)平均數(shù)等于對原變量的算術(shù)平均數(shù)實(shí)施同樣的線性變換的結(jié)果。(4)對于任意兩個變量x和y,它們的代數(shù)和的算術(shù)平均數(shù)等于兩個變量的算術(shù)平均數(shù)的代數(shù)和。均值容易受到統(tǒng)計數(shù)據(jù)中個別極端數(shù)據(jù)的影響,從而使均值代表某組統(tǒng)計數(shù)據(jù)的“平均水平”時失去意義,這時往往用“剔除極端值”的方法加以修正。2、幾何平均數(shù)(1)幾何平均數(shù)是N個變量值乘積的N次方根(2)加權(quán)幾何平均數(shù)幾何平均數(shù)的對數(shù)是各變量值對數(shù)的算術(shù)平均。幾何平均主要用于計算比率或速度的平均幾何平均數(shù)的應(yīng)用及特點(diǎn):我國國內(nèi)生產(chǎn)總值2001年、2002年、2003年的環(huán)比發(fā)展速度分別是107.5%,108.3%,109.3%,則各年的平均發(fā)展速度是某人有一筆款項(xiàng)存入銀行10年,前2年的年利率為6%,第3至5年的年利率是5%,后5年的年利率3%,如果按復(fù)利計算,這筆款項(xiàng)的平均年利率為多少?這筆款項(xiàng)的平均年利率為4.2%。①應(yīng)用條件a.變量值是相對數(shù)據(jù),如比率或發(fā)展速度。b.變量值的連乘積等于總比率或總發(fā)展速度。②特點(diǎn)a.如果數(shù)列中有一個標(biāo)志值等于零或負(fù)值,則無法計算。b.受極端值影響較小,故較穩(wěn)健。(3)調(diào)和平均數(shù),是各數(shù)據(jù)倒數(shù)的(簡單)算術(shù)平均數(shù)的倒數(shù):價格=金額/購買量由相對數(shù)和平均數(shù)計算平均數(shù)根據(jù)相對數(shù)和平均數(shù)計算平均數(shù)時,如何正確選擇和應(yīng)用算術(shù)平均數(shù)與調(diào)和平均數(shù),在缺少被平均標(biāo)志x的分子資料時,要采用算術(shù)平均數(shù),即“缺分子,用算術(shù)”。如上述平均計劃完成程度,其分子是實(shí)際利潤額,分母是計劃利潤額,當(dāng)已知各企業(yè)的利潤計劃完成程度和計劃利潤額時(缺少實(shí)際利潤額),則采用算術(shù)平均數(shù)。利潤計劃完成程度x(%)企業(yè)數(shù)(個)計劃利潤額(萬元)80~90250090~10051600100~1103800合計10在缺少被平均標(biāo)志的分母資料時,要采用調(diào)和平均數(shù),即“缺分母,用調(diào)和?!比缋?.6中,當(dāng)已知各企業(yè)的利潤計劃完成程度和實(shí)際利潤額時(缺少計劃利潤額資料),則采用調(diào)和平均數(shù)。中位數(shù)(Median)中位數(shù)是一組數(shù)據(jù)按大小排序后,處于中間位置上的變量值。1、對于未分組數(shù)據(jù):(1)如果數(shù)據(jù)個數(shù)為奇數(shù),則中位數(shù)恰為處于中間位置的數(shù):(2)如果數(shù)據(jù)個數(shù)為偶數(shù),則為中間位置兩個數(shù)的平均數(shù)(2)單項(xiàng)數(shù)列的中位數(shù)計算各組的累計頻數(shù)(向上累計或向下累計);根據(jù)中位數(shù)位置確定中位數(shù)。對于分組后的數(shù)據(jù)下限公式:上限公式:式中:m為中位數(shù)所在的組,d為該組組距,L、U分別為該組的下限值與上限值,fm為該組的頻數(shù),Sm-1為該組以下各組的頻數(shù)總和,Sm+1為該組以上各組的頻數(shù)總和,顯然眾數(shù)(Mode)眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。在分組數(shù)據(jù)中,眾數(shù)可按下式計算:下限公式:上限公式:式中:fm為某數(shù)值出現(xiàn)次數(shù)(頻數(shù))最多的組(第m組)的頻數(shù),fm-1與fm+1分別為第m-1組與m+1組的頻數(shù),L、U分別為第m組的下限與上限值,d為該組組距。1、如果某組統(tǒng)計數(shù)據(jù)中沒有哪個數(shù)值出現(xiàn)較多的頻率(次數(shù)),則可認(rèn)為該組數(shù)無眾數(shù);如果有多個數(shù)據(jù)出現(xiàn)的次數(shù)(頻率)較多,則認(rèn)為有多個眾數(shù)。在有多個眾數(shù)的情況下,則對眾數(shù)的關(guān)注度下降,因?yàn)槎啾姅?shù)對描述數(shù)據(jù)位置無多大幫助。2、對描述品質(zhì)數(shù)據(jù)的分布特征的“位置”測度只能用眾數(shù)。中位數(shù)、眾數(shù)與算術(shù)平均數(shù)的關(guān)系眾數(shù)、中位數(shù)和均值都是對數(shù)據(jù)集中趨勢的測度,1、均值由全部數(shù)據(jù)計算,包含了全部數(shù)據(jù)的信息,具有良好的數(shù)學(xué)性質(zhì),當(dāng)數(shù)據(jù)接近對稱分布時,具有較好的代表性;但對于偏態(tài)分布,其代表性較差。2、中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受數(shù)據(jù)極端值的影響,對于偏態(tài)分布的數(shù)據(jù),其代表性要比均值好。3、眾數(shù)是一組數(shù)據(jù)分布的峰值,是一種位置的代表,當(dāng)數(shù)據(jù)的分布具有明顯的集中趨勢時,尤其對于偏態(tài)分布,眾數(shù)的代表性比均值好。4、對接近正態(tài)的分布數(shù)據(jù),常用均值描述數(shù)據(jù)的集中趨勢;對偏態(tài)分布,常用眾數(shù)或中位數(shù)描述數(shù)據(jù)的集中趨勢。5、均值只適用于定距或定比尺度的數(shù)據(jù);定序尺度數(shù)據(jù)可用中位數(shù)或眾數(shù)進(jìn)行描述,而對定類尺度數(shù)據(jù),只能用眾數(shù)進(jìn)行描述。分布離散程度的測度對數(shù)據(jù)分布特征的另一個測度指標(biāo)是數(shù)據(jù)分布離散程度。它反映各數(shù)據(jù)遠(yuǎn)離其中心值的程度,因此,也稱離中趨勢。集中趨勢反映的是各變量值向其中心值聚集的程度,離中趨勢反映各變量值之間的差異狀況。注意:集中趨勢的測度值概括地反映了數(shù)據(jù)的一般水平,它對該組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水平。數(shù)據(jù)的離散程度越大,集中趨勢的測度值對該組數(shù)據(jù)的代表性就越差。極差(Range)極差是最簡單的測度離中趨勢(分散程度)的指標(biāo),也稱全距,是一組數(shù)據(jù)最大值與最小值之差:Range=LargestValue-SmallestValue對于組距分組數(shù)據(jù),極差可近似地表示為:R=最高組上限-最低組下限▲注意:1、極差易受極端值的影響;2、由于極差只利用了數(shù)據(jù)兩端的信息,沒有反映中間數(shù)據(jù)的分散狀況,因而不能準(zhǔn)確描述數(shù)據(jù)的分散程度。方差(Variance)方差是各變量值與其均值離差(deviationaboutthemean)平方的平均數(shù)。總體方差(PopulationVariance)總體方差用s2表示其中:Fi為第i組數(shù)據(jù)的頻數(shù)Xi為第i個數(shù)(未分組)或第i組組中值(分組)樣本方差(SampleVariance)樣本方差用S2表示其中:fi為第i組數(shù)據(jù)的頻數(shù)xi為第i個數(shù)(未分組)或第i組組中值(分組)標(biāo)準(zhǔn)差:方差的平方根(正)。1、由于方差計算中使用了平方運(yùn)算,因此方差的單位也是平方,如上述班級規(guī)模例中方差為64(學(xué)生)2,其具體意義不明確。因此方差只有在比較不同組數(shù)據(jù)的離散程度時才有數(shù)量大小上的意義。2、標(biāo)準(zhǔn)差是對方差的開方運(yùn)算,因此,其單位與原始數(shù)據(jù)的單位一致,它與均值及其他用同一單位測度的數(shù)據(jù)相比較也容易一些。(標(biāo)準(zhǔn)差就是指數(shù)據(jù)“離散程度的測度值”距“均值”的距離)。離散系數(shù)(CoefficientofVariation)離散系數(shù):一組數(shù)據(jù)標(biāo)準(zhǔn)差與其均值的比,也稱為標(biāo)準(zhǔn)差系數(shù),是測度數(shù)據(jù)離散程度的相對指標(biāo):1、對不同組數(shù)據(jù),其離散程度既受其數(shù)據(jù)本身的水平的影響,也受數(shù)據(jù)計量單位的影響,因此對不同(性質(zhì))組別的數(shù)據(jù),不好用離差或標(biāo)準(zhǔn)差來比較它們的離散程度;2、由于離散系數(shù)消除了來自這兩方面的影響,因此可以用它進(jìn)行不同數(shù)據(jù)組的比較。分布偏態(tài)與峰度的測度偏態(tài)(Skewness)和峰度(Kurtosis)是對數(shù)據(jù)分布特征的進(jìn)一步描述。平均數(shù)與標(biāo)準(zhǔn)差相同的數(shù)據(jù)組,其頻數(shù)分配(分布)也可能不同,如果頻數(shù)分布是對稱的,則稱為對稱分布,否則為偏態(tài)分布。偏態(tài)及其測度測定偏態(tài)的方法主要有兩種:(1)算術(shù)平均數(shù)與眾數(shù)比較法,(2)動差法。算術(shù)平均數(shù)與眾數(shù)比較法完全對稱分布:算術(shù)平均數(shù)、中位數(shù)、眾數(shù)重合非對稱分布:三者相互分離,算術(shù)平均數(shù)<中位數(shù)<眾數(shù)可用算術(shù)平均數(shù)與眾數(shù)之間的距離作為測度偏態(tài)的一個尺度:偏態(tài)=算術(shù)平均數(shù)-眾數(shù)這是偏態(tài)的絕對數(shù),它以原有數(shù)據(jù)的單位為單位。峰度及其測度峰度是頻數(shù)分布的另一重要特點(diǎn)。其測度的是:某種頻數(shù)分布的曲線與正態(tài)分布曲線相比,是尖頂,還是平頂,其尖或平的程度如何。峰度就是頻數(shù)分布曲線頂端的尖峭程度。峰度的測度,往往以中心4階動差為基礎(chǔ)進(jìn)行;第四章抽樣估計。本章主要介紹了抽樣估計的基本概念及抽樣估計。點(diǎn)估計和區(qū)間估計。其中區(qū)間估計是主要方法。應(yīng)理解置信區(qū)間、置信度、顯著性水平的含義,領(lǐng)會區(qū)間估計精確度和可靠度之間的關(guān)系,重點(diǎn)掌握總體均值和總體比例的區(qū)間估計方法、樣本容量的確定方法。一般所講的抽樣調(diào)查,即指狹義的抽樣調(diào)查(隨機(jī)抽樣):按照隨機(jī)原則從總體中抽取一部分單位進(jìn)行觀察,并運(yùn)用數(shù)理統(tǒng)計的原理,以被抽取的那部分單位的數(shù)量特征為代表,對總體作出數(shù)量上的推斷分析。抽樣估計的特點(diǎn)按隨機(jī)原則抽取樣本單位目的是推斷總體的數(shù)量特征抽樣推斷的結(jié)果具有一定的可靠程度,抽樣誤差可以事先計算并控制抽樣推斷中的基本概念全及總體和樣本1.全及總體:是由被調(diào)查對象的全部單位所構(gòu)成的集合體,簡稱總體??傮w容量:總體中的單位數(shù),用N表示。2.樣本:樣本是從總體中抽取的進(jìn)行調(diào)查的部分單位的集合體,又稱抽樣總體。樣本容量:樣本中的單位數(shù),用n表示。大樣本和小樣本:n≥30時稱大樣本,n<30稱小樣本。**應(yīng)用:在班級40名學(xué)生中隨機(jī)選取15人進(jìn)行健康狀況調(diào)查,說明其中的總體、樣本及容量。概率抽樣與非概率抽樣1.概率抽樣:又稱隨機(jī)抽樣,是按隨機(jī)原則抽取樣本單位。本章所指的均為概率抽樣。2.非概率抽樣:又稱非隨機(jī)抽樣,是指從研究的目的和需要出發(fā),根據(jù)調(diào)查者的經(jīng)驗(yàn)或判斷,從總體中有意識地抽取部分單位構(gòu)成樣本。**應(yīng)用舉例:重點(diǎn)調(diào)查、典型調(diào)查應(yīng)為非概率抽樣。重復(fù)抽樣和不重復(fù)抽樣1.重復(fù)抽樣:又稱有放回的抽樣,從總體中抽取樣本時,每次被抽中的單位都再被放回總體中參與下一次抽樣。2.不重復(fù)抽樣:又稱無放回的抽樣,總體中隨機(jī)抽選的單位經(jīng)觀察后不放回到總體中,即不再參加下次抽樣。總體參數(shù)和樣本統(tǒng)計量1.總體參數(shù):是反映總體數(shù)量特征的數(shù)值。在抽樣推斷中,參數(shù)是未知的、待估計的確定值。2.樣本統(tǒng)計量:是根據(jù)樣本資料計算的反映樣本數(shù)量特征的變量,它的值隨著樣本的不同而變化,因此是一個隨機(jī)變量。抽樣誤差的概念及其影響程度抽樣誤差即指隨機(jī)誤差,這種誤差是抽樣調(diào)查固有的誤差,是無法避免的。簡單隨機(jī)抽樣的抽樣平均誤差區(qū)間估計的步驟區(qū)間估計根據(jù)給定的條件不同,有兩種估計方法:⑴給出允許誤差(Δ),求概率保證程度F(t)。⑵給出概率保證程度F(t),求估計區(qū)間。⑴給出Δ,求F(t)①抽取樣本,計算樣本指標(biāo)(樣本平均數(shù)、樣本方差、抽樣平均誤差);②根據(jù)給定的抽樣誤差——允許誤差Δ計算估計區(qū)間的上、下限;③求出概率度t,F(xiàn)(t),對總體參數(shù)作區(qū)間估計。⑵給出概率保證程度F(t),求估計區(qū)間。①抽取樣本,計算樣本指標(biāo)(樣本平均數(shù)、樣本方差、抽樣平均誤差);②根據(jù)給定的F(t),查表求出t;③求出抽樣極限誤差Δ和估計區(qū)間的上、下限,對總體參數(shù)作區(qū)間估計。區(qū)間估計注意首先確定被估計總體指標(biāo)的種類,是平均數(shù)還是成數(shù);其次取定抽樣方法,是重置抽樣還是不重置抽樣;然后再根據(jù)給定的樣本資料和抽樣條件(給定概率保證程度還是給定抽樣極限誤差),確定計算步驟,進(jìn)行計算。抽樣組織方式設(shè)計類型概念。第五章假設(shè)檢驗(yàn)與方差分析。理解原假設(shè)、備擇假設(shè)、兩類錯誤、單側(cè)檢驗(yàn)、雙側(cè)檢驗(yàn)、方差分析等概念。掌握總體方差已知或未知時正態(tài)總體的均值假設(shè)檢驗(yàn)和總體比例的假設(shè)檢驗(yàn)。重點(diǎn)是三種不同情況下的假設(shè)檢驗(yàn)方法,總體方差已知時正態(tài)總體均值和總體比例的假設(shè)檢驗(yàn)。難點(diǎn)是總體方差未知時正態(tài)總體均值的假設(shè)檢驗(yàn)和方差分析。假設(shè)檢驗(yàn)的概念假設(shè)(hypothesis),又稱統(tǒng)計假設(shè),是對總體參數(shù)的具體數(shù)值所作的陳述。假設(shè)檢驗(yàn)(hypothesistest
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 彩鋼板開洞施工方案
- 露營基地設(shè)備租賃方案
- 巖板上墻鋪貼施工方案
- 海南瓊口口腔醫(yī)院項(xiàng)目環(huán)境影響報告表環(huán)評報告表
- 銅陵安全人臉識別施工方案
- 濟(jì)南玻璃鋼纖維布施工方案
- 滁州家用車庫地坪施工方案
- 氣象站防電涌入侵施工方案
- 臨沂古建施工方案公司
- 壓花地坪施工方案
- 小學(xué)人教版四年級下冊數(shù)學(xué)租船問題25題
- 大連市小升初手冊
- 醫(yī)療垃圾管理及手衛(wèi)生培訓(xùn)PPT課件
- 放射物理與防護(hù)全套ppt課件
- 嚇數(shù)基礎(chǔ)知識共20
- 鋰電池安全知識培訓(xùn)-課件
- 鋼桁架與屋蓋結(jié)構(gòu)課件
- 電子產(chǎn)品高可靠性裝聯(lián)工藝下
- 越南北部工業(yè)區(qū)資料(1060707)
- 東亞文明的歷史進(jìn)程課件
- 三洋波輪洗衣機(jī)說明書
評論
0/150
提交評論