統(tǒng)計學填空簡答_第1頁
統(tǒng)計學填空簡答_第2頁
統(tǒng)計學填空簡答_第3頁
統(tǒng)計學填空簡答_第4頁
統(tǒng)計學填空簡答_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第一章緒論統(tǒng)計三層涵義:統(tǒng)計活動、統(tǒng)計數(shù)據(jù)和統(tǒng)計學。統(tǒng)計學:是一門收集、整理、歸納、分析統(tǒng)計數(shù)據(jù)的科學,其目的是探索數(shù)據(jù)內(nèi)在的數(shù)量和規(guī)律 性。統(tǒng)計學發(fā)展過程:創(chuàng)立于17C至18C古典統(tǒng)計學(國勢學/政治算數(shù)學-威廉配第)-近代統(tǒng)計學(統(tǒng)計學之父凱特勒,將概率論和統(tǒng)計學結(jié)合)-現(xiàn)代統(tǒng)計學/變異性。1.統(tǒng)計學研究對象:客觀事物的數(shù)量特征和數(shù)量關(guān)系。研究對象四大特點:數(shù)量性/總體性/具體性 兩種統(tǒng)計研究方法:(描述統(tǒng)計和推斷統(tǒng)計)按分析方法不同:描述統(tǒng)計和推斷統(tǒng)計./A.描述統(tǒng)計:用圖形、表格和概括性的數(shù)字對數(shù)據(jù)進行 描述的統(tǒng)計方法。主要內(nèi)容包括:數(shù)據(jù)搜集、加工處理、顯示、概括與分析./B.推斷統(tǒng)計

2、:根據(jù) 樣本信息對總體進行參數(shù)估計、假設(shè)檢驗、預測或其他推斷的統(tǒng)計方法。/C.描述統(tǒng)計與推斷統(tǒng) 計的關(guān)系:二者是統(tǒng)計方法的兩個組成部分,描述統(tǒng)計是統(tǒng)計學的基礎(chǔ),推斷統(tǒng)計是現(xiàn)代統(tǒng)計學的主 要內(nèi)容.2.按研究用度不同:理論統(tǒng)計和應用統(tǒng)計1.總體與樣本:總體:是由客觀存在的、具有某種共同性質(zhì)的許多個別單位構(gòu)成的全體。兩特點:同質(zhì)性/大量性。2.總體單位:組成總體的每個單位資料的原始承擔者一資料最初取得來源1.樣本:從總體中隨機抽取若干單位構(gòu)成的集合。四特點:取自總體內(nèi)部/不唯一性/代表性/客觀性 變量與標志2.變量:總體中個體單位所具有的特征或特性。1、變量:可變的數(shù)量標志/2、變量值:變量的數(shù) 量

3、表現(xiàn)化。按其變量值是否具有連續(xù)性:連續(xù)變量一小數(shù)和整數(shù)/離散變量一整數(shù)按性質(zhì): 確定性變量/隨機性變量標志:說明總體各單位的屬性和特征名稱。按反映單位的特征分類:品質(zhì)標志一文字/數(shù)量標志一 數(shù)字(變量)。按各單位的表現(xiàn)是否相同分類:可變標志/不變標志參數(shù)與統(tǒng)計量1.參數(shù):描述總體特征的概括性數(shù)字度量,是總體的某種特征值。希臘字母:如總體均值(標準差 (6/總體比例(兀)2.統(tǒng)計量:描述樣本特性的概括性數(shù)字度量根據(jù)樣本數(shù)據(jù)計算出來的一些量是樣本的函數(shù)。小寫英 文表示如樣本均值(X)、樣本標準差(s)、樣本比例(p )等第二章數(shù)據(jù)的收集和整理定類(列名)尺度=咪定序(順序)尺度V/定距(間隔)尺度

4、+ -/定比(比率)尺度x-(由低到高,由粗略到精 確)數(shù)據(jù)三種類型:靜態(tài)(橫截面)數(shù)據(jù)/動態(tài)(時間序列)數(shù)據(jù)/平行數(shù)據(jù)(動靜態(tài)結(jié)合)數(shù)據(jù)的三種表現(xiàn)形式:絕對數(shù)/相對數(shù)/平均數(shù)統(tǒng)計數(shù)據(jù)的來源:兩種途徑-次級數(shù)據(jù)(第二手數(shù)據(jù)).原始數(shù)據(jù)(第一手數(shù)據(jù))1.間來2直接來源.科學實驗或統(tǒng)計調(diào)查。統(tǒng)計調(diào)查分為:A普查:為某一特定目的,專門組織的一次 四種計量尺度:性全面調(diào)查./B.抽查:通過隨機樣本對總體數(shù)量規(guī)律性進行推斷的方法.五特點:客觀/經(jīng)濟/時效性強/適應面廣/統(tǒng)計調(diào)查的方案設(shè)計(六步驟):1確定調(diào)查目的/2確定調(diào)查對象和單位/3設(shè)計調(diào)查項目和調(diào)查表/4確定調(diào)查時間/5調(diào)查方法的選擇/6統(tǒng)計調(diào)查

5、的組織實施數(shù)據(jù)搜集的五種組織方式:準確性高 .一 1.普查(特定目的,全面調(diào)查)/2.抽樣調(diào)查(隨機,抽一部分,反映總體特征)/3.重點調(diào)查(非隨機,抽一 部分,大致反映總體特征仞/4.典型調(diào)查排隨機,抽特殊的,不反映總體特征)/5.統(tǒng)計報表 我國目前形成了以定期普查為基礎(chǔ),經(jīng)常性抽查為主體,以重點調(diào)查和統(tǒng)計報表為輔助的資料搜集模 式.數(shù)據(jù)搜集的四種基本方法:直接觀察法/訪問法/報告法/問卷法統(tǒng)計整理的兩個核心:統(tǒng)計數(shù)據(jù)的分組和編制頻數(shù)分布表.統(tǒng)計數(shù)據(jù)的分組是統(tǒng)計整理的第一步。品質(zhì)標志分組:按事物性質(zhì)和屬性劃分數(shù)量標志分組. 按數(shù)量特征分布數(shù)列由兩個基本要素構(gòu)成:組/單位數(shù)(即次數(shù)或頻數(shù)).各

6、組次數(shù)與總次數(shù)之比稱頻率或比重.根據(jù) 分組標志的特征不同劃分為:品質(zhì)數(shù)列和變量數(shù)列.組距式變量數(shù)列(頻數(shù)分布表)編制方法:1.全距R=最大變量值-最小變量值次數(shù)分配/分布數(shù)列/頻數(shù)分布:在統(tǒng)計分組的基礎(chǔ)上,將總體的所有單位按一定標志分組整理,并 按一定順序排列形成總體單位在各組的分布.N(N表示變量個數(shù))組距i=R/n=上限-下限組距是各組中最大變量值和最小變量值之差)2.3.4.5.6.組數(shù)n=1+3.322lgN(N表示變量個數(shù))組距i=R/n=上限-下限(組距是各組中最大變量值和最小變量值之差)組限(限 組中值=(上限+下限)/2定各組組距的數(shù)值)=(上限+下限)/2 (組中值是上限到下

7、限之間的中點數(shù)值)累計頻數(shù)(分布在各組的單位數(shù)如人數(shù))和累計頻率(各組次數(shù)與總次數(shù)之比為頻率如人數(shù)比重).向 上累計頻數(shù)(頻率)是變量值小的組向大的組依次累計第三章數(shù)據(jù)特征的度量眾數(shù)、中位數(shù)和均值的關(guān)系:眾數(shù)是分布最高峰所在的位置。中位數(shù)從面積上將分布分成兩等份。均值由于受極端值的影響,故將均值拉向偏向極端值的右方?-已分組數(shù)據(jù)均值:X i=1 xifi方差:S2 82 =1離散系數(shù):V=E數(shù)據(jù)的分布特征:可從數(shù)據(jù)的集中程度/數(shù)據(jù)的離散程度/數(shù)據(jù)分布的峰度和偏度三個方面度量和 描述.數(shù)據(jù)集中程度的度量:反映的是數(shù)據(jù)一般水平的代表值或者數(shù)據(jù)分布的中心值。(測度方法有:簡 單or加權(quán)算數(shù)平均數(shù)/調(diào)

8、和(倒數(shù))平均數(shù)/幾何平均數(shù)G/眾數(shù)M /中位數(shù)M )其中各種平均數(shù)是 計算的平均數(shù)中位數(shù)和眾數(shù)是位置平均數(shù)不易受極端值的影響 0e眾數(shù)/中位數(shù)/均值的特點和關(guān)系:眾數(shù):不受極端值影響/具有不惟一性/數(shù)據(jù)分布偏斜程度較大時應用中位數(shù):不受極端值影響/數(shù)據(jù)分布偏斜程度較大時應用均值:易受極端值影響/數(shù)學性質(zhì)優(yōu)良/數(shù)據(jù)對稱分布或接近對稱分布時應用關(guān)系:無偏分布對稱分布右偏分布第四章標微數(shù)據(jù)離散程度的度量:反映的則是分布離散和差異程度(測度方法有:極差R/內(nèi)距(四分位差)/方差 182標準差6/離散系數(shù))。同度量因素:指媒介因素,使若干由于度量單位不同不能直接相加的指標,過渡到可以加總和比較 而使用

9、的媒介因素.作用:將不同度量的現(xiàn)象轉(zhuǎn)化為同度量的現(xiàn)象,編制數(shù)量指標指數(shù)時,同度量因素所屬時期固定在基期水平上;編制質(zhì)量指標指數(shù)時,同度量因素所屬時期固定在報告期水平上。.1.2.3.指數(shù)的作用:1 .綜合反映事物的變動方向與變動程度/2.對復雜的社會經(jīng)濟現(xiàn)象進行因素分析/3 可以研究事物在長時間內(nèi)的變化趨勢綜合指數(shù)和平均指數(shù):綜合指數(shù):編制基本方法為先綜合后對比,包括帕氏指數(shù)和拉氏指數(shù)平均指數(shù):編制基本方法為先對比后平均包括算術(shù)平均指數(shù)和調(diào)和平均指數(shù)二者都是總指數(shù)的基本形式之一,用來反映復雜現(xiàn)象總變動都與基期和報告期相關(guān),分為質(zhì)量因 素和數(shù)量因素隨機變量的概率分布:1、離散型隨機變量的概率分布

10、:可以用圖形或公式來描述隨機變量的可 能取值及其所對應的概率課例舉。2、連續(xù)型隨機變量的概率密度:不可舉例,只可以取某一區(qū)第五章抽樣與抽樣分布抽樣調(diào)查:按照一定的規(guī)則從總體中取出一部分單元組成一個樣本,并收集樣本的數(shù)據(jù)資料的過 程,簡稱為抽樣.根據(jù)抽樣的原則不同,抽樣方法有隨機抽樣和非隨機抽樣兩種。隨機抽樣分類:(根據(jù)抽樣規(guī)則不同,抽樣可以分為隨機抽樣和非隨機抽樣)1、簡單隨機抽樣(可重復亦可不重復):在從總體中抽取n個單位為樣本,也稱純隨機抽樣。特點: 最符合隨機原則,但在實際操作中存在局限性/2、分層/分類抽樣(可重復亦可不重復):在抽樣之前先將總體的單位劃分為若干層,然后從各個層 中抽取

11、一定數(shù)量的單位組成一個樣本。若。較大,分層比簡單誤差小。/3、系統(tǒng)抽樣/等距抽樣/機械抽樣(不重復抽樣):在抽樣中先將總體個單位按某種順序排列,并按某 種規(guī)則確定一個隨機起點,然后,每隔一定的間隔抽取一個單位,直至抽取n個單位形成一個樣本。/重復抽樣與不重復抽樣.(有放回和無放回的簡單隨機抽樣)重復:從總體中抽取一個單位并加以計量后,把這個單位放回到總體中再抽取第二個單位,直到抽取 個單位為止.不重復:一個單位被抽中后不再放回總體,然后再從所剩下的單位中抽取第二個單位,直4、整群抽樣:先將總體劃分成若干群,然后再以群作為調(diào)查單位從中抽取部分群,進而對抽中的各 個群中所包含的所有個體單位進行調(diào)查

12、或觀察。到抽出n個單位為止。抽樣分布:由樣本n個觀察值計算的統(tǒng)計量的概率分布。樣本統(tǒng)計量:是根據(jù)樣本資料計算出來的,值隨著樣本的不同而變化,是一個關(guān)于樣本的隨機變量.三種分布的概念:總體分布:總體中各元素的觀察值所形成的分布;分布通常是未知的;可以假定它服從某種分布。樣本分布:一個樣本中各觀察值的分布,也稱經(jīng)驗分布.當樣本容量n逐漸增大時,樣本分布逐漸接 近總體的分布抽樣分布:是由來自某總體樣本的n個觀測值計算的統(tǒng)計量的概率分布,是一種理論分布。三個抽樣分布:樣本均值的抽樣分布:由獨立同分布中心極限定理,如果n充分大,當重復抽樣時,樣本均值乂服 從均值為p,方差為。2的正態(tài)分布.當n30時,樣

13、本均值的抽樣分布可以看做正態(tài)分布.樣本比率的抽樣分布:如果從總體中簡單隨機抽樣則每次抽中的單元具有性質(zhì)A的概率為n。從總 體中抽取一個容量為n的簡單隨機樣本,則該樣本中具有性質(zhì)A的單元的個數(shù)隨機變量X服從參 數(shù)為(n,n )的二項分布,即XB(n,n )。由伯努利中心極限定理,當n充分大時,隨機變量X近似服 從均值為nn,方差為nn(1-n)的正態(tài)分布樣本方差的抽樣分布:由卡方分布的定義,對來自正態(tài)總體的簡單隨機樣本,統(tǒng)計敦2=(n-1)s2/o 2服從自由度為n-1的卡方分布.第六章參數(shù)估計參數(shù)估計:利用樣本所獲得的一些數(shù)量特征(樣本統(tǒng)計量)來估計總體參數(shù).分為點估計和區(qū)間估計.點估計:用樣

14、本估計量。的值直接作為總體參數(shù)。的估計值區(qū)間估計:在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個范圍。估計與估計量:估計:是根據(jù)樣本統(tǒng)計量的觀測值來確定參數(shù)值估計量:是利用樣本統(tǒng)計量來估計總體參數(shù)./ 評價估計的優(yōu)良性:需要集合估計量的性質(zhì)來評判.性質(zhì)包括:無偏性/有效性/ 一致性置信區(qū)間:由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間為置信水平.在同樣的置信水平下,抽樣比較越大,給出的置信區(qū)間寬度越小95%的置信水平是指:用同樣的方法構(gòu)造的總體參數(shù)的多個區(qū)間中,包含總體參數(shù)的比例為95%. 影響樣本容量大小的因素有:總體方差,可靠程度,允許誤差置信水平:將構(gòu)造置信區(qū)間的步驟重復很多次,置信區(qū)間

15、包含總體參數(shù)真值的次數(shù)所占的比率稱第七章假設(shè)檢驗假設(shè)檢驗:是先對總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成 立的過程.分為兩類:參數(shù)檢驗和非參數(shù)檢驗.邏輯上運用反證法,統(tǒng)計上依據(jù)小概率原理平/拒絕域和接受域 假設(shè)檢驗中的兩種假設(shè):1. 1.原假設(shè):是研究者想收集證據(jù)予以反對的假設(shè),也稱為零假設(shè),在線性條件下無相關(guān)關(guān)系即相關(guān)系假設(shè)檢驗的基本概念:小概率原理/原假設(shè)與備擇假設(shè)/單側(cè)檢驗與雙側(cè)檢驗/兩類錯誤與顯著性水 數(shù)計算結(jié)果為零。用H0表示。只存在符號=)備擇假設(shè):是研究者想收集證據(jù)予以支持的假設(shè),也稱為研究假設(shè),用H表示。只存在符號壬) 假設(shè)檢驗的原理:小概率原理.即

16、在一次試驗中,一個幾乎不可能發(fā)生的1事件發(fā)生的概率.在一次試 驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè).小概率由研究者事先確定.在進行假設(shè)檢驗 的時候,人們總是視問題的要求,規(guī)定一個小概率的參考偷 (0園1)然后把事件發(fā)生的概率 與進行比較。持或證實的。3、在假設(shè)檢驗中,等號總是放在原假設(shè)上。4、在面對某一實際問題時,由于不同 的研究者有不同的研究目的,即使對同一問題也可能提出截然相反的原假設(shè)和備擇假設(shè)。5、假 設(shè)檢驗的目的主要是收集證據(jù)來拒絕原假設(shè)。兩類錯誤與顯著性水平:當原假設(shè)為真時拒絕原假設(shè),所犯的錯誤稱為第I類錯誤,又被稱為棄真錯誤。第I類錯誤的概率被稱為顯著性水平,通常為a。2

17、.當原假設(shè)為假時沒有拒絕原假設(shè),所犯的錯誤被稱為第II類錯誤,又稱為取偽錯誤。犯第II類錯 誤的概率通常記為6。/ 假設(shè)檢驗的步驟:建立假設(shè):1、在一項假設(shè)檢驗中,原假設(shè)和備擇假設(shè)必有一個成立,而且只有一個成立。2、在 建立假設(shè)時,通常是確定備擇假設(shè),然后再確定原假設(shè)。備擇假設(shè)是人們所關(guān)心的,是想予以支根據(jù)問題的要求,提出原假設(shè)H0和備擇假設(shè)H1/H 樣本數(shù)據(jù)計算出檢驗/計量的具體數(shù)值/否則不拒絕H0給出顯著性水平,確定檢驗統(tǒng)計量的臨界值與拒絕域/變量間的兩種相互關(guān)系:函數(shù)關(guān)系:變量之間存在的嚴格的確定的關(guān)系。相關(guān)關(guān)系:指變量之間的不確定性的依存關(guān)系。相關(guān)關(guān)系的類型:把檢驗魏麟量界值作比較值進

18、行決策統(tǒng)計量的值落在拒絕域,拒絕H。, 第九章相關(guān)與回歸分析、點估計量的抽樣標準差1.2.1.2.3.4.,1.2.3.4.5.6.按相關(guān)的方向劃分:正相關(guān)和負相關(guān)。按照相關(guān)關(guān)系的密切程度劃分:完全相關(guān)、不完全相關(guān)和不相關(guān)。 按相關(guān)的表現(xiàn)形式劃分:線性相關(guān)和非線性相關(guān)。按相關(guān)關(guān)系涉及的變量多少劃分:單相關(guān)、復相關(guān)和偏相關(guān)。X和Y之間的關(guān)系是線性的零均值.E是一個隨機變量,具有零均值 同方差上具有相同的方差對一元回歸模型進行參數(shù)估計前應該對簡單線性回歸模型做出如下假設(shè):獨立性.E之間相互獨立正態(tài)性.E服從正態(tài)分布X是非隨機的.與E相互獨立.否則分不清是誰對Y的貢獻,1.2.3.相關(guān)分析與回歸分析

19、的區(qū)別:相關(guān)分析:研究變量之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及 相關(guān)程度,是研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法回歸分析:卻是確定兩個或兩個以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。具體關(guān)系相關(guān)系數(shù)可以用來反映變量之間相關(guān)關(guān)系密切程度。相關(guān)系數(shù)是按積差方法計算,同樣以兩變量與各相關(guān)分析其主要目的在于分析現(xiàn)象間相關(guān)關(guān)系的形式和密切程度以及依存變動的規(guī)律性,一般不 區(qū)別自變量或因變量,而回歸分析則需要分析現(xiàn)象之間相關(guān)的具體形式,確定其因果關(guān)系,并用數(shù)學 模就 自平均值的離差為基礎(chǔ),通過兩個離差相乘來反映兩變量之間相關(guān)程度一 相關(guān)系數(shù)的檢驗:1.提出假設(shè):吒

20、: =0 2,構(gòu)造檢驗統(tǒng)計量t= 3.給定顯著性水平a,查表 得到臨界值t./2 ,(n-2) 4.作決策:若統(tǒng)計量計算值的絕對值大于臨界值,拒絕原假設(shè)第十章時間序列分析時間序列分析:一門專門研究按時間的先后順序觀測并記錄的數(shù)據(jù)的規(guī)律性的分析方法。時間序列:按照時間的先后順序記錄,并排列而成的數(shù)列,也稱為動態(tài)數(shù)列時間序列的兩個基本要素:被研究對象所屬的時間范圍/反映該現(xiàn)象一定時間條件下數(shù)量特征的數(shù)值,即在不同時間上的統(tǒng)計數(shù)據(jù)時間序列分析的目的:描述事物在過去時間的狀態(tài),分析其隨時間推移的發(fā)展趨勢,揭示事物發(fā) 展變化的規(guī)律,預測事物在未來時間的數(shù)量即分析過去、認識規(guī)律、預測未來時間序列的種類:(按照其數(shù)量指標的性質(zhì)和表現(xiàn)形式,時間序列可以分為:絕對數(shù)時間序列/相對數(shù)時間序列/平均數(shù)時 間序列)絕對數(shù)時間序列:將同類總量指標值在不同時可上的數(shù)值按時間的先后順序排列所形成的時間序 列,反映了社會經(jīng)濟現(xiàn)象達到的絕對水平。根據(jù)時間的特點,絕對數(shù)時間序列又可分為時期序列 和時點序列。相對數(shù)(平均數(shù))時間序列:將同類相對指標(平均指標)在不同時間上的數(shù)值按時間的先后順 序排列所形成的時間序列/都是絕對數(shù)時間序列派生出來的/各時間上的指標值直接相加都沒有 實際意義1.保證序列的可比性/2 .要保證獲取數(shù)據(jù)的時間間隔一致/3.保證獲取數(shù)據(jù)的總體范圍一致/4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論