江西財經(jīng)大學統(tǒng)計學第一章數(shù)據(jù)與統(tǒng)計學-_第1頁
江西財經(jīng)大學統(tǒng)計學第一章數(shù)據(jù)與統(tǒng)計學-_第2頁
江西財經(jīng)大學統(tǒng)計學第一章數(shù)據(jù)與統(tǒng)計學-_第3頁
江西財經(jīng)大學統(tǒng)計學第一章數(shù)據(jù)與統(tǒng)計學-_第4頁
江西財經(jīng)大學統(tǒng)計學第一章數(shù)據(jù)與統(tǒng)計學-_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、STATSTAT 本章重點本章重點 1.數(shù)據(jù)類型數(shù)據(jù)類型 2. .統(tǒng)計學基本概念統(tǒng)計學基本概念 3. .統(tǒng)計學研究方法統(tǒng)計學研究方法 本章難點本章難點 1. .統(tǒng)計學基本概念統(tǒng)計學基本概念STAT 第一節(jié) 數(shù)據(jù)的定義、測量尺度和類型一、數(shù)據(jù)及信息、知識的定義一、數(shù)據(jù)及信息、知識的定義 數(shù)據(jù)數(shù)據(jù)是關(guān)于變量的觀測值。是數(shù)字化的信息記錄。是關(guān)于變量的觀測值。是數(shù)字化的信息記錄。 信息信息是把數(shù)據(jù)置于特定背景下,對數(shù)據(jù)的解釋和注釋,賦是把數(shù)據(jù)置于特定背景下,對數(shù)據(jù)的解釋和注釋,賦予予數(shù)據(jù)的具體意義數(shù)據(jù)的具體意義。 在信息化時代,通常把存儲在計算機或硬盤中的各類信息也稱為數(shù)據(jù),即泛數(shù)據(jù)泛數(shù)據(jù)。 STAT

2、 知識知識是人類識別萬物實體和性質(zhì),以及是與不是的是人類識別萬物實體和性質(zhì),以及是與不是的信息集信息集合合。是人類認識自然、改造自然過程中實踐經(jīng)驗的總結(jié)。 45;某某人今年是45歲;某某地區(qū)的平均年齡是45歲二、數(shù)據(jù)的測量尺度二、數(shù)據(jù)的測量尺度對事物進行分類的依據(jù):定定類類尺度;定尺度;定序序尺度;定尺度;定距距尺尺度;定度;定比比尺度尺度。 四類尺度的區(qū)別:四類尺度的區(qū)別:1.1.定類、定序尺度定類、定序尺度沒有確定的計量單位;定距、定比尺度定距、定比尺度有確定的計量單位; 2.2.定類、定序變量定類、定序變量不能進行數(shù)學計算;定距、定比變量定距、定比變量的值均以數(shù)字表示,能進行數(shù)學計算。S

3、TAT 3. 3.定距尺度定距尺度沒有絕對意義上的零點;定比尺度定比尺度有絕對意義上的零點。 4.4.定距尺度定距尺度只能加減加減運算;定比尺度定比尺度能加減乘除加減乘除運算。三、數(shù)據(jù)的類型三、數(shù)據(jù)的類型 1. 按測量尺度不同分按測量尺度不同分:定性數(shù)據(jù):定性數(shù)據(jù)(定類數(shù)據(jù)、定序數(shù)據(jù))和定量數(shù)據(jù)定量數(shù)據(jù)(定距數(shù)據(jù)、定比數(shù)據(jù)) (1)定類數(shù)據(jù):)定類數(shù)據(jù):是對事物進行分類分類的結(jié)果,表現(xiàn)為類別。只能用文字或數(shù)字代碼來表現(xiàn)。 例:性別(男,女) (2)定序數(shù)據(jù):)定序數(shù)據(jù):是對事物按一定順序進行分類按一定順序進行分類的結(jié)果,表現(xiàn)為有順序的類別。只能用文字或數(shù)字代碼來表現(xiàn)。STAT 如學生成績表示為

4、優(yōu)、良、中、及格、不及格;消費者對其產(chǎn)品的滿意度表示為很滿意,很不滿意。 (3)定距數(shù)據(jù):)定距數(shù)據(jù):是一種不僅能反映事物所屬的類別和順序,還能反映事物類別或順序之間的數(shù)量差距數(shù)量差距的數(shù)據(jù)。一般只只適合加減運算。適合加減運算。 沒有絕對意義上的零點沒有絕對意義上的零點! 如,兩學生的成績分別為85分和55分,前者良好后者不及格,前者高于后者,前者高后者30分;攝氏溫度;企業(yè)利潤。 (4 4)定比數(shù)據(jù):定比數(shù)據(jù):是一種不僅能體現(xiàn)事物之間的數(shù)量差距,還能通過對比運算來體現(xiàn)相對程度相對程度的數(shù)據(jù)。加減乘除皆可。加減乘除皆可。 有絕對意義上的零點有絕對意義上的零點!STAT 2. 按表現(xiàn)形式不同分按

5、表現(xiàn)形式不同分:絕對數(shù)、相對數(shù)、平均數(shù)。 3. 按來源不同分按來源不同分:觀測數(shù)據(jù)和實驗數(shù)據(jù)。 觀測數(shù)據(jù):在自然的未被控制的條件下觀測到的數(shù)據(jù)。 實驗數(shù)據(jù):在人工干預(yù)和操作情況下收集的數(shù)據(jù)。 4. 按加工程度不同分按加工程度不同分:原始數(shù)據(jù)和次級數(shù)據(jù)。 5. 按時間和空間狀態(tài)不同分按時間和空間狀態(tài)不同分:序列數(shù)據(jù)和截面數(shù)據(jù)。 截面數(shù)據(jù):在同一時刻或幾乎同一時點所收集的數(shù)據(jù)。 序列數(shù)據(jù):在若干時期內(nèi)所收集到的數(shù)據(jù)。 注意:注意:定量數(shù)據(jù)又分為離散數(shù)據(jù)和連續(xù)數(shù)據(jù)。定量數(shù)據(jù)又分為離散數(shù)據(jù)和連續(xù)數(shù)據(jù)。STAT第二節(jié) 一些基本概念一些基本概念 一、一、(一)總體(一)總體 1.定義:客觀存在的定義:客觀

6、存在的在在上結(jié)合起來的上結(jié)合起來的的整體的整體。 或或: 包含所研究的全部個體包含所研究的全部個體(數(shù)據(jù)數(shù)據(jù))的集合。的集合。 2. 總體的特征總體的特征 (1)大量性:總體的個體必須是大量的(足夠多)。統(tǒng)計的目的是反映大量現(xiàn)象的規(guī)律和特點。 (2)同質(zhì)性同質(zhì)性:總體的個體在性質(zhì)上須相同,因為統(tǒng)計研究STAT的目的是反映總體的特性。例如,將機械零件與書本放在一起,就不會得出整個總體的任何結(jié)論。統(tǒng)計的統(tǒng)計的 (3)差異性差異性統(tǒng)計的前提統(tǒng)計的前提。 3. 總體的分類總體的分類 (1)按包含的個體數(shù)目可分:有限總體與無限總體。 (2)按個體的時空狀態(tài)分:空間總體(個體處于同一時間的不同空間),如人

7、口普查時的全國總?cè)丝?。時間總體時間總體(個體處于同一空間的不同時間),如某商店一年的銷售情況。 4.總體范圍的確定總體范圍的確定 有時容易,如一批燈管的壽命;有時難,如一種新飲料的消費對象。 依據(jù)研究目的來定義依據(jù)研究目的來定義STAT 構(gòu)成總體的個別構(gòu)成總體的個別 1.定義定義 從總體中抽取出來進行觀測從總體中抽取出來進行觀測并據(jù)以推斷總體的一部分個體。并據(jù)以推斷總體的一部分個體。 樣本中包含的個體數(shù)目稱為樣本容量樣本容量,用n表示,n30,大樣本,反之,小樣本。大樣本,反之,小樣本。 樣本容量n與總體容量N的比,n/N稱為抽樣比抽樣比。 注意樣本概念的重要性!注意樣本概念的重要性!STAT

8、 2.樣本的類型樣本的類型 (1)代表性樣本 若樣本單位頻數(shù)與總體的單位頻數(shù)成正比,則這種樣本稱之為代表性樣本代表性樣本。 樣本單位頻數(shù)樣本單位頻數(shù)是某種特征的樣本單位占總樣本單位數(shù)的比例。 總體的單位頻數(shù)總體的單位頻數(shù)是某種特征的個體占總體的比例。 (2)有偏樣本 在人為因素影響下抽取的樣本稱為有偏樣本,是產(chǎn)生抽樣偏差的來源。 (3)隨機樣本 按隨機原則抽取的樣本。STAT (4)分層樣本(類型樣本) 先將總體按某一標志分成若干組,再從各組中隨機抽樣。 (5)整群樣本 按群抽樣的樣本。 (6)系統(tǒng)抽樣樣本 按系統(tǒng)抽樣方法抽取的樣本。思考:思考: 調(diào)查北京市民對交通規(guī)則的觀點,總體、個體、樣本

9、各是什調(diào)查北京市民對交通規(guī)則的觀點,總體、個體、樣本各是什么?么? 注意社會經(jīng)濟統(tǒng)計與數(shù)理統(tǒng)計表述的不同注意社會經(jīng)濟統(tǒng)計與數(shù)理統(tǒng)計表述的不同!STAT二、二、(一)標志(一)標志:反映總體中特征的。 不是具體數(shù)字不是具體數(shù)字。 (A A人)性別 民族 身高 年齡(B B廠廠)產(chǎn)值 職工人數(shù) 1000萬元 50人 標志值標志值:標志在各個個體上的取值。具體表現(xiàn)為數(shù)值或文字。 種類:種類: 按其結(jié)果的表示方式不同分: 品質(zhì)標志品質(zhì)標志反映屬性特征 數(shù)量標志數(shù)量標志反映數(shù)量特征 按其在每個個體上的表現(xiàn)結(jié)果是否相同分: 不變標志和可變標志STAT(二)指標(二)指標:反映數(shù)量特征數(shù)量特征的。 例例 2

10、004年A縣縣所屬500500家工業(yè)企業(yè)產(chǎn)值家工業(yè)企業(yè)產(chǎn)值 為100億元,職職工人數(shù)工人數(shù)為56萬人。 指標的構(gòu)成要素指標的構(gòu)成要素 內(nèi)核內(nèi)核 指標名稱;指標數(shù)值; 外延外延 時間限制;空間限制; 計量單位;計算方法。STAT 2. 指標的分類 按所反映的數(shù)據(jù)特點不同分:數(shù)量指標和質(zhì)量指標 數(shù)量指標數(shù)量指標總體總規(guī)模、總水平。 表現(xiàn)形式:絕對數(shù),有名數(shù)。 例例 2004年A地區(qū)所屬500家工業(yè)企業(yè)為100億元,為56萬人。 質(zhì)量指標質(zhì)量指標 現(xiàn)象間間數(shù)量聯(lián)系。 表現(xiàn)形式:相對數(shù)或平均數(shù);無名數(shù)或復(fù)名數(shù)人分人分總?cè)藬?shù)總成績某班平均成績/8010800人億人萬公里人口數(shù)鐵路長度人均鐵路長度/53.

11、 51319. 7cmSTAT 按所反映的數(shù)據(jù)表現(xiàn)形式不同分:總量指標(絕對數(shù)指標)、相對指標、平均指標 按所反映的數(shù)據(jù)計量單位不同分:實物指標與價值指標 按所反映的數(shù)據(jù)時間狀態(tài)不同分:時期指標與時點指標 3.3.指標與指標與標志的關(guān)系標志的關(guān)系 數(shù)量指標值= 總體各單位某方面數(shù)量標志值。 某班統(tǒng)計學總成績= 該班每一同學統(tǒng)計學成績。STAT 反映的對象不同。 標志個體(總體單位),指標總體。 反映的方式不同。 標志品質(zhì)特征、數(shù)量特征;指標數(shù)量特征。 下列標志中屬于品質(zhì)標志的有( ) A.學歷;B.籍貫;C.成績;D.身高;E.職稱;F.性別 下列指標中屬于質(zhì)量指標的有( ) A.總產(chǎn)量;B.

12、畝產(chǎn)量;C.播種面積;D.價格;E.單位產(chǎn)品原材料消耗STAT、(一)變異(一)變異:個體不斷轉(zhuǎn)換個體不斷轉(zhuǎn)換的現(xiàn)象。的現(xiàn)象。 大量存在 統(tǒng)計的前提統(tǒng)計的前提mAmAmA16.1618.1620.1610021歲歲歲兒童身高年齡廣西男北京男四川男和尚貫籍別性10021BBBSTAT言行變異言行變異說金錢是罪惡,都在撈;說美女是禍水,都想要;說高處不勝寒,都在爬;說煙酒傷身體,都不戒;說天堂最美好,都不去!(二)變量(二)變量:說明現(xiàn)象某種特征的概念:說明現(xiàn)象某種特征的概念(或或可變的標志與指標可變的標志與指標)。 特點特點:從一次觀察到下一次觀察會呈現(xiàn)出差別或變化。 例例 2011年A地區(qū)25

13、個縣的GDPGDP為120億元,人口數(shù)人口數(shù)為800萬人。 1. 離散變量(取值是間斷的)和連續(xù)變量(取值是連續(xù)的)。 2. 定性變量和定量變量。 3. 自變量和因變量解釋變量和被解釋變量 4. 確定變量和隨機變量(一節(jié)車廂座位數(shù)和乘客數(shù))STAT推斷統(tǒng)計中的概念 ( (一一) )參數(shù)參數(shù): :用來描述總體特征總體特征的指標。是研究者想要了解的總體的某種特征值。是未知的常數(shù)。 ( (二二) )統(tǒng)計量統(tǒng)計量: :用來描述樣本特征樣本特征的指標。樣本的隨機性決定了統(tǒng)計量是隨機變量。NXNNPNX221)(1)(221nxxsnnPnxxSTAT第三節(jié) 統(tǒng)計學的研究方法一、一、對事物的全部或足夠數(shù)量

14、進行觀察的方法 試試驗驗者者 擲擲硬硬幣幣試試驗驗次次數(shù)數(shù) 出出現(xiàn)現(xiàn)正正面面次次數(shù)數(shù) 出出現(xiàn)現(xiàn)正正面面頻頻率率 蒲蒲豐豐 皮皮爾爾遜遜 皮皮爾爾遜遜 4 40 04 40 0 1 12 20 00 00 0 2 24 40 00 00 0 2 20 04 48 8 6 60 01 19 9 1 12 20 01 12 2 0 0. .5 50 06 69 9 0 0. .5 50 01 16 6 0 0. .5 50 00 05 5 1 19 93 36 6 年年美美國國的的選選舉舉情情況況 Roosevelt Landon樣樣本本容容量量文文學學摘摘要要蓋蓋洛洛普普選選舉舉結(jié)結(jié)果果4 43

15、3% % 5 57 7% %5 56 6% % 4 44 4% %6 62 2% % 3 38 8% %2 24 40 0 萬萬人人5 5 萬萬人人文文 :通通過過電電話話簿簿或或俱俱樂樂部部會會員員冊冊搜搜集集地地址址發(fā)發(fā)出出問問卷卷STAT二、二、 綜合匯總;分析分組領(lǐng)導素養(yǎng)領(lǐng)導素養(yǎng)地地區(qū)區(qū) G GD DP P(億億元元) 比比重重% %人人均均G GD DP P(元元)人人口口出出生生率率總總計計東東部部中中部部西西部部6 67 77 79 95 53 39 92 27 70 01 18 89 97 79 99 95 59 96 61 10 00 0. .0 05 57 7. .9 92

16、 28 8. .0 01 14 4. .1 15 55 56 69 97 78 88 89 94 43 39 96 63 34 44 49 91 16 6. .9 98 81 11 1. .5 57 71 14 4. .9 92 21 19 9. .7 79 9STAT三、三、 1. 演繹推斷演繹推斷:一般(總體) 個別(個體)。 甲班同學身高1.85米,A是甲班的 A的身高結(jié)論范圍。結(jié)論范圍。 2. 歸納推斷歸納推斷:個別(個體) 一般(總體)。 甲班的A同學身高1.85米,B同學身高1.85米 甲班同學的身高均低于1.85米。 前提正確前提正確結(jié)論未必正確;結(jié)論未必正確; 前提范圍前提范圍

17、結(jié)論范圍。結(jié)論范圍。 總體指標的推斷、統(tǒng)計模型參數(shù)的估計、時間序列的外推預(yù)測都存在誤差和置信度的問題。STAT 預(yù)測與推斷:參數(shù)估計、假設(shè)檢驗、相關(guān)與回歸等。 推斷與臆測的區(qū)別:誤差程度的控制,概率保證的推算。統(tǒng)計學與數(shù)學的思維區(qū)別統(tǒng)計學與數(shù)學的思維區(qū)別: 統(tǒng)計學以歸納歸納為主要思維方式; 數(shù) 學以演繹演繹為主要思維方式。1.對相關(guān)現(xiàn)象之間數(shù)量變動關(guān)系進行定量研究。如回歸分析如回歸分析 2.統(tǒng)計模型三要素: 變量、數(shù)學方程、模型參數(shù) STAT課堂練習 1.按測量尺度分,下列數(shù)據(jù)是哪一類型數(shù)據(jù)? (1)性別:男,女 (2)體重:123, 140.2 等 (3)汽車速度:78, 64, 45 等 (4)溫度:78, 64,85 等 (5)兄弟姐妹個數(shù):2,5, 6 (6)成績:A, B, C 等 (7)企業(yè)經(jīng)營收入:100萬 (8)企業(yè)利潤:10萬STAT 2.下列變量中,何為連續(xù)變量? A.身高 B.體重 C.年齡 D.畢業(yè)生人數(shù) E.學分 F.設(shè)備臺數(shù) G.設(shè)備利用率 答:答:A A、B B、G CG C? 3.若對全國工業(yè)企業(yè)生產(chǎn)設(shè)備的使用狀況進行普查,則統(tǒng)計總體為( ) A.全國企業(yè)的所有生產(chǎn)設(shè)備 B.全國工業(yè)企業(yè)每臺生產(chǎn)設(shè)備 C.全國工業(yè)企業(yè)每臺設(shè)備

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論