版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
應用統(tǒng)計學應用統(tǒng)計學第一章一些基本概念參考書目:1、《統(tǒng)計學:基本概念與方法》吳喜之譯著,高等教育出版社2、《統(tǒng)計建模與R軟件》,薛毅編著,清華大學出版社3、《復雜數(shù)據(jù)統(tǒng)計方法——基于R的應用》吳喜之編著,中國人民大學出版社應用統(tǒng)計學第一章一些基本概念關于課程…統(tǒng)計的基本思想學會用統(tǒng)計處理問題統(tǒng)計軟件的使用(Matlab,R,…..)應用統(tǒng)計學第一章一些基本概念第一章一些基本概念應用統(tǒng)計學第一章一些基本概念什么是統(tǒng)計學?1.數(shù)據(jù)搜集:取得數(shù)據(jù)2.數(shù)據(jù)分析:分析數(shù)據(jù)3.數(shù)據(jù)表述:圖表展示數(shù)據(jù)4.數(shù)據(jù)解釋:結果的說明
收集、分析、表述和解釋數(shù)據(jù)的科學應用統(tǒng)計學第一章一些基本概念統(tǒng)計學的作用我國著名的經(jīng)濟學家馬寅初指出“學者不能離開統(tǒng)計而治學,政治家不能離開統(tǒng)計學而施政,事業(yè)家不能離開統(tǒng)計而執(zhí)業(yè)”。美國著名的科幻作家威爾斯說“對于追求效率的公民而言,統(tǒng)計思維總有一天會和讀寫能力一樣重要”。在諾貝爾經(jīng)濟學獲獎者中,2/3以上的研究成果與統(tǒng)計和定量分析有關。美國總統(tǒng)的年薪已經(jīng)達到40萬美元,在各國元首中名列前茅,但根據(jù)美國《工作等級年鑒》一書的排名,總統(tǒng)一職并未進入最好的職業(yè)之列。在美國,最好的職業(yè)是統(tǒng)計學家。應用統(tǒng)計學第一章一些基本概念以歸納為主要思維方式的統(tǒng)計不是以演繹為主的數(shù)學統(tǒng)計可應用于各個不同學科,在有些學科已經(jīng)有其特有的方法和特點;如生物統(tǒng)計(biostatistics)、經(jīng)濟計量學(econometrics)以及目前很熱門的生物信息(bioinformation)和數(shù)據(jù)挖掘(DataMining)的方法主體都是統(tǒng)計統(tǒng)計的特點應用統(tǒng)計學第一章一些基本概念統(tǒng)計的一些例子應用統(tǒng)計學第一章一些基本概念一些例子大家經(jīng)常在報刊雜志上看到類似的報道:通用汽車37%的銷售額來源于北美以外;我國失業(yè)率下降到25年來的最低點4%;上證指數(shù)接近2000點。我曾在網(wǎng)上利用“百度”搜索引擎對互聯(lián)網(wǎng)上有關網(wǎng)頁進行搜索,得到的結果是:包含“旅游管理”這一詞匯的網(wǎng)頁高達25,500,000項,包含“公共事業(yè)管理”這一詞匯的網(wǎng)頁有100,000,000項。--以上數(shù)據(jù)實際上都是通過數(shù)據(jù)收集,統(tǒng)計得來的。
生活中我們也會不自覺地用到統(tǒng)計,比如說,我們可能經(jīng)常去高中同學所在的學校去玩,他給你介紹同寢室的張三,要你猜他是哪兒人,只見他足有一米八,身材魁梧,你可能會問:你是北方人吧?反之,你可能會認為他是南方人。這實際是應用了統(tǒng)計中平均值的知識。應用統(tǒng)計學第一章一些基本概念一些例子每當季節(jié)交替之時,商場都要對有關商品進行打折銷售,那么為什么商家要進行打折銷售,它怎么才能保證打折后的利潤不會有損失?至少是打折后的利潤要好于不打折的利潤,那么這個折扣的度是要事先進行分析的。
商家在銷售之前通常都會對銷售量和打折的度進行一個簡單的估計,
這里所用到的就是統(tǒng)計學中的參數(shù)估計理論。有觀點認為,紅樓夢的后40回不是曹雪芹所著而是高鶚所寫的。在1981年,首屆國際《紅樓夢》研討會在美國召開,威斯康星大學的陳炳藻就發(fā)表這樣的一篇論文,《從詞匯上的統(tǒng)計<紅樓夢>作者的問題》。他從字、詞出現(xiàn)頻率入手,通過計算機進行統(tǒng)計分析,對《紅樓夢》后40回系高鶚所作這一流行看法提出異議,認為120回均系曹雪芹所作。這個就是利用了統(tǒng)計學中的假設推斷理論進行分析的。應用統(tǒng)計學第一章一些基本概念隨著人類文明的出現(xiàn),就產(chǎn)生了最初的統(tǒng)計實踐活動。統(tǒng)計實踐活動隨著國家的產(chǎn)生而不斷加強和完善。早在四千多年前的中國夏禹王朝,為了治國治水的需要,曾進行初步的國情統(tǒng)計,查明當時中國有人口約1355萬人,土地約2431萬頃,并將全國分為九州。公元前3000多年,古埃及為了建造金字塔征集經(jīng)費、勞力,對全國的財產(chǎn)、人口進行了數(shù)次普查。我國在春秋戰(zhàn)國時期,管仲就明確指出“不明于計數(shù),猶如無舟楫欲徑于水,險也”;商鞅提出了“強國知十三數(shù)”,系統(tǒng)地列出了治理國家必須了解的十三項指標,包括人口、土地、糧食等。我國的《周易正義》中寫到原始社會:“事大,大結其繩;事小,小結其繩;結之多少,隨物眾寡”,這就是人們對社會現(xiàn)象進行的簡單的記錄和計量活動,于是產(chǎn)生了最早的統(tǒng)計萌芽。統(tǒng)計實踐的出現(xiàn)應用統(tǒng)計學第一章一些基本概念
1.創(chuàng)始人:海門爾·康令HermanConring(1606-1681,德國)繼承者:格特弗里德·阿亨瓦爾GottfriedAchenwall(1719-1772,德國)
2.他們在德國的大學開設了一門新課程“國勢學”,主要講述有關國情國力的系統(tǒng)知識,包括土地、人口、政治、軍事、財政、貨幣、科學、藝術和宗教等。阿亨華爾首先將“國勢學”正式命名為“統(tǒng)計學”。3.但是由于他沒有將數(shù)量分析引入進來,因此“國勢學派”有“統(tǒng)計學”之名而無“統(tǒng)計學”之實。
古典統(tǒng)計學時期(17世紀中葉至18世紀末)應用統(tǒng)計學第一章一些基本概念近代統(tǒng)計學時期(19世紀初至20世紀初)數(shù)理統(tǒng)計學派的代表人物比利時的凱特勒博士深受拉普拉斯影響,在其《社會物理學》中將概率論引入統(tǒng)計學,在生物統(tǒng)計和天文學研究中成功地運用了二項分布和正態(tài)分布方法。凱特勒博士認為要促進科學的發(fā)展,就必須更多的應用統(tǒng)計學,大力提倡采用統(tǒng)計方法對自然現(xiàn)象和社會現(xiàn)象的規(guī)律性進行觀察。社會統(tǒng)計學派的代表人物有克尼斯,梅爾和恩格爾等。社會統(tǒng)計學派繼承和發(fā)展了“政治算術學派”的理論體系,完善了統(tǒng)計有關描述性的分析方法,建立了較為完整的統(tǒng)計指標方法和社會統(tǒng)計學科體系,對當時的政府統(tǒng)計工作和統(tǒng)計學理論的推廣產(chǎn)生了積極的促進作用★討論題恩格爾指數(shù)及其應用?恩格爾系數(shù)(%)=食品支出總額/家庭或個人消費支出總額×100%
國際上常常用恩格爾系數(shù)來衡量一個國家和地區(qū)人民生活水平的狀況。根據(jù)聯(lián)合國糧農(nóng)組織提出的標準,恩格爾系數(shù)在59%以上為貧困,50-59%為溫飽,40-50%為小康,30-40%為富裕,低于30%為最富裕。
應用統(tǒng)計學第一章一些基本概念20世紀初,大工業(yè)的發(fā)展對產(chǎn)品質(zhì)量檢驗問題提出了新的要求,即只抽取少量產(chǎn)品作為樣本對全部產(chǎn)品的質(zhì)量好壞作出推斷。因為大批量產(chǎn)品要做全面的檢驗,既費時、費錢,又費人力,加之有些產(chǎn)品質(zhì)量的檢驗要做破壞性檢驗,全部檢驗已不可能。1908年,英國的威廉.希利.高賽特提出了小樣本t統(tǒng)計量,利用它就可以從大量的產(chǎn)品中只抽取較小的樣本完成對全部產(chǎn)品質(zhì)量的檢驗和推斷,這樣就使統(tǒng)計學進入了現(xiàn)代統(tǒng)計學的新階段(主要是推斷性統(tǒng)計學)。之后由費歇爾、卡爾·皮爾遜、奈曼、瓦爾德等為代表的一代統(tǒng)計學大師,共同完成了現(xiàn)代統(tǒng)計學的理論框架,使統(tǒng)計學成為一門嚴謹?shù)膶W科,同時數(shù)理統(tǒng)計學逐漸成為了主流統(tǒng)計學。1950年以后,受計算機和新興科學的影響,這一時期統(tǒng)計學的研究和應用范圍越來越廣?,F(xiàn)代統(tǒng)計學的發(fā)展時期(20世紀初到現(xiàn)在)應用統(tǒng)計學第一章一些基本概念大數(shù)據(jù)時代應用統(tǒng)計學第一章一些基本概念淘寶中的統(tǒng)計男人和女人理財消費有什么不同?浙江和北京民眾理財習慣有何不同?天秤座和處女座誰更愛理財……數(shù)據(jù)顯示,男性用戶對于在淘寶上買理財產(chǎn)品,總體上比女性更積極。在淘寶理財?shù)目傆脩糁?,男性用戶占?6.3%,多于女性。在現(xiàn)有的理財用戶中,浙江人熱情最高,占據(jù)所有用戶的18%,遙遙領先全國。而北京用戶出手則最大氣,人均購買理財產(chǎn)品9920元,幾乎是全部用戶人均3417元的3倍。天秤座無疑是理財意識最高的星座,該星座用戶占總用戶的21%,而金牛座則是理財意識最淡薄的星座,該星座用戶僅占總用戶的6%。不同星座的男女,在購買金額上也是表現(xiàn)各異。男性用戶中,摩羯座出手最豪爽,人均購買金額達到6889元,而巨蟹座出手最謹慎,人均購買金額僅3001元;在女性用戶中,天蝎座出手最豪爽,人均購買金額為7401元,而天秤座出手最謹慎,人均僅2400元。應用統(tǒng)計學第一章一些基本概念一些例子某企業(yè)開發(fā)出一種新的化妝品,在正式投產(chǎn)之前,需要根據(jù)市場需求情況制定其價格和銷售策略。該企業(yè)委托某市場調(diào)查公司在全市200萬戶家庭中抽取1000戶家庭試用,然后了解該化妝品的銷售前景。如何科學地從該市200萬家庭中抽出這1000戶家庭進行調(diào)查,并由這1000戶家庭反饋的市場信息科學地推斷出全市200萬戶家庭對該化妝品的購買意愿這一數(shù)量規(guī)律,這就需要應用統(tǒng)計學當中的抽樣方式的知識。更高級一點的統(tǒng)計理論呢,也能在我們的日常生活中反映出來,我們在做湯時,嘗一下咸淡這個過程上升到統(tǒng)計理論的范疇,包括抽樣方法(簡單隨機抽樣)、分布理論(均勻分布)、推斷理論(以樣本推總體)。應用統(tǒng)計學第一章一些基本概念你相信統(tǒng)計結果嗎?數(shù)據(jù)可以有誤或作假統(tǒng)計方法(有意或無意)使用不當可以誤導。有低級誤導和高級誤導。常識判斷和直覺是重要的應用統(tǒng)計學第一章一些基本概念關于美國選舉的兩個例子(1)誰會在1936選舉中獲勝?AlfLondon還是
F.D.R.(羅斯福)?LiteraryDigest(文摘)送出一千萬份問卷(返回二百四十萬份)后,預測London會贏.而Gallop(蓋洛普)只問了5000人說
Roosevelt(羅斯福)會贏.最后羅斯福和蓋洛普都贏了.文摘倒閉了.應用統(tǒng)計學第一章一些基本概念關于美國選舉的兩個例子(2)誰會在1948選舉中獲勝?ThomasDewey還是HarryTruman(杜魯門)?Crossley,Gallop(蓋洛普),Roper所有都預測Dewey會贏(每個機構用了5000個問卷).最后(包括蓋洛普)他們都輸了,而杜魯門贏了.應用統(tǒng)計學第一章一些基本概念統(tǒng)計學的分類統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設檢驗應用統(tǒng)計學第一章一些基本概念一、描述統(tǒng)計
(descriptivestatistics)研究數(shù)據(jù)收集、整理和描述的統(tǒng)計學分支內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)描述性分析
目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥x=30s2=105應用統(tǒng)計學第一章一些基本概念二、推斷統(tǒng)計
(inferentialstatistics)研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學分支內(nèi)容參數(shù)估計假設檢驗目的對總體特征作出推斷樣本總體應用統(tǒng)計學第一章一些基本概念三、理論統(tǒng)計學(Theoreticalstatistics)
和應用統(tǒng)計學(Appliedstatistics)
根據(jù)統(tǒng)計學研究方法和統(tǒng)計方法的應用范圍不同,統(tǒng)計學分為理論統(tǒng)計學和應用統(tǒng)計學。理論統(tǒng)計學主要研究統(tǒng)計學的基本原理和基本方法,研究如何將數(shù)學原理和計算機技術應用于統(tǒng)計學,發(fā)展出新的統(tǒng)計學方法和技術。應用統(tǒng)計學主要是研究如何將統(tǒng)計學的方法和原理與實際問題相結合,使用統(tǒng)計學的方法解決實際問題。應用統(tǒng)計學第一章一些基本概念統(tǒng)計的一些做法統(tǒng)計可以指導我們收集數(shù)據(jù).當擁有來自一些變量(指標)的數(shù)據(jù)或記錄,但缺乏模型來描述這些變量之間關系的情況下,可用統(tǒng)計方法建立模型.在有了一定的模型時,統(tǒng)計可以確定手中數(shù)據(jù)是否令人信服地支持某種論點.模型也用來對未來進行預測.統(tǒng)計直觀的圖表展示,可以使各個領域的專家容易理解應用統(tǒng)計學第一章一些基本概念統(tǒng)計學的目的任何客觀事物都是必然性與偶然性的對立統(tǒng)一。同樣,任何一個數(shù)據(jù)也都是必然性與偶然性共同作用的結果。必然性反映了事物本質(zhì)的特征和聯(lián)系,是比較穩(wěn)定的,因而它決定了事物的內(nèi)在本質(zhì)是有規(guī)律可循的。偶然性則反映了改事物每個表現(xiàn)形式的差異。如果事物只有必然性一個方面的特征,事物的表現(xiàn)形式就會比較簡單,就可以比較容易把握它的規(guī)律性。正是由于偶然性的存在,形成數(shù)據(jù)表現(xiàn)形式的千差萬別。這樣,必然性的數(shù)量規(guī)律性就被掩蓋在表面的差異之中了。統(tǒng)計學的目的就是要從偶然性中探索到內(nèi)在的、本質(zhì)的數(shù)量規(guī)律。從統(tǒng)計方法上看,統(tǒng)計學提供了一系列的方法,專門用來收集數(shù)據(jù)、整理數(shù)據(jù)、顯示數(shù)據(jù)的特征,進而分析和探索出事物總體的數(shù)量規(guī)律性。應用統(tǒng)計學第一章一些基本概念統(tǒng)計的內(nèi)容和需要的知識數(shù)學的幾乎所有內(nèi)容(不一定事先知道需要什么)用計算機做統(tǒng)計計算其他(對象)領域的知識應用統(tǒng)計學第一章一些基本概念統(tǒng)計和數(shù)學的區(qū)別數(shù)學思維是以演繹為主統(tǒng)計思維是以歸納為主,兼有演繹統(tǒng)計各領域利用幾乎所有存在的數(shù)學內(nèi)容.但統(tǒng)計本身的數(shù)學是為具體目標服務的,自己一般不形成數(shù)學體系應用統(tǒng)計學第一章一些基本概念第五節(jié)、“虛假”的統(tǒng)計學統(tǒng)計數(shù)據(jù)的有效性:白血病,環(huán)保好樣本和壞樣本:買桔子調(diào)查中的非技術因素:措辭(stock),社會文化的不同(自殺)應用統(tǒng)計學第一章一些基本概念案例分析(魅力)比如有兩條這樣的新聞,他們都是關于高壓電線是否會導致附近的兒童得白血病,它的理論是因為電流會產(chǎn)生磁場,磁場往往會引起白血病,所以生活在有電的環(huán)境里,會使人暴露在磁場中,那么住在高壓電線附近,會增加這種暴露的程度。第一條新聞是找了一位能說會道的母親,她的孩子得了白血病,剛好她家就在高壓電線附近,因此這位母親向觀眾介紹了在高壓電線附近是如何的危險這一情況;另一條新聞呢,是國家癌癥所的一則報道,他們用了5年的時間和100萬資金,走訪了全國十幾個省進行高壓電線附近的兒童白血病情況的調(diào)查,最后得出結論,在白血病和暴露在高壓電線所在的磁場之間,找不到任何的相關關系。
那么對于這樣的兩條新聞,我想一般的觀眾都會傾向于后者,這主要的原因可能就是在于統(tǒng)計數(shù)字的魅力,人們往往對具有統(tǒng)計數(shù)字的新聞和文章都比較信服。應用統(tǒng)計學第一章一些基本概念案例分析(方式)某個機構花費了很多的資金在某一城市做一個調(diào)查,他們將城區(qū)分成兩個部分,一個上層區(qū),一個下層區(qū),分別對應工資的高與低,目的是想了解,哪個層區(qū)的住戶更加注重資源的回收,他們所采用的度量變量就是路邊資源回收垃圾每周的重量。結果得出上層區(qū)均超過下層區(qū),由此,這個機構得出結論認為上層區(qū)的居民更加注重資源回收。
那么對于這樣的數(shù)據(jù)報告,我們就要表示懷疑了,事實上,這個事件的本身是跟這個機構的分析結果不符合的。因為上層區(qū)在丟回收箱的物品都比較重,而下層區(qū)的就比較輕,比如單拿飲料來說,上層區(qū)的多半的丟入的是玻璃瓶的酒,而下層區(qū)的丟入的多半是塑料的飲料。這樣的話,單單從重量上來比較,統(tǒng)計數(shù)據(jù)就不是那么有效了。應用統(tǒng)計學第一章一些基本概念案例分析(質(zhì)量)當我們看到一則新聞和一篇統(tǒng)計報告的時候,往往不知道它的樣本是如何取得的,這樣就給文章的可信度打了折扣。樣本也有好樣本和壞樣本的區(qū)分。我們首先來看看壞樣本,比如:我們要檢查一車桔子是不是優(yōu)質(zhì)的,那么最容易的方法就是在擺在每箱最上面的桔子中抽取,然而這樣得出的結論就值得懷疑了,首先在運送的過程中,在下部的桔子是最容易受到碰撞的,其次如果供貨商也了解這一點的話,把最好的桔子都放在上部,那么對于這樣的統(tǒng)計結論就沒有很大的意義。這樣的果,我們用統(tǒng)計學的術語來說是,有偏的。也就是說樣本的情況對于整個總體來說是有偏誤的。解決方法:利用隨機抽取的形式,來消除有偏性。比如,隨機數(shù)字表,電腦隨機生成數(shù)字壞樣本還有一個特性就是它的高變異性,不過它可以利用擴大樣本容量的方法來消除。這個我們在以后的章節(jié)再詳細說??赡艽蠹覍τ趬臉颖镜挠衅妥儺愡€不是很理解,這里我講一個非常直觀的概念,就是射箭原理。偏差:意思是我們的瞄準有問題,射出的箭都往同一個方向偏離靶心:樣本值沒有以總體值為中心點。變異性:箭著點在靶上分散得很廣“重復抽樣所得結果并不接近,彼此間差異很大。有時候會出現(xiàn)低變異性,高偏差或者低偏差,高變異性的情況。應用統(tǒng)計學第一章一些基本概念案例分析(措辭)有一個調(diào)查機構想做一個關于居民擁有股票的比例的問卷調(diào)查,他在采訪中問道:“是否擁有stock”(股票,也是家禽),結果大部分的農(nóng)場主的回答都是yes,可是他們實際擁有股票的卻很少。那么這樣的統(tǒng)計分析結果往往很容易迷惑到不了解數(shù)據(jù)來源的讀者。
stock=(股票,也是家禽)應用統(tǒng)計學第一章一些基本概念案例分析(文化)
在調(diào)查全球的自殺率問題中,社會文化就占有很大的因素,在日本這樣的國家,有遇到恥辱就光榮自殺的傳統(tǒng),這就使得日本的自殺事件報道的比例較高,而在大部分信奉天主教的國家,他們都以自殺為恥辱,因此所公布的自殺率自然比其他的國家低很多。而隨著文化的發(fā)展,很多國家都將抑郁癥視為生理上的疾病,而不是個性上的弱點,自殺是這種病的悲劇性結束,而不是道德瑕疵。這使得這些國家的家屬和醫(yī)生更愿意將自殺列為死因。也使著自殺率在逐年升高,這個并非真的數(shù)據(jù)在增加,而是人們的觀念發(fā)生了變化。
因此我們在看待類似這樣的數(shù)據(jù)報表的時候,不能被數(shù)據(jù)值的外表迷惑,要弄清楚數(shù)據(jù)的來源是怎樣的,他調(diào)查的方式又是怎樣的。應用統(tǒng)計學第一章一些基本概念計算機的重要性由于統(tǒng)計和數(shù)據(jù)打交道,沒有計算機的發(fā)展統(tǒng)計就沒有前途.計算機和統(tǒng)計的發(fā)展相輔相成應用統(tǒng)計學第一章一些基本概念
現(xiàn)實中的隨機性從中學起,我們就知道自然科學的許多定律,例如物理中的牛頓三定律,物質(zhì)不滅定律以及化學中的各種定律等等。但是在許多領域,很難用如此確定的公式或論述來描述一些現(xiàn)象。比如,人的壽命是很難預先確定的。一個吸煙、喝酒、不鍛煉、而且一口長葷的人可能比一個很少得病、生活習慣良好的人活得長。因此,可以說,活得長短是有一定隨機性的(randomness)。這種隨機性可能和人的經(jīng)歷、基因、習慣等無數(shù)說不清的因素都有關系。應用統(tǒng)計學第一章一些基本概念現(xiàn)實中的規(guī)律性但是從總體來說,我國公民的平均年齡卻是非常穩(wěn)定的。而且女性的平均年齡也穩(wěn)定地比男性高幾年。這就是規(guī)律性。一個人可能活過這個平均年齡,也可能活不到這個年齡,這是隨機的。但是總體來說,平均年齡的穩(wěn)定性,卻說明了隨機之中有規(guī)律性。這種規(guī)律就是統(tǒng)計規(guī)律。應用統(tǒng)計學第一章一些基本概念概率和機會你可能經(jīng)常聽到概率(probability)這個名詞。例如在天氣預報中會提到降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。因此,從某種意義說來,概率描述了某件事情發(fā)生的機會。顯然,這種概率不可能超過百分之百,也不可能少于百分之零。換言之,概率是在0和1之間的一個數(shù),說明某事件發(fā)生的機會有多大。應用統(tǒng)計學第一章一些基本概念有些概率是無法精確推斷的比如你對別人說你下一個周末去公園的概率是百分之八十。但你無法精確說出為什么是百分之八十而不是百分之八十四或百分之七十八。其實你想說的是你很可能去,但又沒有完全肯定。實際上,到了周末,你或者去,或者不去;不可能有分身術把百分之八十的你放到公園,而其余的放在別處。應用統(tǒng)計學第一章一些基本概念有些概率是可以估計的比如擲骰子。只要沒有人在骰子上做手腳,你得到6點的概率應該是六分之一。得到其他點的概率也是一樣。得到6的概率或者機會是可以知道的,但擲骰子的結果還只可能是六個數(shù)目之一。這個已知的規(guī)律就反映了規(guī)律性,而得到哪個結果則反映了隨機性。如果你擲1000次骰子,那么,大約有六分之一的可能會得到6;這也是隨機性呈現(xiàn)有規(guī)律的一個體現(xiàn)。應用統(tǒng)計學第一章一些基本概念變量和數(shù)據(jù)一節(jié)火車車廂有多少坐位是一個固定的數(shù)目,稱為常數(shù)(constant)或者常量。但是,開車后,坐在這節(jié)車廂的旅客有多少就沒準了。這有隨機性。該車廂的乘客數(shù)為變量(variable)。應用統(tǒng)計學第一章一些基本概念變量和數(shù)據(jù)一個學校的注冊在校男女生比例是固定的,為常量但是,該校任意一群學生的男女生比例就不一定和全校的比例一樣了,它為變量(variable)。應用統(tǒng)計學第一章一些基本概念變量和數(shù)據(jù)當變量按照隨機規(guī)律所取的值是數(shù)量時該變量稱為定量變量或數(shù)量變量(quantitativevariable);因為是隨機的,也稱為隨機變量(randomvariable)。如身高體重,購買某商品的人數(shù)等等應用統(tǒng)計學第一章一些基本概念變量和數(shù)據(jù)象性別,觀點之類的取非數(shù)量值的變量就稱為定性變量或屬性變量或分類變量(qualitativevariable,或categoricalvariable)。這些定性變量也可以由定量變量來描述,如男女生的數(shù)目,持有某觀點的人數(shù)比例等等。應用統(tǒng)計學第一章一些基本概念變量和數(shù)據(jù)定性變量只有用數(shù)量來描述時,才有可能建立數(shù)學模型,并使用計算機來分析。數(shù)據(jù)中它們通常用啞元(dummyvariable)代表,比如性別用0、1代表,三種收入用0、1、2代表(或用字母代表)應用統(tǒng)計學第一章一些基本概念變量和數(shù)據(jù)有了變量,何謂數(shù)據(jù)?不同機構調(diào)查所得到的北京收入萬元以上市民的比例都不一樣,這是變量而這些調(diào)查產(chǎn)生一些數(shù)目,這些數(shù)目就是數(shù)據(jù)(data)數(shù)據(jù)是關于變量的觀測值。應用統(tǒng)計學第一章一些基本概念變量和數(shù)據(jù)通過數(shù)據(jù)可驗證有關的理論或假定。比如通過抽樣調(diào)查驗證美國選民對共和黨候選人的支持率是否超過50%通過抽樣,可以檢驗某批產(chǎn)品是否合格等等應用統(tǒng)計學第一章一些基本概念變量之間的關系現(xiàn)實世界緊密聯(lián)系的人們想知道投資方式和經(jīng)濟效益之間的關系、旅客人數(shù)和經(jīng)濟發(fā)展之間的關系等等不討論變量之間的關系,就無從談起任何有深度的應用,統(tǒng)計的基本概念就僅僅是擺設而已。應用統(tǒng)計學第一章一些基本概念定量變量間的關系廣告投入和銷售之間的關系。下表(數(shù)據(jù)ads.txt)顯示了某企業(yè)的廣告投入和銷售額之間的關系(萬元)應用統(tǒng)計學第一章一些基本概念橫坐標代表廣告投入,而縱坐標代表銷售收入。看得出有何種關系嗎?應用統(tǒng)計學第一章一些基本概念定量變量間的關系能否從該數(shù)據(jù)回答下面問題:這兩個變量是否有關系?如果有,它們的關系是否顯著?這些關系是什么關系,能否用數(shù)學模型來描述?這個關系是否帶有普遍性?這個關系是不是因果關系?應用統(tǒng)計學第一章一些基本概念定量變量間的關系關于因果關系在可控制的試驗中,較容易找到因果關系;比如治療方式和療效的關系等但是,一般來說,變量之間有關系這個事實并不意味著一定存在明確的因果關系。應用統(tǒng)計學第一章一些基本概念定量變量間的關系比如,北京GDP在一年中是快速增長的,而一個剛出生的巴拿馬嬰兒在這一年中的體重也是快速增長的如果畫出圖來,它們有類似線性的關系但它們顯然沒有因果關系應用統(tǒng)計學第一章一些基本概念定量變量間的關系只要有關系,即使不是因果關系也不妨礙人們利用這種關系來進行推斷。比如利用公雞打鳴來預報太陽升起;雖然公雞打鳴絕對不是日出的原因(雖然打鳴發(fā)生在先)應用統(tǒng)計學第一章一些基本概念定量變量間的關系簡單的辦法(諸如畫圖)可以得到一些信息,但不一定能夠給出滿意的答案需要更多的工具和手段來進行數(shù)值分析得到更加嚴格和精確的解答因此,需要繼續(xù)我們的課程應用統(tǒng)計學第一章一些基本概念定性變量間的關系例下面是對123人進行關于某項政策調(diào)查所得結果的一個簡單的三維表,它顯示了人們的收入和性別對該項政策的觀點。應用統(tǒng)計學第一章一些基本概念定性變量間的關系從這個數(shù)據(jù),希望可以看出收入、性別對觀點是否有影響及如何影響如果要得到更加精確的結論,就要進行進一步的分析和計算這是后面列聯(lián)表分析或多項分布對數(shù)線性模型的內(nèi)容應用統(tǒng)計學第一章一些基本概念統(tǒng)計、計算機與統(tǒng)計軟件現(xiàn)代生活越來越離不開計算機了最初的計算機僅僅是為科學計算而設計和建造的統(tǒng)計是大型計算機的最早用戶,現(xiàn)在仍然是數(shù)值計算的主要用戶應用統(tǒng)計學第一章一些基本概念統(tǒng)計、計算機與統(tǒng)計軟件計算機的使用,從計算機語言到“傻瓜式”地點擊鼠標輸出結果也從數(shù)字輸出到各種可以想象得到的形式。輸入數(shù)據(jù),點鼠標做一些選項,就可得到漂亮結果但其中充滿了危險的陷阱
應用統(tǒng)計學第一章一些基本概念統(tǒng)計、計算機與統(tǒng)計軟件計算機無法識別你的統(tǒng)計方面的錯誤錯誤的方法、錯誤的數(shù)據(jù)形式都必然輸出錯誤的結果(雖然看上去可能很漂亮),得到大量垃圾另外,統(tǒng)計軟件輸出的結果太多、很難都理解應用統(tǒng)計學第一章一些基本概念統(tǒng)計、計算機與統(tǒng)計軟件統(tǒng)計軟件的種類很多。書中僅介紹最常見的幾種。只要學會使用一種“傻瓜式”軟件或編程軟件,使用其他類似的軟件也不會困難;最多看看幫助和說明即可。學習軟件的最好方式是需要時在使用中學。應用統(tǒng)計學第一章一些基本概念統(tǒng)計軟件
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年魚塘養(yǎng)殖權拍賣與養(yǎng)殖技術引進合同范本3篇
- 2025江蘇省安全員考試題庫及答案
- 2024版技術顧問聘用合同范本
- 德育課程實施的策略與方法
- 2025年度水稻種植基地糧食儲備采購合同3篇
- 2024石材行業(yè)石材環(huán)保認證代理服務合同3篇
- 施工電梯安裝方案
- 2025年四川省安全員B證考試題庫及答案
- 2024物業(yè)租賃期間公共設施使用約定
- 2025年度熱帶風情西瓜采摘園游客服務合同樣本3篇
- 瑞得RTS-820系列全站儀說明書(適用RTS-822.822A.822L.822R.822R .822R3)
- 2024中國工業(yè)品電商采購白皮書
- 建筑垃圾外運施工方案
- 公安機關保密協(xié)議
- 2024年東方雨虹戰(zhàn)略合作協(xié)議書模板
- 2024年江蘇省南京旅游集團本部人員招聘2人歷年高頻難、易錯點500題模擬試題附帶答案詳解
- 實驗室信息管理系統(tǒng)LIMS調(diào)研報告
- 體育賽事組織與執(zhí)行手冊
- 2024年中國社會科學院外國文學研究所專業(yè)技術人員招聘3人歷年高頻難、易錯點500題模擬試題附帶答案詳解
- 2024-2030年中國海關信息化行業(yè)市場深度分析與發(fā)展前景預測研究報告
- 2023-2024學年內(nèi)蒙古名校聯(lián)盟高二下學期教學質(zhì)量檢測語文試題(解析版)
評論
0/150
提交評論