版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
概率論與數(shù)理統(tǒng)計—統(tǒng)計量及其分布匯報人:AA2024-01-19BIGDATAEMPOWERSTOCREATEANEWERA目錄CONTENTS統(tǒng)計量基本概念抽樣分布理論參數(shù)估計方法假設(shè)檢驗原理及應(yīng)用方差分析與回歸分析初步非參數(shù)統(tǒng)計方法簡介BIGDATAEMPOWERSTOCREATEANEWERA01統(tǒng)計量基本概念統(tǒng)計量定義與性質(zhì)統(tǒng)計量定義統(tǒng)計量是樣本空間上的實值函數(shù),不依賴于任何未知參數(shù),僅通過樣本觀測值計算得出。統(tǒng)計量性質(zhì)統(tǒng)計量應(yīng)具有代表性、無偏性、一致性和充分性等性質(zhì),以保證基于統(tǒng)計量進行的推斷是合理和可靠的。01020304樣本均值樣本均值是樣本觀測值的算術(shù)平均數(shù),用于估計總體均值。樣本方差樣本方差是樣本觀測值與樣本均值之差的平方的平均數(shù),用于估計總體方差。樣本協(xié)方差樣本協(xié)方差是描述兩個隨機變量線性相關(guān)程度的統(tǒng)計量,用于估計總體協(xié)方差。樣本相關(guān)系數(shù)樣本相關(guān)系數(shù)是描述兩個隨機變量之間線性相關(guān)強度和方向的統(tǒng)計量,用于估計總體相關(guān)系數(shù)。常見統(tǒng)計量類型通過計算樣本均值、方差等統(tǒng)計量,對數(shù)據(jù)進行初步的描述和概括。描述性統(tǒng)計分析推斷性統(tǒng)計分析多元統(tǒng)計分析非參數(shù)統(tǒng)計分析基于樣本統(tǒng)計量對總體參數(shù)進行推斷,如假設(shè)檢驗和置信區(qū)間估計等。利用多個統(tǒng)計量對多個變量之間的關(guān)系進行分析,如回歸分析、主成分分析等。在不假定總體分布形式的情況下,利用統(tǒng)計量對數(shù)據(jù)進行分析,如非參數(shù)檢驗和非參數(shù)回歸等。統(tǒng)計量在數(shù)據(jù)分析中應(yīng)用BIGDATAEMPOWERSTOCREATEANEWERA02抽樣分布理論抽樣方法從總體中隨機抽取一部分樣本進行觀察和分析的方法,包括簡單隨機抽樣、分層抽樣、系統(tǒng)抽樣等。抽樣分布概念由樣本統(tǒng)計量所構(gòu)成的分布,描述了樣本統(tǒng)計量在多次重復(fù)抽樣下的分布情況。抽樣方法與抽樣分布概念單個正態(tài)總體的抽樣分布當總體服從正態(tài)分布時,樣本均值服從正態(tài)分布,樣本方差服從卡方分布。兩個正態(tài)總體的抽樣分布當兩個總體分別服從正態(tài)分布時,樣本均值之差服從正態(tài)分布,樣本方差之比服從F分布。正態(tài)總體下抽樣分布定理當樣本量足夠大時,根據(jù)中心極限定理,樣本均值的分布近似于正態(tài)分布。大樣本情況下的抽樣分布當樣本量較小時,非正態(tài)總體的抽樣分布可能呈現(xiàn)出偏態(tài)或峰態(tài)等特征,此時需要采用適當?shù)慕y(tǒng)計方法進行推斷。小樣本情況下的抽樣分布非正態(tài)總體下抽樣分布簡介BIGDATAEMPOWERSTOCREATEANEWERA03參數(shù)估計方法VS點估計是用樣本統(tǒng)計量來估計總體參數(shù),因為樣本統(tǒng)計量為數(shù)軸上某一點值,估計的結(jié)果也以一個點的數(shù)值表示,所以稱為點估計。評價標準點估計的評價標準包括無偏性、有效性和一致性。無偏性是指估計量的期望值等于被估計的總體參數(shù);有效性是指對于同一總體參數(shù)的兩個無偏點估計量,有更小方差的估計量更有效;一致性是指隨著樣本量的增加,點估計量的值越來越接近被估總體的參數(shù)。點估計原理點估計原理及評價標準區(qū)間估計方法及置信水平選擇區(qū)間估計是在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減估計誤差得到。根據(jù)樣本統(tǒng)計量的抽樣分布可以對樣本統(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量。區(qū)間估計方法置信水平是指總體參數(shù)值落在樣本統(tǒng)計量某一區(qū)間內(nèi)的概率;而置信區(qū)間是指在某一置信水平下,樣本統(tǒng)計量與總體參數(shù)之間所構(gòu)造的區(qū)間。置信區(qū)間的選擇通常取決于研究者的經(jīng)驗和實際需求,常見的置信水平有90%、95%和99%。置信水平選擇最大似然估計法是一種具有理論性的點估計法,此方法的基本思想是:當從模型總體隨機抽取n組樣本觀測值后,最合理的參數(shù)估計量應(yīng)該使得從模型中抽取該n組樣本觀測值的概率最大。首先構(gòu)造似然函數(shù),然后求導(dǎo)并令導(dǎo)數(shù)等于0,解得似然方程,最后求出參數(shù)的最大似然估計值。需要注意的是,在使用最大似然估計法時,需要滿足一定的前提條件,例如樣本量要足夠大等。最大似然估計法原理最大似然估計法步驟最大似然估計法介紹BIGDATAEMPOWERSTOCREATEANEWERA04假設(shè)檢驗原理及應(yīng)用作出決策根據(jù)檢驗統(tǒng)計量的值和拒絕域,作出是否拒絕原假設(shè)的決策。計算檢驗統(tǒng)計量的值根據(jù)樣本數(shù)據(jù)計算檢驗統(tǒng)計量的值。確定拒絕域根據(jù)顯著性水平$alpha$和檢驗統(tǒng)計量的分布,確定拒絕域。建立假設(shè)根據(jù)實際問題,提出原假設(shè)$H_0$和備擇假設(shè)$H_1$。選擇檢驗統(tǒng)計量根據(jù)假設(shè)選擇合適的檢驗統(tǒng)計量,并確定其分布。假設(shè)檢驗基本思想和步驟單側(cè)檢驗只關(guān)注參數(shù)的一側(cè),如只關(guān)注均值是否大于或小于某個值。雙側(cè)檢驗關(guān)注參數(shù)的兩側(cè),如關(guān)注均值是否等于某個值。區(qū)別與聯(lián)系單側(cè)檢驗和雙側(cè)檢驗的區(qū)別在于關(guān)注參數(shù)的方向不同,但都是基于假設(shè)檢驗的原理進行決策。在實際應(yīng)用中,應(yīng)根據(jù)具體問題選擇合適的檢驗類型。單側(cè)檢驗和雙側(cè)檢驗比較醫(yī)學(xué)領(lǐng)域檢驗?zāi)硞€經(jīng)濟政策是否對經(jīng)濟增長有顯著影響。經(jīng)濟領(lǐng)域工程領(lǐng)域社會學(xué)領(lǐng)域01020403比較不同社會群體的收入、教育水平等是否有顯著差異。比較兩種藥物的療效是否有顯著差異。檢驗新材料的性能是否滿足要求。假設(shè)檢驗在實際問題中應(yīng)用舉例BIGDATAEMPOWERSTOCREATEANEWERA05方差分析與回歸分析初步方差分析原理方差分析是一種通過比較不同組別數(shù)據(jù)的方差來推斷總體均值是否存在顯著差異的統(tǒng)計方法。它基于組內(nèi)差異與組間差異的比較,判斷因素對結(jié)果的影響是否顯著。方差分析步驟包括建立假設(shè)、構(gòu)造檢驗統(tǒng)計量、確定顯著性水平、計算檢驗統(tǒng)計量的值、作出統(tǒng)計決策等。方差分析原理及步驟多元線性回歸模型建立多元線性回歸模型用于描述因變量與多個自變量之間的線性關(guān)系。建立模型時,需要確定自變量和因變量,選擇合適的模型形式,并通過最小二乘法等方法估計模型參數(shù)。要點一要點二多元線性回歸模型檢驗?zāi)P徒⒑?,需要進行擬合優(yōu)度檢驗、方程顯著性檢驗、變量顯著性檢驗等,以評估模型的擬合效果和變量的解釋力度。多元線性回歸模型建立與檢驗邏輯回歸模型定義邏輯回歸是一種廣義的線性模型,用于解決二分類問題。它通過引入邏輯函數(shù),將線性回歸模型的輸出轉(zhuǎn)換為概率值,從而實現(xiàn)分類任務(wù)。邏輯回歸模型應(yīng)用邏輯回歸模型廣泛應(yīng)用于醫(yī)學(xué)、金融、社會學(xué)等領(lǐng)域,如疾病預(yù)測、信用評分、市場調(diào)研等。它具有簡單易懂、計算高效等優(yōu)點,在實際問題中具有良好的應(yīng)用效果。邏輯回歸模型簡介BIGDATAEMPOWERSTOCREATEANEWERA06非參數(shù)統(tǒng)計方法簡介無需假設(shè)總體分布非參數(shù)統(tǒng)計方法無需對總體分布做出假設(shè),因此適用范圍更廣。穩(wěn)健性強由于不依賴于總體分布的具體形式,非參數(shù)統(tǒng)計方法對異常值和離群點具有較強的穩(wěn)健性。適用于小樣本在樣本量較小的情況下,非參數(shù)統(tǒng)計方法通常比參數(shù)統(tǒng)計方法更為有效。非參數(shù)統(tǒng)計方法特點和優(yōu)勢卡方檢驗是一種基于觀測頻數(shù)與期望頻數(shù)之間差異的顯著性檢驗方法。通過計算卡方統(tǒng)計量,可以評估觀測數(shù)據(jù)與理論分布之間的差異程度。原理卡方檢驗常用于分類數(shù)據(jù)的獨立性檢驗和擬合優(yōu)度檢驗。例如,在醫(yī)學(xué)研究中,可以用于評估某種疾病與基因型之間的關(guān)聯(lián)性;在市場調(diào)查中,可以用于檢驗產(chǎn)品屬性與消費者偏好之間的獨立性。應(yīng)用場景卡方檢驗原理及應(yīng)用場景計算步驟首先,將兩組數(shù)據(jù)分別按照從小到大的順序排列,并求出每個數(shù)據(jù)的秩;然后,計算兩組數(shù)據(jù)秩的差值并求平方;最后,將所有平方差求和并除以樣本量減一,得到Spearman秩相關(guān)系數(shù)。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年滬科版必修3英語上冊月考試卷含答案
- 2025年外研版2024選修2地理上冊階段測試試卷
- 二零二五版門衛(wèi)值班人員設(shè)備維護聘用合同4篇
- 2025年度新能源汽車電池回收與利用分包合同4篇
- 二零二五年度智能物流解決方案內(nèi)部銷售承包合同4篇
- 二零二五年度木門行業(yè)環(huán)保標準采購合同2篇
- 《包裝設(shè)計》 案例賞析 第4章 香生記品牌包裝設(shè)計
- 2025版內(nèi)退員工勞動合同范本:食品行業(yè)專用4篇
- 2025年度影視基地租賃合同范本及知識產(chǎn)權(quán)保護協(xié)議3篇
- 2025年農(nóng)場農(nóng)業(yè)廢棄物回收利用服務(wù)合同4篇
- 平安產(chǎn)險陜西省地方財政生豬價格保險條款
- 銅礦成礦作用與地質(zhì)環(huán)境分析
- 30題紀檢監(jiān)察位崗位常見面試問題含HR問題考察點及參考回答
- 詢價函模板(非常詳盡)
- 《AI營銷畫布:數(shù)字化營銷的落地與實戰(zhàn)》
- 麻醉藥品、精神藥品、放射性藥品、醫(yī)療用毒性藥品及藥品類易制毒化學(xué)品等特殊管理藥品的使用與管理規(guī)章制度
- 一個28歲的漂亮小媳婦在某公司打工-被老板看上之后
- 乘務(wù)培訓(xùn)4有限時間水上迫降
- 2023年低年級寫話教學(xué)評語方法(五篇)
- DB22T 1655-2012結(jié)直腸外科術(shù)前腸道準備技術(shù)要求
- GB/T 16474-2011變形鋁及鋁合金牌號表示方法
評論
0/150
提交評論