9709統(tǒng)計學(xué)公式表_第1頁
9709統(tǒng)計學(xué)公式表_第2頁
9709統(tǒng)計學(xué)公式表_第3頁
9709統(tǒng)計學(xué)公式表_第4頁
9709統(tǒng)計學(xué)公式表_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

9709統(tǒng)計學(xué)公式表樣本加權(quán)平均數(shù):\bar{x}=\frac{M_{1}f_{1}+M_{2}f_{2}+...+M_{k}f_{k}}{f_{l}+f_{2}+...+f_{k}}=\frac{\sum_{i=1={k}{M_{i}f_{i}}}{n}總體加權(quán)平均數(shù):\mu=\frac{M_{1}f_{1}+M_{2}f_{2}+...+M_{k}f_{k}}{f_{1}+f_{2}+...+f_{k}}=\frac{\sum_{i=1={k}{M_{i}f_{i}}}{n}幾何平均數(shù):G=\sqrt[n]{x_{1}\cdotx_{2}...x_{n}}=\sqrt[n]{\prod_{i=1={n}x_{i}}深度理解幾何平均數(shù)的含義:1、比如持有了一只股票4年,買入價100元,每年的收益率分別為4.5%,2.1%,25.5%,1.9%,這是該用算術(shù)平均數(shù)還是幾何平均數(shù)來呢?我們先算出實(shí)際的收益是多少:每股實(shí)際收益=100(1+4.5%)(1+2.1%)(1+25.5%)(1+1.9%)-100=36.4457實(shí)際年利率為r則:100*[(1+r廠{4}-1)]=36.4457求出r=8.0787%我們再來看看算術(shù)平均數(shù)和幾何平均數(shù)是多少:\bar{x}=(4.5+2.1+25.5+1.9)/4/100=0.085G=\sqrt[4]{1.045*1.021*1.255*1.019}-1=0.080787顯然實(shí)際收益率是和用幾何平均數(shù)算出來的是一樣的,為什么會這樣呢,因?yàn)樗阈g(shù)平均數(shù)并沒有考慮到利息的時間價值。幾何平均數(shù)也主要用于計算這種平均比率。而且?guī)缀纹骄鶖?shù)<=算術(shù)平均數(shù)2、再換個角度來理解幾何平均數(shù):當(dāng)n=2時,x_{1}=2,x_{2}=18,那么根據(jù)公式可得G=\sqrt[2]{2\times18}=6,用二維圖來表示就是一個長寬分別為18和2的長方形面積和邊長為6的正方形面積相等。當(dāng)n=3時,x_{l}=10,x_{2}=51.2,x_{3}=8,則G=\sqrt[3]{10\times51.2\times8}=16,用三維圖形來表示就是一個長方體的體積等于邊長為16的正方體體積。3、來看看為什么幾何平均數(shù)比算術(shù)平均數(shù)低異眾比率:V_{r}=\frac{\Sigmaf_{i}-f_{m}}{\Sigmaf_{i}}=1-\frac{f_{m}}{\Sigmaf_{i}}\Sigmaf_{i}為變量的總頻數(shù),f_{m}為眾數(shù)的頻數(shù)。異眾比率越大,非眾數(shù)的頻數(shù)越大,眾數(shù)代表性越差。極差:R=max(x_{i})-min(x_{i})平均差:未分組數(shù)據(jù)的平均差M_0r0ib44=\frac{\sum_{i=1={n}{\left|x_{i}-\bar{x}\right|}}{n}分組數(shù)據(jù)的平均差M_hqp5o09=\frac{\sum_{i=1={k}{\left|M_{i}-\bar{x}\right|}f_{i}}{n}表中演示了怎么計算分組平均差:2040/120=17(臺)樣本方差:未分組數(shù)據(jù)方差SY2}=\frac{\sum_{i=1={n}{(x_{i}-\bar{x})={2}}{n-l}分組數(shù)據(jù)方差SY2}=\frac{\sum_{i=1={k}{(M_{i}-\bar{x}廠{2}f_{i}}}{n-l}總體方差:未分組\sigma^{2}=\frac{\sum_{i=1={n}{(x_{i}-\bar{x})={2}}{N}分組\sigma^{2}=\frac{\sum_{i=1={k}{(M_{i}-\bar{x})={2}f_{i}}{N}n-1稱為自由度:自由度是指附加給獨(dú)立的觀測值的約束或限制的個數(shù)。通俗的理解就是,因?yàn)楣街幸呀?jīng)知道了\bar{x},如果樣本數(shù)據(jù)有n個,這時獨(dú)立觀測值就不是njy,而是n-ijy。比如已知\bar{x}=5,樣本有三個數(shù)據(jù),x_{1}=2,x_{2}=10,這時x_{3}就不能任意取值,此時x_{3}只能等于3,獨(dú)立觀測值就只有2個而不是3個。更一般的就是對于n個樣本數(shù)據(jù),如果附加的約束個數(shù)有卜個,則自由度為n-k。理解為什么樣本方差要除以n-1,而總體就不需要,而是直接除以N:我們實(shí)際上是用樣本的方差去估計總體的方差,既然是估計肯定就會有誤差,我們除以n-1后計算出的方差就叫對總體\sigmaY2}的無偏估計;而總體計算出來的就是實(shí)實(shí)在在的總體方差,并沒有估計一說。下面用圖表來解釋為什么要除以n-1。標(biāo)準(zhǔn)差:未分組數(shù)據(jù)標(biāo)準(zhǔn)差s=\sqrt{\frac{\sum_{i=1={n}{(x_{i}-\bar{x})={2}}{n-1}}分組標(biāo)數(shù)據(jù)準(zhǔn)差s=\sqrt{\frac{\sum_{i=1={k}{(M_{i}-\bar{x}廠{2}f_{i}}}{n-1}}標(biāo)準(zhǔn)分?jǐn)?shù)(z分?jǐn)?shù)):z_{i}=\frac{x_{i}-\bar{x}}{s}標(biāo)準(zhǔn)分?jǐn)?shù)也稱標(biāo)準(zhǔn)化值或z分?jǐn)?shù),表示某個數(shù)據(jù)距離平均值多少個標(biāo)準(zhǔn)差。在對量綱不同的數(shù)據(jù)集進(jìn)行比較時就需要使用標(biāo)準(zhǔn)分?jǐn)?shù)這個概念了。比如一個數(shù)據(jù)集為[1,3,5,6,8],另一個數(shù)據(jù)集為[134,345,872,1004,2309]。這兩個數(shù)據(jù)集的平均值和標(biāo)準(zhǔn)差都不同,而且第一個數(shù)據(jù)集中的數(shù)據(jù)與第二個數(shù)據(jù)集中的數(shù)據(jù)相差甚大,但是通過標(biāo)準(zhǔn)分?jǐn)?shù)就能比較每個數(shù)據(jù)相較于自身數(shù)據(jù)集的離散程度。經(jīng)驗(yàn)法則:當(dāng)一組數(shù)據(jù)對稱分布時,經(jīng)驗(yàn)法則表明:約有68%的數(shù)據(jù)在平均數(shù)\pm1個標(biāo)準(zhǔn)差的范圍之內(nèi)。約有95%的數(shù)據(jù)在平均數(shù)\pm2個標(biāo)準(zhǔn)差的范圍之內(nèi)。約有99%的數(shù)據(jù)在平均數(shù)\pm3個標(biāo)準(zhǔn)差的范圍之內(nèi)。也就是說,一組數(shù)據(jù)中有相當(dāng)多的數(shù)據(jù)低于或高于平均值3個標(biāo)準(zhǔn)差,超出這3個標(biāo)準(zhǔn)差的數(shù)據(jù)稱為異常值。切比雪夫不等式:P(\left|X-\mu\right|\geqk\sigma)\leq\frac{l}{k^{2}}其中k>0,\mu是期望,\sigma是標(biāo)準(zhǔn)差。經(jīng)驗(yàn)法則適合對稱分布的數(shù)據(jù),對于不是對稱分布的數(shù)據(jù)可以用切比雪夫不等式,它對任何分布形狀的數(shù)據(jù)都適用將上面的式子變一下形:P(\left|X-\mu\right|\leqk\sigma)\geq1-\frac{l}{k^{2}}切比雪夫不等式提供的是下界,也就是所占比列至少是多少。通過上式的理解就是至少有1-\frac{l}{k~2}的概率數(shù)據(jù)落在\pmk個標(biāo)準(zhǔn)差之內(nèi),對于k=2,3,4,該不等式的含義是:至少有75%的數(shù)據(jù)在平均數(shù)\pm2個標(biāo)準(zhǔn)差范圍之內(nèi)。至少有89%的數(shù)據(jù)在平均數(shù)\pm3個標(biāo)準(zhǔn)差范圍之內(nèi)。至少有94%的數(shù)據(jù)在平均數(shù)\pm4個標(biāo)準(zhǔn)差范圍之內(nèi)。離散系數(shù)(變異系數(shù)):\upsilon=\frac{s}{\bar{x}}對于平均水平不同或計量單位不同的不同數(shù)據(jù)集,不能用標(biāo)準(zhǔn)差直接比較它們的離散程度,需要引入離散系數(shù)進(jìn)行比較。離散系數(shù)是衡量數(shù)據(jù)離散程度的相對統(tǒng)計量,主要用于比較不同樣本數(shù)據(jù)的離散程度。離散系數(shù)越大,數(shù)據(jù)的離散程度越大。偏態(tài)與峰態(tài)的度量:偏態(tài)系數(shù):未分組數(shù)據(jù)SK=\frac{n\Sigma(x_{i}-\bar{x}廠{3}}{(n-1)(n-2)sY3}}分組數(shù)據(jù)SK=\frac{\sum_{i=1={k}{(M_{i}-\bar{x})f_{i}}}{nsY3}}偏態(tài)是對數(shù)據(jù)分布對稱性的測度,測度偏態(tài)的統(tǒng)計量是偏態(tài)系數(shù)SK。如果數(shù)據(jù)的分布是對稱的,則\Sigma(x_{i}-\bar{x}廠3=0,所以偏態(tài)系數(shù)為0,如果偏態(tài)系數(shù)不等于則表明分布是非對稱的。SK>1或SK<-1,稱為高度偏態(tài)分布SK在0.5?1或-1?-0.5之間,稱為中等偏態(tài)分布當(dāng)SK為正值時,表示數(shù)據(jù)正偏或右偏,所謂右偏就是均值在眾數(shù)的左邊。當(dāng)SK為負(fù)值時,表示數(shù)據(jù)負(fù)偏或左偏,所謂左偏就是均值在眾數(shù)的左邊。峰態(tài)系數(shù):未分組數(shù)據(jù)K=\frac{n(n+1)\Sigma(x_{i}-\bar{x}廠{4}-3[\Sigma(x_{i}-\bar{x}廠{2}「{2}(n-1)}{(n-1)(n-2)(n-3)sY4}}分組數(shù)據(jù)K=\frac{\sum_{i=1={k}{(M_{i}-\bar{x}廠{4}f_{i}}}{nsY4}}-3峰態(tài)是對數(shù)據(jù)分布平峰或尖峰程度的測度,測度峰態(tài)的統(tǒng)計量是峰態(tài)系數(shù)K。峰態(tài)是相對于標(biāo)準(zhǔn)正態(tài)分布而言的,標(biāo)準(zhǔn)正態(tài)分布的峰態(tài)為0。當(dāng)K>0時,為尖峰分布。當(dāng)K<0時,為扁平分布。概率的性質(zhì)與運(yùn)算法則:P(\Omega)=1P(\Phi)=0必然事件表示為\Omega,不可能事件表示為\Phi事件A與B互斥:P(A\cupB)=P(A)+P(B)一般情況下:P(A\cupB)=P(A)+P(B)-P(A\capB)條件概率:P(A|B)B發(fā)生的條件下,A發(fā)生的概率P(A|B)=\frac{P(AB)}{P(B)}\RightarrowP(AB)=P(B)P(A|B)隨機(jī)變量:概率函數(shù):P(x_{i})=P(X=x_{i})X稱為P(X)的隨機(jī)變量P(X)稱為隨機(jī)變量X的概率函數(shù)離散型隨機(jī)變量的期望和方差,標(biāo)準(zhǔn)差:\mu=E(X)=x_{1}p_{1}+x_{2}p_{2}+...+x_{n}p_{n}=\sum_{i=1={n}{x_{i}p_{i}}'sigma/二D(X)=E[X-E(X)「2=\sum_{i=1={n}{[x_{i}-E(X)「{2}p_{i}}=E(XY2})-[E(X)「{2}\sigma=\sqrt{D(X)}隨機(jī)變量的方差定義為每個隨機(jī)變量的值與期望值的偏差平方的期望值。離散變量離散系數(shù):V=\frac{\sigma}{E(X)}與之前抽樣調(diào)查中的離散系數(shù)\upsilon=\frac{s}{\bar{x}}完全相同,只是符號表示不一樣而已。二項分布X'simB(n,p):P\{X=x\}=C_{n={x}pYx}qYn-x},x=0,1,2,...,nE(X)=np,D(X)=npq用X表示n次重復(fù)獨(dú)立試驗(yàn)中時間A成功出現(xiàn)的次數(shù)。這種試驗(yàn)被稱為伯努利試驗(yàn)。\sum_{x=0={n}{C_{n={x}pYx}qC{n-x}}=(p+q)Yn}=1,而這就是二項式定理。二項式展H^n+1項):(p+q廠{n}=C_{n={O}pYn}qYO}+C_{n={l}pYn-1}qYl}+C_{n={2}pYn-2}qY2}+...+C_{n={n-1}pYl}qYn-l}+C_{n={n}pY0}qYn}泊松分布:P(X)=\frac{\lambda^{x}e^{-\lambda}}{x!},x=0,1,2...E(X)=\lambda,D(X)=\lambda\lambda為給定時間間隔內(nèi)事件的平均數(shù)。泊松分布是用來描述在一指定范圍內(nèi)或在指定的面積或體積之內(nèi)某一事件出現(xiàn)的次數(shù)的分布。在n重伯努利試驗(yàn)中,當(dāng)成功的概率很小,即p\rightarrow0,試驗(yàn)次數(shù)很大時,二項分布可近似等于泊松分布。泊松分布近似等于二項分布:C_{n}^{x}p^{x}q^{n-x}\approx\frac{\lambda^{x}e^{-\lambda}}{x!}在實(shí)際應(yīng)用中,當(dāng)p\leq0.25,n>20,np\leq5時上式成立。連續(xù)性隨機(jī)變量的概率分布:概率密度函數(shù)f(x): (1)f(x)\geq0,(2)\int_{-\infty={+\infty}f(x)dx=1分布函數(shù):F(x)=P(X\leqx)=\int_{-\infty={x}f(t)dt,一\infty<x<+\infty期望和方差:\mu=E(X)=\int_{-\infty={+'infty}xf(x)dx\sigmaY2}=D(X)=\int_{-\infty={+\infty}[x-E(X)「{2}f(x)dx正態(tài)分布X\simN(\mu,\sigma^{2}):f(x)=\frac{l}{\sigma\sqrt{2\pi}}e^{一\frac{l}{2\sigma^{2}}(x-\mu廠{2}},-\infty<x<+\infty標(biāo)準(zhǔn)正態(tài)分布N(0,1):概率密度函數(shù)\varphi(x)=\frac{l}{\sqrt{2\pi}}e^{-\frac{x^{2}}{2}},-\infty<x<+\infty分布函數(shù)\Phi(x)=\int_{-\infty={x}\varphi(t)dt=\int_{-\infty={x}\frac{l}{\sqrt{2\pi}}eY-\frac{tY2}}{2}}dt一般正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布:Z=\frac{X-\mu}{\sigma}\simN(0,1)統(tǒng)計量:樣本均值\bar{X}=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論