北航數理統計第一次大作業(yè)_第1頁
北航數理統計第一次大作業(yè)_第2頁
北航數理統計第一次大作業(yè)_第3頁
北航數理統計第一次大作業(yè)_第4頁
北航數理統計第一次大作業(yè)_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、北京航空航天大學數理統計課程論文數理統計第一次課程論文廣州恒大隊在2015賽季亞冠的進球數的多元線性回歸模型學號: SY1527205 姓名: 郭謝有 摘要本賽季亞洲冠軍聯賽,來自中國的球隊廣州恒大淘寶隊最終在決賽中力克阿聯酋的迪拜阿赫利隊,三年之內第二次奪得亞冠冠軍。為了研究恒大的奪冠過程,本文選取了恒大該賽季亞冠總共15場比賽中的進球數為因變量,對可能影響進球數的射門數、射正數等7個自變量進行統計,并進一步利用統計軟件SPSS對以上數據進行了多元逐步線性回歸。最終確定了進球數與各因素之間關系的“最優(yōu)”回歸方程。關鍵詞:多元線性回歸,逐步回歸法,廣州恒大,SPSS目錄摘要11.引言32.符號

2、說明33.數據的采集和整理33.1數據的采集33.2建模44.數據分析及計算44.結論9參考文獻10致謝101.引言一場足球比賽的進球數說明了一支球隊攻擊力的強弱,也是決定比賽勝負的至關因素,綜合反映出這支球隊的實際水平。而作為競技體育,足球場上影響進球數的因素很多,為了研究本賽季恒大在亞冠奪冠過程中的14場比賽中進球數與其他一些因素的關系,本論文從搜達足球和新浪體育數據庫中查找了進球數和其他7個主要影響因素的數據,包括射門次數、射正次數、傳球次數、傳中次數、角球次數、搶斷次數。并進一步采用多元逐步回歸分析方法對以上因素進行了顯著性分析,從而確定了關于恒大在本賽季亞冠中進球數的最優(yōu)多元線型回歸

3、方程。2.符號說明變量符號進球數y射門次數X1射正次數X2傳球次數X3傳中次數X4角球次數X5搶斷次數X63.數據的采集和整理3.1數據的采集本文統計數據時,查閱了搜達足球數據庫,確定恒大在亞冠14場比賽中的進球數為因變量,并初步選取這14場比賽中的射門次數、射正次數、傳球次數、傳中次數、角球次數、搶斷次數7因素為自變量,具體數據見下表1。表1.恒大進球數與影響因素數據表比賽輪次射門/次射正數/次傳球數/次傳中數/次角球數/次搶斷/次控球率/%進球數1157376194164612953281551641331483721531653441463112552042159142921322500

4、615035138131256071533362291850185232718514452982358911039310173391145947111279505311115522129161016314680139335119616520148353421556213.2建模本文選取了恒大在亞冠比賽中的進球數作為因變量y,并選取可能對進球數造成影響的因素為自變量,其中對應關系在符號說明中已經列舉。這里構建模型如下:y=0+i=17iXi+其中,其中為隨機誤差項,0為常數項,i為待估計的參數。4.數據分析及計算本文利用逐步回歸法對該問題進行分析。該方法是從一個自變量開始,視自變量對y的顯著程度

5、,從大到小地依次逐個引入回歸方程,但當引入的自變量由于后面的引入而變得不顯著時,要將其剔除掉。引入一個自變量或從回歸方程中剔除一個自變量,為逐步回歸的一步,對于每一步都要進行F值檢驗,以確保每次引入新的顯著性自變量前回歸方程中只包含對作用顯著的變量。這個過程反復進行,直至既無不顯著的變量從回歸方程中剔除,又無顯著變量可引入回歸方程時為止。 本文運用統計軟件SPSS的有關功能模塊根據上述原理精選出一些配合較好和方差貢獻大的自變量組建回歸方程。為了從挑選因子中篩選出盡可能多的因子建立模型,本系統可以自己給出F臨界值,計算機默認的F引=0.05,F剔=0.1,如果入選的自變量因子數目不多,可通過人為

6、提高F臨界值的水平而篩選出更多的因子。如此時入選的因子太多,可人為提高F臨界值的水平而篩選出有代表性因子來組建模型。如最后建立的模型的復相關系數不大,回歸模型的擬合精度不太高,可根據這些入選因子來組建多元非線性模型。該分析在默認的F引=0.05,F剔=0.1時入選的自變量只有兩個,因此提高F值,因此設定F引=0.45,F剔=0.55,進行多元線性回歸分析,可得如下分析結果:表2. 自變量引入和剔除表上表2顯示了自變量的引入和剔除,以及引入或剔除的方法與標準。系統在進行逐步回歸過程中產生了4個模型,模型1是按照F檢驗的標準概率值,先將與y最密切的射正數(X2)引入模型,建立y與X2之間的一元線性

7、回歸模型,然后再將傳中數(X4)引入模型,建立y與X2,X4之間的二元線性模型,之后分別依次把傳球數(X3),搶斷數(X6)引入模型,分別建立了他們與y之間的三元、四元線性模型,最后建立的是y與X2,X3,X4,X6之間的四元線性關系。表3. 模型摘要表4. 變量數分析表5. 變量系數表表6. 排除的變量表圖7.直方圖和回歸標準化殘差的標準P-P圖4.結論通過前面的SPSS逐步多元線性回歸分析可以得到最優(yōu)的回歸方程為:y=4.666+0.271X2-0.005X3-0.069X4-0.079X6由以上回歸方程可知,恒大在上賽季亞冠比賽中的進球數與射正數、傳中數、傳球數和搶斷數呈線性相關性顯著。

8、眾多周知,一場足球比賽中的進球數與射正球門的次數有直接關系,并且傳中數也能對球門造成很大的威脅,而傳球數則代表一支球隊在場上是否能控制住局面,搶斷則有更多的反擊機會,所以以上分析結果與現實情況相符合。當然一場比賽的進球數綜合了各方面的因素,甚至還受到一些偶然因素的影響,所以分析結果也存在著一些不足。此外由于所查閱的數據不夠多,只統計了恒大上賽季在亞冠的所有比賽(14場),場次不夠多,并且有些變量難以統計和查找,再加之競技體育的一些不確定性,所以上訴回歸模型還有一定的漏洞和不足。但是也從一定程度上反映了進球數這一因變量與自變量的線性關系,并能對因變量(進球數)做出近似的估計,綜合來看,上述回歸模型基本達到了預期的目的和效果。參考文獻1 孫海燕,周夢,李衛(wèi)國,馮偉. 應用數理統計M. 北京:北京航空航天大學數學系, 2015.2 搜達足球官方網站亞冠數據庫. 3 新浪網亞冠數據庫.致謝感謝孫海燕老師上課時的嚴謹和認真,他

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論