基于理化指標的葡萄酒評價分析模型_第1頁
基于理化指標的葡萄酒評價分析模型_第2頁
基于理化指標的葡萄酒評價分析模型_第3頁
基于理化指標的葡萄酒評價分析模型_第4頁
基于理化指標的葡萄酒評價分析模型_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 . . 38/41基于理化指標的葡萄酒評價分析模型 日期:2012高教社杯全國大學生數(shù)學建模競賽編 號 專 用 頁賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號):賽區(qū)評閱記錄(可供賽區(qū)評閱時使用):評閱人評分備注全國統(tǒng)一編號(由賽區(qū)組委會送交全國前編號):全國評閱編號(由全國組委會評閱前進行編號):基于理化指標的葡萄酒評價分析模型摘要本文在利用主成分分析法提取出主成分理化指標后,結合偏最小二乘回歸分析法建立了對葡萄和葡萄酒與其理化指標的相關分析和評價模型。 對問題1,在對附件1表格中的酒樣品序號按由小到大排序后,直接利用Excel中的函數(shù)命令,按每個評酒員對各項的打分進行求和,得到了每種酒樣品的

2、總評分。最后又對10名評酒員的各自總評分進行均值處理,得到了每種酒樣品的平均得分和平均得分方差。從平均得分和平均得分方差的比較,不同葡萄酒平均得分的排序和圖表三方面得出了兩組結果均存在明顯差異。后又通過方差和總體分布檢驗,結合圖表得出的第二組結果更可信,并給出了紅白葡萄酒的質量排序。在問題2中,首先將芳香物質視為葡萄的理化指標。再通過網上查詢對一些重要的理化指標進行了預先排序,后對所有理化指標實施了主成分分析法,分別提取出了9種和10種主成分紅白葡萄理化指標,累積貢獻率均達到了85%,并給出了對紅白葡萄的綜合評價值與其排序,詳見表7和表10。在問題3中,首先通過主成分分析法提取出了紅白葡萄酒中

3、的3種和4種主成分理化指標,與問題2中的紅白葡萄主成分理化指標相互討論,利用偏最小二乘回歸分析法建立了兩者之間聯(lián)系關系式,并通過回歸系數(shù)直方圖和預測圖進一步說明了建立的聯(lián)系。下面是紅葡萄與紅葡萄酒理化指標的回歸方程在問題4中,還是利用主成分分析法把得出的紅白葡萄和葡萄酒的主成分理化指標,與可信度強的第二組紅白葡萄酒的質量平均得分,視為自變量和因變量,通過偏最小二乘回歸分析法,建立了兩者之間的影響關系式,并結合回歸系數(shù)直方圖和預測圖得出能夠用葡萄和葡萄酒的理化指標來評價葡萄酒質量的結論。關鍵詞:方差 總體分布檢驗 主成分分析法 偏最小二乘回歸分析法1 問題重述確定葡萄酒質量時一般是通過聘請一批有

4、資質的評酒員進行品評。每個評酒員在對葡萄酒進行品嘗后對其分類指標打分,然后求和得到其總分,從而確定葡萄酒的質量。釀酒葡萄的好壞與所釀葡萄酒的質量有直接的關系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質量。附件1給出了某一年份一些葡萄酒的評價結果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分數(shù)據。請嘗試建立數(shù)學模型討論下列問題:1. 分析附件1中兩組評酒員的評價結果有無顯著性差異,哪一組結果更可信?2. 根據釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡萄進行分級。3. 分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系。4分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響

5、,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量?2 問題的分析2.1 問題1對于第一問:要討論兩組評酒員評價結果的差異性,先對附件1中4個表格里的樣酒按序號進行了由小到大的重新排序,因為它們排序都是打亂的,不方便實現(xiàn)差異性分析。其次,根據每個評酒員在打分后,求和得其總分來確定葡萄酒的質量得分。而葡萄酒在澄清度、色調等10個指標方面的總分又是一致的,在此直接利用Excel中函數(shù)命令按每個評酒員對各項的打分進行求和,得到了每種樣酒的總評分。最后又對10名評酒員的各自總評分進行均值處理,得到了每種樣酒的平均得分。由此還可求出10名評酒員各自總評分的方差,通過對平均得分和平均分方差的比較、排序

6、,結合圖表可對差異性實現(xiàn)分析。對于第二問:兩組評酒員評價結果的可信度分析。利用第一問得出的平均得分和平均得分方差,通過數(shù)據比較之后,會有一組平均得分的方差要大,說明它的偏離程度就大,可信度就降低。為進一步對偏離程度進行分析,可對27種紅葡萄酒和28種白葡萄酒的每名評酒員得分進行總體分布檢驗。因為它們的酒質量是未知的,方差也是未知的,屬于非參數(shù)檢驗。故可直接利用Matlab工具箱中的normfit命令進行非參數(shù)檢驗的總體分布檢驗,來確定哪一組評價結果偏離程度大,實現(xiàn)可信度分析。2.2 問題2首先我們也將芳香物質視為葡萄的理化理化指標。因為它是構成葡萄與葡萄酒質量的主要因素,決定著葡萄酒的風味和典

7、型性。題目要求根據釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡萄進行分級??煽紤]先從網上查詢釀酒葡萄中的理化指標對葡萄酒的作用與影響,粗略了解一下各項指標在葡萄酒中的所占的比重,把比重明顯靠前的放到前面,不重要靠后,主觀的對所有理化指標進行排序。然后,根據所有理化指標的排序,通過編程,利用主成分分析法提取出貢獻率大的n個理化指標,使其累積貢獻率達到85%以上,之后就用這n個作為主成分進行分析。最終能得出紅白葡萄綜合評價值與其排序結果,來實現(xiàn)分級(在討論白葡萄時,去掉花色苷理化指標,因白葡萄酒中不含有花色苷)。在運用主成分分析法前,得先對附件3中的葡萄酒樣品進行重新排序,還可能得對一些理化指標的

8、單位進行統(tǒng)一換算處理。2.3 問題3由題意知,可用偏最小二乘回歸分析法分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系。但由附件2知道,釀酒葡萄的理化指標含有28種,紅白葡萄的理化指標各為7種和6種??梢娨坑懻搩烧呃砘笜酥g的聯(lián)系,數(shù)據處理較大,過程可能也會較復雜。又由問題2知,能通過主成分分析法提取出紅白葡萄理化指標中的幾個主成分,且其累積貢獻率在85%以上,若用這幾個主成分理化指標來代替紅白葡萄的全部理化指標進行分析,在指標的個數(shù)上大大減少,并且主要信息卻基本沒丟,故方法是可行的。所以我們首先也要通過主成分分析法對紅白葡萄酒的理化指標進行分析,提取出累積貢獻率達到85%以上的幾個理化指標,用

9、來代替全部指標。然后用這兩部分主成分理化指標,利用偏最小二乘回歸分析法可實現(xiàn)對釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系分析。2.4 問題4 第一問:從2.3可知,完全可用由主成分分析法提取出來的主成分理化指標來代替全部理化指標進行分析,故本問還用那些主成分理化指標來分析對葡萄酒質量的產生的影響。對紅白葡萄酒質量的衡量,在此我們選取第一問中可信度較強的那一組結果。這樣因變量確定了,自變量為葡萄和葡萄酒的主成分理化指標,故還可用偏最小二乘回歸分析法實現(xiàn)對葡萄酒質量的影響分析,同時還給出了兩都之間的一個關系式。第二問:利用第一問中給出的葡萄和葡萄酒的主成分理化指標對葡萄酒質量的影響關系式,結合回歸系數(shù)直

10、方圖和預測圖,完全可判斷出能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量。3 模型假設1.每個評酒員在對葡萄酒進行品嘗后的分類打分都是客觀的;2.在第一組白葡萄酒的品嘗評分中,評酒員7和9分別對酒樣3和8中口感分析的持久性(總分8)給出了77和16的錯誤打分,我們視為打印錯誤,根據均值改為7和6;3.在評酒員評分過程中,設葡萄酒在外觀、香氣、口感和平衡/整體評價四方面共10個指標的總分是一致的;4.芳香物質是構成葡萄與葡萄酒質量的主要因素,決定著葡萄酒的風味和典型性,故將葡萄和葡萄酒的芳香物質視為釀酒葡萄和葡萄酒的理化指標。5.設附件3葡萄和葡萄酒芳香物質的各項成分所給數(shù)據的單位均為mmol/

11、L;6.設附件2中理化指標的順序是隨機排列的,可以對其打亂重排;7.設附件2中的理化指標之間不存在可完全替代的兩種理化指標,基本彼此線性無關。4 模型的建立與求解4.1兩組評酒員評價結果的有無顯著性差異分析和可信度分析首先,在附件1(葡萄酒品嘗評分表)中,我們發(fā)現(xiàn)4個表格里的酒樣排序都是打亂的,沒有固定的次序,無法很好的實現(xiàn)差異性分析,故對酒樣進行了序號由小到大的重新排序。其次,考慮到是根據每個評酒員在打分后,求和得其總分來確定葡萄酒的質量得分的。又葡萄酒在澄清度、色調等10個指標方面的總分是一致的,故沒有必要再用各項的打分與總分的比值來進行計算。在此,我們直接利用Excel中函數(shù)命令按每個評

12、酒員對各項的打分進行求和,得到了每種樣酒的總評分。后又對10名評酒員的各自總評分進行均值處理,得到了每種樣酒的平均得分。最后,為了差異性的討論又對10名評酒員的各自總評分求出了方差,同時對各項指標也進行了均值和方差處理,詳見附件1(葡萄酒品嘗評分表)中的4個表。4.1.1兩組評酒員對紅葡萄酒評價結果的有無顯著性差異分析下面是兩組評酒員對27種紅葡萄酒樣品的平均得分和平均分方差與它們的差(第一組減第二組)情況:紅葡萄酒樣品第一組第二組兩組平均分之差兩組平均分的方差之差平均得分平均分方差平均得分平均分方差162.792.9068.181.88-5.411.02280.339.797416.226.

13、323.57380.445.8274.630.715.815.11468.6108.0471.241.29-2.666.76573.362.0172.113.661.248.36672.259.7366.321.125.938.61771.5103.6165.362.686.240.93872.344.016665.116.3-21.10981.532.9478.225.733.37.211074.230.4068.836.185.4-5.781170.170.7761.638.048.532.721253.979.6668.325.12-14.454.531374.644.9368.815.

14、295.829.64147336.0072.623.160.412.841558.785.5765.741.34-744.221674.918.1069.920.105-2.001779.388.0174.59.174.878.841859.947.2165.450.27-5.5-3.061978.647.3872.655.166-7.782078.626.0475.839.072.8-13.022177.1116.1072.235.514.980.592277.250.6271.624.275.626.362385.632.4977.124.778.57.72247874.8971.510.

15、726.564.172569.264.6268.243.73120.892673.831.297241.561.8-10.27277349.7871.520.501.529.28表1 兩組評酒員對紅葡萄酒樣品的平均得分和平均分方差與平均分之差和平均分方差之差表從表1的兩組平均分之差列可以看出,只有5個是負值,并且還有13個數(shù)值都大于5,說明第一組評酒員的平均得分基本都要比第二組的平均得分要高,最多高出8.5分。第一組平均得分列的平均分73.06,比第二組的70.51也高出2.55分。最后的一列兩組平均分方差之差中,也只有7個是負值,大部分方差之差都要高出20,顯然第一組的平均得分偏離均值的程度

16、要大。它們的平均分方差的平均分差為58.62-33.79=24.83。為了更好說明兩組評酒員在紅葡萄酒樣品中的差異,通過程序(附錄1:ti1tu1.m),作出了兩組評酒員的平均得分圖,紅圓代表第一組得分,藍星代表第二組得分,見圖1。圖1 兩組評酒員對紅葡萄酒的平均得分圖4.1.2兩組評酒員對白葡萄酒評價結果的有無顯著性差異分析下面是兩組評酒員對28種白葡萄酒樣品的平均得分和平均分方差與它們的差(第一組減第二組)情況:白葡萄酒樣品第一組第二組兩組的平均分之差兩組平均分的方差之差平均得分平均分方差平均得分平均分方差18292.2277.925.884.166.34274.2201.0775.849

17、.07-1.6152.00378.366.4675.6142.492.7-76.03479.444.7176.942.102.52.61571126.4481.526.28-10.5100.17668.4162.7175.522.72-7.1139.99777.539.1774.242.183.3-3.01870.4163.3872.331.12-1.9132.26972.992.7780.4106.27-7.5-13.501074.3212.6879.870.40-5.5142.281172.3177.1271.487.820.989.301263.3115.7972.4140.04-9.1

18、-24.261365.9170.7773.946.77-8124.001472114.2277.115.88-5.198.341572.4131.6078.454.04-677.561674178.0067.382.236.795.771778.8144.1880.338.46-1.5105.721873.1156.5476.730.23-3.6126.311972.246.4076.426.04-4.220.362077.864.4076.650.041.214.362176.4172.7179.264.40-2.8108.312271138.6779.453.60-8.485.072375

19、.943.6677.411.60-1.532.062473.3111.1276.138.54-2.872.582577.133.8879.5106.50-2.4-72.622681.372.9074.3102.907-30.002764.8144.407735.56-12.2108.842881.380.4679.625.381.755.08表2 兩組評酒員對白葡萄酒樣品的平均得分和平均分方差與平均分之差和平均分方差之差表從表2的兩組平均分之差列可以看出,只有9個是正值,負值中有10個數(shù)值小于-5,說明第一組評酒員的平均得分基本都要比第二組的平均得分低,最多低12.2分。第一組平均得分列的平均

20、分73.96,比第二組的76.53也低了2.57分。但最后的一列兩組平均分方差之差中只有6個是負值,且大部分方差之差都要高出50,也是第一組的平均得分偏離均值的程度要大。它們的平均分方差的平均分差為117.80-56.02=61.78。為了更好說明兩組評酒員在白葡萄酒樣品中的差異,通過程序(附件2:ti1tu2.m),作出了兩組評酒員的平均得分圖,紅圓代表第一組得分,藍星代表第二組得分,見圖2。圖2 兩組評酒員對白葡萄酒的平均得分圖為了更進一步的說明兩組評酒員對紅白兩種葡萄酒的評分差異,我們又根據它們的平均得分對它們進行了排序,結果見下面表3:27種紅葡萄酒的排序28種白葡萄酒的排序第一組第二

21、組第一組第二組紅葡萄酒2385.6紅葡萄酒978.2白葡萄酒182白葡萄酒581.5紅葡萄酒981.5紅葡萄酒2377.1白葡萄酒2681.3白葡萄酒980.4紅葡萄酒380.4紅葡萄酒2075.8白葡萄酒2881.3白葡萄酒1780.3紅葡萄酒280.3紅葡萄酒374.6白葡萄酒479.4白葡萄酒1079.8紅葡萄酒1779.3紅葡萄酒1774.5白葡萄酒1778.8白葡萄酒2879.6紅葡萄酒1978.6紅葡萄酒274白葡萄酒378.3白葡萄酒2579.5紅葡萄酒2078.6紅葡萄酒1472.6白葡萄酒2077.8白葡萄酒2279.4紅葡萄酒2478紅葡萄酒1972.6白葡萄酒777.5白

22、葡萄酒2179.2紅葡萄酒2277.2紅葡萄酒2172.2白葡萄酒2577.1白葡萄酒1578.4紅葡萄酒2177.1紅葡萄酒572.1白葡萄酒2176.4白葡萄酒177.9紅葡萄酒1674.9紅葡萄酒2672白葡萄酒2375.9白葡萄酒2377.4紅葡萄酒1374.6紅葡萄酒2271.6白葡萄酒1074.3白葡萄酒1477.1紅葡萄酒1074.2紅葡萄酒2471.5白葡萄酒274.2白葡萄酒2777紅葡萄酒2673.8紅葡萄酒2771.5白葡萄酒1674白葡萄酒476.9紅葡萄酒573.3紅葡萄酒471.2白葡萄酒2473.3白葡萄酒1876.7紅葡萄酒1473紅葡萄酒1669.9白葡萄酒1

23、873.1白葡萄酒2076.6紅葡萄酒2773紅葡萄酒1068.8白葡萄酒972.9白葡萄酒1976.4紅葡萄酒872.3紅葡萄酒1368.8白葡萄酒1572.4白葡萄酒2476.1紅葡萄酒672.2紅葡萄酒1268.3白葡萄酒1172.3白葡萄酒275.8紅葡萄酒771.5紅葡萄酒2568.2白葡萄酒1972.2白葡萄酒375.6紅葡萄酒1170.1紅葡萄酒168.1白葡萄酒1472白葡萄酒675.5紅葡萄酒2569.2紅葡萄酒666.3白葡萄酒571白葡萄酒2674.3紅葡萄酒468.6紅葡萄酒866白葡萄酒2271白葡萄酒774.2紅葡萄酒162.7紅葡萄酒1565.7白葡萄酒870.4

24、白葡萄酒1373.9紅葡萄酒1859.9紅葡萄酒1865.4白葡萄酒668.4白葡萄酒1272.4紅葡萄酒1558.7紅葡萄酒765.3白葡萄酒1365.9白葡萄酒872.3紅葡萄酒1253.9紅葡萄酒1161.6白葡萄酒2764.8白葡萄酒1171.4白葡萄酒1263.3白葡萄酒1667.3表3 紅白兩種葡萄酒的排序4.1.3兩組評酒員評價結果的可信度分析 由上面分析結果知道,兩組評酒員的平均得分是存在明顯差異的,并且不論紅白葡萄酒第一組評酒員的評分結果方差都比第二組大,在這55種葡萄酒中竟多達42個,比例為76.36%,最大的平均分方差之差為152,說明第一組平均得分結果偏離均值的程度要大

25、。已可說明第二組的評價結果要比第一組的評價結果要可信。為了更好的說明問題,我們又用了非參數(shù)檢驗中的總體分布檢驗,對偏離程度進行了分析。如果只對每種葡萄酒樣品的兩組數(shù)據進行討論,因數(shù)據太少結果不明顯。在這里我們對27種紅葡萄酒和28種白葡萄酒的每名評酒員得分進行討論。因為它們的質量是未知的,肯定存在差異,所以方差也是未知的,屬于非參數(shù)檢驗。為了簡便,我們直接Matlab工具箱中的normfit命令進行總體分布檢驗,用程序(附錄3:fenbu1.m,附錄4:fenbu2.m)分別給出兩組紅、白葡萄酒樣品的總體分布圖,見下面圖3,圖4。圖3 兩組紅葡萄酒樣品的總體分布圖圖4 兩組白葡萄酒樣品的總體分

26、布圖從上面兩個圖的下方4個線形圖可以看出,數(shù)據基本都分布在一條直線上,說明兩組評酒員的評價結果確實都是客觀的。但上方的4個柱形圖告訴我們,第二組的數(shù)據沒有第一組集中,又知第一組紅白葡萄酒評價結果在均值為0.95的置信區(qū)間為(71.83,74.28)、(72.64,75.31),第一組紅白葡萄酒評價結果在均值為0.95的置信區(qū)間為(69.70,71.33)、(75.62,77.45),顯然第一組的數(shù)據偏離程度大。進一步說明第二組的評價結果要比第一組的評價結果要可信。 4.2釀酒葡萄的分級方案4.2.1釀酒葡萄中的理化指標對葡萄酒的作用與影響芳香物質:是具揮發(fā)性的、能夠產生一定氣味的含香物質的總稱

27、。葡萄與葡萄酒中芳香物質大部分都是結構簡單的小分子有機物,含量少,種類多。它們是構成葡萄與葡萄酒質量的主要因素,決定著葡萄酒的風味和典型性,芳香物質的種類、含量、感覺閾值與其之間的相互作用決定著葡萄酒的感官質量,芳香物質是造就葡萄酒風味的物質之一,葡萄酒中的芳香物質越多,葡萄酒的風味就濃厚。氨基酸:在葡萄酒的釀制過程中,通過發(fā)酵菌的生成作用,由氨基酸的協(xié)助將葡萄中的糖分解轉化成酒精。并在此過程中保留了原來的氨基酸并且有新的氨基酸,生成的這些氨基酸和多種微量元素都是生命必須的營養(yǎng)物質。蛋白質:蛋白質主要從葡萄籽、葡萄皮提取的。蛋白質在葡萄酒中起著多種作用:對酒石的穩(wěn)定、對蛋白的穩(wěn)定、芳香物質的支

28、撐體、穩(wěn)定多酚物質。而多酚物質對紅葡萄酒的感官質量起著決定性的作用。在酒精發(fā)酵過程中與當葡萄酒在酒泥上釀時,蛋白質可以影響葡萄酒的香氣質量,改變芳香物質的揮發(fā)性,還可提高葡萄酒的酒石穩(wěn)定性,同時可提高葡萄酒的“肥碩感”與香氣的馥郁性。Vc:具有抗氧化的作用同時還具有促氧的作用,但是由于它會使葡萄酒產生沉淀物質,所以不宜使用?;ㄉ?主要是皮里的物質花色苷,在葡萄酒中起呈色作用,通過浸漬葡萄皮中的部分花色苷被轉移到葡萄酒中,使得葡萄酒呈出紫紅色。在醞釀過程中,生成穩(wěn)定的色素,葡萄酒的顏色由紫色變?yōu)榇u紅,是紅葡萄酒顏色的主要形式,白葡萄酒中不含有。單寧:主要是由葡萄籽、皮與梗浸泡發(fā)酵而來,或是因為

29、存于橡木桶而萃取橡木的單寧而來。它是葡萄酒中所含有的二種酚化合物其中的一種物質,尤其在紅葡萄酒中含量較多,作用是使葡萄酒入口后口腔感覺干澀,口腔黏膜會有褶皺感。單寧的多少可以決定酒的風味、結構與質地。缺乏單寧的紅酒質地輕薄,沒有厚實的感覺。單寧豐富的紅酒可以存放經年,并且逐漸醞釀出香醇細致的年風味。總酚:含有多種酚類成分,廣泛分布在葡萄皮、梗和籽里面。這些成分在葡萄酒中起決定性的作用。首先,影響葡萄酒的口感,使葡萄酒具有苦味和收斂性,尤其是紅酒;第二,影響葡萄酒的顏色;第三,起到防腐的作用,延長酒的壽命;第四,在葡萄酒中的抗氧化作用。白藜蘆醇:主要存在于葡萄的果皮中,其次是種子。在葡萄中的含量

30、甚微,只有在釀造葡萄酒的發(fā)酵過程中與酶結合,才會使它的數(shù)量驟然增加。率能以游離態(tài)(順式、反式) 和糖苷結合態(tài)(順式、反式)2種形式在植物中分布與生物合成,且均具有抗氧化效能。葡萄酒中的白藜蘆醇含量的高低已成為衡量優(yōu)質酒和劣質酒的標準,但并不是所有的葡萄酒中都含有這種成分??傸S酮:主要是從葡萄皮和葡萄籽中提取的,在葡萄酒中的類黃酮類物質對葡萄酒的顏色、收斂性以與苦味等都具有重要的作用,還具有很強的抗氧化能力以與降血糖、抗病毒、抗腫瘤、免疫調節(jié)等作用,還可以作為食品添加劑來避免亞硝酸鹽導致的致病隱患等作用。 酒石酸、蘋果酸和檸檬酸:為葡萄果實中的主要有機酸,有近70的有機酸分布在中、果皮(即果肉)

31、中,其組成與含量是決定葡萄果實風味和品質的重要因素之一.有機酸的種類與其濃度調節(jié)著酸堿的平衡,必然要影響葡萄酒的酸味,進而也會影響葡萄酒的風味.此外,有機酸的防腐特性還可以增強葡萄酒的微生物和物化的穩(wěn)定性,酸度較高的年限短的白葡萄酒更具有釀潛力. 因此它們對葡萄酒的組成成分、穩(wěn)定性和感官品質都起著重要的作用.4.2.2主成分分析法的原理和步驟主成分分析(Principal Component Analysis)是利用降維的思想,將多個變量轉化為少數(shù)幾個綜合變量(即主成分),其中每個主成分都是原始變量的線性組全,各主成分之間互不相關,從而這些主成分能夠反映始變量的絕大部分信息,且所含的信息互不重

32、疊。采用這種方法可以從多達30多種釀酒葡萄的理化指標中,提取出貢獻率大的決定性理化指標,然后對其分類排序給出分級,這樣避免了都分析的復雜性,結果較為科學,信息也較為準確。下面為主成分分析法的評價步驟:(1)對原始數(shù)據進行標準化處理設所考察的n個量中含有m個指標變量(即成分),則由此可構造原始數(shù)據矩陣,(,),將各指標值轉換成標準化指標,(,)其中,(),即為第個指標的樣本均值和樣本標準差。對應地,稱,()為標準化指標變量。(2)計算相關系數(shù)矩陣相關系數(shù)矩陣,()式中,是第個指標與第個指標的相關系數(shù)。(3)計算特征值和特征向量計算相關系數(shù)矩陣的特征值,與對應的標準化特征向量,其中,由特征向量組成

33、m個新的指標變量式中是第1主成分,是第2主成分,是第m主成分。(4)選擇()個主成分,計算綜合評價值 = 1 * roman i)計算特征值的信息貢獻率和累積貢獻率。稱()為主成分的信息貢獻率;為主成分的累積貢獻率,當接近于1()時,則選擇前個指標變量作為個主成分,代替原來m個指標變量,從而可對個主成分進行綜合分析。 = 2 * roman ii)計算綜合得分其中為第個主成分的信息貢獻率,根據綜合得分值就可進行評價。4.2.3利用主成分分析法對釀酒葡萄質量的分析與分級方案因為是從葡萄酒的質量角度出發(fā)對釀酒葡萄進行分級的,故根據5.2.1中理化指標對葡萄酒的作用與影響,我們先主觀對一些理化指標進

34、行了排序,結果如下:12345678芳香物質氨基酸單寧總酚花色苷蛋白質酒石酸蘋果酸910111213141516檸檬酸葡萄總黃酮白藜蘆醇黃酮醇總糖還原糖可溶性固形物PH值表4 釀酒葡萄中理化指標的主觀排序為了運用主成分分析法,先對數(shù)據進行初步處理。利用根據1摩爾=1分子量克,對葡萄和葡萄酒中的芳香物質成分進行單位統(tǒng)一化。對含有二級指標的,與一級指標求和再取平均值。有多次測試值的,也取平均值。下面通過主成分分析法分別對紅白葡萄進行排序、分級。按表4中的理化指標排序,利用MATLAB軟件編程序(附錄5:fenjihong.m),求得紅葡萄相關系數(shù)矩陣的前10個特征根與其貢獻率,見下表5。序號理化指

35、標特征值貢獻率累計貢獻率1芳香物質7.0322.6722.672氨基酸4.9816.0638.723單寧3.7712.1550.884總酚2.869.2460.125花色苷2.056.6166.736蛋白質1.745.6272.357酒石酸1.424.5876.948蘋果酸1.284.1281.059檸檬酸1.113.5784.6310葡萄總黃酮0.892.8887.51表5 紅葡萄分級的主成分分析結果可以看出,前9個特征根的累計貢獻率就達到84.63%以上,已很接近85%,而增加一個成分貢獻率也就增加2.88,故選前9個作為主成分進行分析。下面是前9個特征根對應的特征向量,見表6。第1特征向

36、量第2特征向量第3特征向量第4特征向量第5特征向量第6特征向量第7特征向量第8特征向量第9特征向量-0.1010.096-0.1020.1120.204-0.032-0.0530.1440.6350.1380.2460.0130.255-0.195-0.2250.146-0.021-0.0640.286-0.059-0.148-0.046-0.1170.1830.199-0.0300.113.-0.211-0.1540.151-0.0090.064-0.2360.0540.3210.029-0.1230.1110.3870.037-0.0200.2230.2130.186-0.077-0.05

37、30.2090.319-0.0080.1170.3500.2510.069-0.099表6 紅葡萄主成分分析法的前9個特征根對就的特征向量由此可得9個主成分分別為. . . . . . . . . . . . . . . . . . . 分別以9個主成分的貢獻率為權重,構建主成分綜合評價模型:將紅葡萄酒的9種主成分值代入上式,可以得到各種紅葡萄的綜合評價值與其排序結果,見下表7所示。名次123456789紅葡萄樣品3樣品9樣品11樣品1樣品2樣品21樣品23樣品22樣品8綜合評價值1.581.171.061.060.990.950.340.280.28名次101112131415161718紅

38、葡萄樣品16樣品12樣品14樣品6樣品24樣品17樣品5樣品13樣品19綜合評價值0.140.120.11-0.12-0.15-0.18-0.20-0.22-0.28名次192021222324252627紅葡萄樣品7樣品18樣品15樣品4樣品20樣品27樣品26樣品10樣品25綜合評價值-0.30-0.33-0.40-0.65-0.69-0.80-1.01-1.17-1.58表7 紅葡萄的綜合評價值與其排序結果故按不含花色苷的表4中的理化指標排序(因白葡萄酒中不含有花色苷),利用MATLAB軟件編程序(附錄6:fenjibai.m),求得白葡萄相關系數(shù)矩陣的前11個特征根與其貢獻率,見下表8

39、。序號理化指標特征值貢獻率累計貢獻率1芳香物質5.72253619.7328819.73288312氨基酸4.76366716.4264436.15932013單寧3.57986412.3443648.50367894總酚2.1358427.36497355.86865185蛋白質1.9834646.83953262.70818376酒石酸1.6242075.60071568.30889887蘋果酸1.4430474.97602473.28492258檸檬酸1.1832924.08031677.36523869葡萄總黃酮1.1655584.01916681.384404710白藜蘆醇1.030

40、0233.55180484.936209111黃酮醇0.8156622.81262687.7488355表8 白葡萄分級的主成分分析結果可以看出,前10個特征根的累計貢獻率就達到84.94%以上,約為85%,而增加一個成分貢獻率也就增加2.81,故選前10個作為主成分進行分析。下面是前10個特征根對應的特征向量,見表9。第1特征向量第2特征向量第3特征向量第4特征向量第5特征向量第6特征向量第7特征向量第8特征向量第9特征向量第10特征向量0.02-0.050.02-0.51-0.04-0.25-0.130.37-0.060.040.240.110.070.170.340.02-0.09-0.

41、070.210.070.170.210.12-0.04-0.040.37-0.01-0.18-0.35-0.18.0.190.20-0.270.15-0.16-0.08-0.230.000.08-0.22-0.09-0.240.310.050.020.070.12-0.12-0.300.240.250.10-0.330.12-0.08-0.15-0.07-0.020.19-0.13表9 白葡萄主成分分析法的前10個特征根對就的特征向量由此可得10個主成分分別為. . . . . . . . . . . . . . . . . . . 分別以10個主成分的貢獻率為權重,構建主成分綜合評價模型:把

42、白葡萄酒的10個主成分值代入上式,可以得到各白葡萄的綜合評價值與其排序結果,見下表10所示。白葡萄樣品27樣品24樣品3樣品5樣品28樣品9樣品26名次1.0002.0003.0004.0005.0006.0007.000綜合評價值1.8081.2930.7140.6590.6250.3450.334白葡萄樣品20樣品10樣品25樣品7樣品15樣品6樣品23名次8.0009.00010.00011.00012.00013.00014.000綜合評價值0.3130.2980.2700.1730.1450.0960.052白葡萄樣品12樣品18樣品2樣品4樣品21樣品22樣品13名次15.00016.00017.00018.00019.00020.00021.000綜合評價值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論