




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、葡萄酒質(zhì)量的評價摘 要葡萄酒質(zhì)量的好壞主要依賴于評酒員的感觀評價,由于人為主觀因素的影響,對于酒質(zhì)量的評價總會存在隨機差異,為此找到一種簡單有效的客觀方法來評酒,就顯得尤為重要了。本文通過研究釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量的關(guān)系,以及葡萄酒和釀酒葡萄檢測的理化指標的關(guān)系,以及葡萄酒理化指標與葡萄酒質(zhì)量的關(guān)系,旨在通過客觀數(shù)據(jù)建立數(shù)學模型,用客觀有效的方法來評價葡萄酒質(zhì)量。首先,采用雙因子可重復方差分析方法,對紅、白葡萄酒評分結(jié)果分別進行檢驗,利用Matlab軟件得到樣品酒各個分析結(jié)果,結(jié)合數(shù)據(jù)分析,發(fā)現(xiàn)對于紅葡酒有的評價結(jié)果存在顯著性差異,對于白葡萄酒只有53%的評價結(jié)果存在顯著性差異。通過
2、比較可知,兩組評酒員對紅葡萄酒的評分結(jié)果更具有顯著性差異,而對于白葡萄酒的評分,評價差異性較為不明顯。為了評價兩組結(jié)果的可信度,借助Alpha模型用克倫巴赫系數(shù)衡量,并結(jié)合檢驗,得出紅葡萄酒第一組評酒員的評價結(jié)果可信度更高,而對白葡萄酒的品嘗評分,第二組評酒員的評價結(jié)果可信度更高。綜合來看,主觀因素對葡萄酒質(zhì)量的評價具有不確定性。結(jié)合已分析出的兩組品酒師可靠性結(jié)果,對葡萄酒的理化指標進行加權(quán)平均,最終得出十位品酒師對樣品酒的綜合評價得分。將每一樣品酒的綜合得分與其所對應(yīng)釀酒葡萄的理化指標(一級指標)共同構(gòu)成一個數(shù)據(jù)矩陣,采用聚類分析法,利用SPSS軟件對葡萄酒樣進行分類,根據(jù)分類的結(jié)果以及各葡
3、萄樣品酒綜合得分最終將釀酒葡萄分為A(優(yōu)質(zhì))、B(良好)、C(中等)、D(差)四個等級,客觀地反映了釀酒葡萄的理化指標與葡萄酒質(zhì)量之間的聯(lián)系。為了分析釀酒葡萄與葡萄酒理化指標之間的聯(lián)系,采用相關(guān)分析法,能有效地反映出兩者間的聯(lián)系,取與葡萄各成分相關(guān)性顯著的葡萄酒理化指標,與葡萄成分做多元線性回歸得出葡萄酒理化指標與釀酒葡萄的擬合方程,從而反映釀酒葡萄與葡萄酒理化指標之間的聯(lián)系。由于已經(jīng)通過回歸分析建立了釀酒葡萄和葡萄酒理化指標之間的關(guān)系,因此從釀酒葡萄成分對葡萄酒的理化指標的影響,再研究出葡萄酒理化指標與葡萄酒質(zhì)量的聯(lián)系,便可作為一個橋梁,反映出葡萄與葡萄酒理化指標對葡萄酒的質(zhì)量的作用。研究葡
4、萄酒理化指標與葡萄酒質(zhì)量的聯(lián)系,需要運用變量間的相關(guān)性及系數(shù)法分析葡萄酒的理化指標與葡萄酒質(zhì)量評價指標的相關(guān)性,通過比較選出與葡萄酒評價的一級指標相關(guān)性程度大的葡萄酒成分,進行回歸分析法,建立釀酒葡萄的理化指標與葡萄酒質(zhì)量之間的擬合方程,結(jié)合各個質(zhì)量一級指標的權(quán)重,從而完成了從葡萄酒成分對葡萄酒質(zhì)量的客觀評價。綜合計算結(jié)果,與釀酒葡萄分級的結(jié)果吻合,所以分析結(jié)果較客觀。關(guān)鍵詞:葡萄酒 雙重多因素分析 數(shù)據(jù)分析 Alpha模型 聚類分析及歐式距離相關(guān)性分析 多元回歸 系數(shù)法1. 問題重述葡萄酒的感官質(zhì)量是評價葡萄酒質(zhì)量優(yōu)劣的重要標志。確定葡萄酒質(zhì)量時一般是通過聘請一批有資質(zhì)的評酒員進行品評。每個
5、評酒員在對葡萄酒進行品嘗后對其分類指標打分,然后求和得到其總分,從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質(zhì)量,可輔助感官檢查。附件1給出了某一年份一些葡萄酒的評價結(jié)果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分數(shù)據(jù)。試建立數(shù)學模型求解下列問題:1. 分析附件1中兩組評酒員的評價結(jié)果有無顯著性差異,哪一組結(jié)果更可信?2. 根據(jù)釀酒葡萄的理化指標和葡萄酒的質(zhì)量對這些釀酒葡萄進行分級。3. 分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系。4分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響,并論證能否用
6、葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)量?2. 問題分析釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質(zhì)量,本題要求通過釀酒葡萄的理性指標和釀酒師給予的評分,綜合考慮釀酒葡萄的理性指標與葡萄酒的質(zhì)量的關(guān)系。問題一:要求對兩組評酒員評價結(jié)果有無差異性進行分析,并分析得出哪一組的品酒員的結(jié)果更具有可信。通過繪制每個樣品酒的均值評分差異圖,對每個樣品酒的兩組評酒員在各個指標的均值進行比較,發(fā)現(xiàn)對于紅葡萄的評價,兩組評酒員還是存在著顯著性的差異的,而對于白葡萄酒的評價,兩組評酒員的差異性并不是很明顯,列舉部分紅、白葡萄酒評分差異圖如下: 圖
7、表 1紅葡萄酒樣品12差異圖(左邊),系列1為第二組品酒員打分均值,系列2為第一組品酒員打分均值。圖表 2紅葡萄酒樣品15差異圖(右邊),橫坐標為10個指標變量,包括澄清度、色調(diào)、香氣純正度、香氣濃度、香氣質(zhì)量、口感純正度、口感濃度、口感質(zhì)量以及整體評價。 針對兩組評酒員在大量差異圖中表現(xiàn)出來對紅、白葡萄酒的評價存在差異,對紅、白葡萄酒進行分開地顯著性檢驗。第一步,利用每個樣品酒都具有兩組評酒員的評價結(jié)果,對兩組結(jié)果進行雙因子可重復方差分析,得出題中給出的27種葡萄樣品酒各個分析結(jié)果。比較27個顯著性檢驗的結(jié)果,若具有顯著性差異的樣品酒占總樣品酒的比例高于,有足夠的把握認定兩組評酒員的評價結(jié)果
8、具有顯著性差異。第二步,對兩組評酒員給予紅、白葡萄酒的打分進行可信性分析,將紅、白葡萄酒分別進行可信度分析,比較兩組評酒員對不同種類葡萄酒的評價是否具有各自的優(yōu)勢。在進行雙因子多重分析和可信性分析之前,需要對原先數(shù)據(jù)進行如下處理:1.對于附件1給出的數(shù)據(jù),先將兩組品酒員的評價結(jié)果按著樣品酒進行統(tǒng)一劃分,每一樣品酒對應(yīng)著兩種評價結(jié)果。將每一樣品酒的評價結(jié)果組成評價矩陣,矩陣以葡萄酒的評價指標為列項,共10列,以每個評酒員作為橫向量,共20行。2.針對紅葡萄酒樣品20評酒員4號對色調(diào)的評分缺失,利用同組評酒員對紅葡萄酒樣品20色調(diào)評分的平均值作為4號評酒員的評分值。做可信度分析時,將兩組的27種酒
9、樣品評價結(jié)果組成兩組評價總矩陣,以葡萄酒的評價指標為列項,共10列,以每個評酒員作為橫向量,共270行,分別用SPSS19.0對兩組矩陣進行信度分析,目的是對量表的可靠性與有效性進行檢驗,判斷出哪一組可信度更高。問題二:問題二要求對釀酒葡萄進行分級,釀酒葡萄的成分直接影響葡萄酒的質(zhì)量,選取優(yōu)質(zhì)營養(yǎng)成分高的釀酒葡萄釀酒,保證了葡萄酒的營養(yǎng)價值和保健價值。但是葡萄酒質(zhì)量優(yōu)劣,不單單從營養(yǎng)成分和養(yǎng)身價值上考慮,一瓶優(yōu)質(zhì)的葡萄酒,還得具備著可觀賞性,純正的口感、芬芳的酒香等優(yōu)點,而這些優(yōu)點,都得由評酒員來給出評價。所以,對釀酒葡萄進行分級,不單單從葡萄的成分上考慮,還得結(jié)合最終釀成的葡萄酒質(zhì)量綜合考慮
10、。因此將釀酒葡萄的各成分與評價員給予所釀成的葡萄酒的質(zhì)量打分綜合起來,進行聚類分析,將釀酒葡萄依據(jù)綜合指數(shù)進行分類,結(jié)合聚類分析的結(jié)果以及綜合指標的分數(shù)將葡萄劃分等級。依據(jù):在進行據(jù)聚類分析之前,需要對原始數(shù)據(jù)進行預(yù)先處理1. 分別計算附件一中評酒員各項評分指標的權(quán)重并加和,最后求取10位評酒員的權(quán)重平均值作為葡萄酒樣品的綜合評價指標。2. 用釀酒葡萄各項理化指標(多次測得的取平均值)以及酒樣的綜合指標形成一個31列28行的原始資料陣,并用SPSS 的標準化將數(shù)據(jù)標準化。問題三:釀酒葡萄和葡萄酒的理化指標都很多,為了找出它們之間的聯(lián)系,首先將葡萄的成分與葡萄酒的理性指標列成一個大矩陣,分析葡萄
11、成分與葡萄酒理想指標的相關(guān)性,找出它們之間相關(guān)性大的指標,與葡萄成分做多元線性回歸得出葡萄酒理化指標與釀酒葡萄的擬合方程,從而反映釀酒葡萄與葡萄酒理化指標之間的聯(lián)系。1. 釀酒葡萄的成分和葡萄酒的理化指標列成一個大矩陣。2. 通過SPSS軟件做相關(guān)性分析,選取與葡萄酒理化指標相關(guān)性程度大的葡萄酒成分個指標,建立擬合方程。問題四:釀酒葡萄的理化指標并不能直接與葡萄酒的質(zhì)量建立聯(lián)系,由于在問題3中已經(jīng)通過相關(guān)性分析建立了釀酒葡萄和葡萄酒理化指標之間的關(guān)系,因此我們分析葡萄酒的理化指標與葡萄酒質(zhì)量的相關(guān)性,計算相關(guān)性系數(shù),通過比較選出系數(shù)高的即與葡萄酒質(zhì)量指標相關(guān)性程度大的葡萄酒成分,進而用回歸分析
12、法建立釀酒葡萄的理化指標與葡萄酒質(zhì)量之間的關(guān)系。1附表一中列出了十位品酒員對葡萄酒外觀、香氣和口感分析三者的數(shù)據(jù),用Matlabb,分別對四項指標求27(28)種紅(白)葡萄酒樣品權(quán)重平均值作為葡萄酒質(zhì)量的評價指標。2. 通過SPSS軟件作因子分析分析兩者之間的相關(guān)性,選取與葡萄酒質(zhì)量指標相關(guān)性程度大的葡萄酒成分個指標,建立擬合方程。3. 符號說明顯著性水平置信度誤差平方和行組間誤差列組間誤差組內(nèi)誤差克倫巴赫系數(shù)明考斯基距離歐式距離4. 模型假設(shè)(1) 假設(shè)數(shù)據(jù)來源真實有效(2) 假設(shè)各變量的相差微小,各坐標對歐式距離的貢獻是同等的且變差大小相同,歐氏距離效果理想。(3) 假設(shè)釀酒工藝條件相同
13、,無其他人為因素影響(4)為低信度,則尚可,若則屬于高信度。假設(shè)組一與組二評分分別處于不同信度區(qū)間,可信度差異明顯。5. 建模過程5.1. 問題一的建模與求解模型建立:利用雙因素可重復方差分析結(jié)合0-1分析檢驗兩組評酒員的評價結(jié)果有無顯著性差異1.雙因子可重復方差分析的統(tǒng)計模型。假設(shè)在兩因子方差分析中,因子共有個水平,記作,每個水平下,進行次試驗,因子共有個水平。一個典型的雙因子方差分析的數(shù)據(jù)結(jié)構(gòu)如下表所示。表格 1 雙因子可重復方差分析的數(shù)據(jù)結(jié)構(gòu)因子因子為因子的某個水平下第試驗所得結(jié)果,表示因子的第個水平,。第列數(shù)據(jù)為因子的第個水平下所考察的變量取值,每一列為一個總體,=1,2,。所以一個兩
14、因子方差分析的數(shù)據(jù)結(jié)構(gòu)表里,共有個總體,在本題中,。下表給出因子所對應(yīng)的各個指標:指標外觀澄清度外觀色調(diào)香氣純正度香氣濃度香氣質(zhì)量口感純正度口感濃度口感持久性口感質(zhì)量整體得分給出雙因子可重復方差分析的原假設(shè)和備擇假設(shè): 當原假設(shè)為真時,說明兩組評酒員的評價結(jié)果不存在顯著性差異,反之稱兩組評酒員的評價結(jié)果存在著顯著性影響因素。當原假設(shè)為真時,說明選取的各個指標對評價結(jié)果沒有顯著性影響,在本題中,顯然原假設(shè)是不成立的,后續(xù)的檢驗將證明這點。2.兩因子方差分析的方差分解。(1)誤差平方和。每一個觀察值與總平均值之間的離差平方和稱為誤差平方和,記作=其中,稱為總均值。 (2)行組間誤差。雙因子誤差平方
15、和分解的第一部分,稱為行組間誤差,記作=(3)列組間誤差。雙因子誤差平方和分解的第二部分,稱為列組間誤差,記作=(4)組內(nèi)誤差。雙因子誤差平方和分解的第三部分,稱為組內(nèi)誤差,記作=行組間誤差衡量的是行因子不同水平之間的差異,列組間誤差衡量的是列因子不同水平之間的差異。它們的誤差值中既包含隨即誤差也包含了因子影響的系統(tǒng)誤差。所以判斷行(列)因子是否有顯著性影響,主要考察行(列)組間誤差和組內(nèi)誤差之間的差異大小。如果行(列)組間誤差和組內(nèi)誤差很接近,就認為行(列)因子無顯著性影響。反之,認為行(列)因子有顯著性影響。兩因子方差分析的檢驗統(tǒng)計量。其中。根據(jù)單因素方差分析推導,有行組間誤差服從自由度為
16、的分布列組間誤差服從自由度為的分布剩余的列組服從自由度為的分布則兩因素方差分析的檢驗統(tǒng)計量為如下兩個:(1) 行檢驗統(tǒng)計量。(2) 列檢驗統(tǒng)計量。雙因子可重復方差分析的結(jié)果判定當顯著性水平為時,如果 ,拒絕,說明兩組評酒員的評價結(jié)果存在顯著性差異;等價的值檢驗是,當值<時,拒絕原假設(shè);綜合來講,當,或值< 時,拒絕原假設(shè)。0-1數(shù)據(jù)分析在給定條件下,對于有個樣品酒來說(紅葡萄酒,白葡萄酒),定義函數(shù): (1)其中為每個樣品酒的值。給定置信度: (2)對個樣品酒的雙因子可重復方差檢驗后,得出值,則認為在置信水平下,兩組評酒員的評價結(jié)果存在著顯著性差異。Alpha模型進行可靠性分析克倫
17、巴赫系數(shù):測度內(nèi)部一致性的一個指標, 與皮爾遜系數(shù)都是一樣的范圍在01 之間,如果為負值則表明表中某些項目的內(nèi)容是其他一些項目的反面;越接近于1,則量表中項目的內(nèi)部一致性越是高,可信度越大。根據(jù)量表中的項目數(shù)和各項之間的相關(guān)系數(shù)計算得出當量表中項目增加時,值也會增大;同時,項目之間的相關(guān)系數(shù)較高時,也會比較大。這里的是指各項與其他各項之和計算相關(guān)系數(shù)的平均值。模型求解:雙因子可重復方差分析模型檢驗利用Matlab的函數(shù)對已經(jīng)預(yù)處理的數(shù)據(jù)進行雙因子可重復方差分析,可以得到每個樣品酒的檢驗結(jié)果,列舉兩個檢驗結(jié)果如下所示:提取每個樣品酒的所對應(yīng)值,然后結(jié)合公式(1)、公式(2)進行0-1分析,得到紅
18、、白葡萄酒的各個樣品酒的如下:圖表 3模型檢驗結(jié)果紅葡萄酒值以及值,得到0.18971 0.00001 0.00040 0.00212 0.16314 0.00138 0.00486 0.00334 0.02476 0.00000 0.00002 0.00011 0.36479 0.21870 011101111111000.00046 0.80100 0.00021 0.56414 0.17544 1.00000 0.00002 0.04686 0.01131 0.00017 0.00086 0.00112 0.00045 1010001111111白葡萄酒值以及值,得到0.00103 0.
19、00001 0.10777 0.31115 0.50613 0.01060 0.34940 0.67936 0.00329 0.00460 0.00008 0.08585 0.00011 0.20310 110001001110100.01714 0.03333 0.01381 0.19476 0.00339 0.44078 0.00034 0.00005 0.68334 0.46710 0.00031 0.16632 0.13648 0.00001 11101011001001模型結(jié)果分析分析圖標3的結(jié)果,可以知道,對于紅葡萄酒來說,對27個葡萄酒樣品評分檢驗中,有70.3%的評價結(jié)果中,兩
20、組評酒員的評價結(jié)果存在著顯著性差異(置信水平為95%)。對于白葡萄酒的28個葡萄樣品評分的檢驗,只有53%的評價結(jié)果中,兩組評酒員的評價結(jié)果存在顯著性檢驗(置信水平為95%)。這樣的結(jié)果,符合之前問題分析中,各個組隊樣品酒的評分均值差異圖。即:兩組評酒員對紅葡萄的評分結(jié)果更具有顯著性差異,而對于白葡萄酒的評分,兩組評酒員的評價差異性較不明顯。Alpha模型的可靠性分析1. 利用SPSS19.0進行可靠性統(tǒng)計量對紅葡萄酒的兩組品酒員評分的分析第一組紅葡萄酒案例處理匯總第二組紅葡萄酒案例處理匯總%案例有效26899.3案例有效270100.0已排除2.7已排除0.0總計270100.0總計2701
21、00.0第一組紅葡萄酒可靠性統(tǒng)計量第二組紅葡萄酒可靠性統(tǒng)計量基于標準化項的 項數(shù)基于標準化項的 項數(shù).874.90610.750.78610若將某一項目從量表中剔除,則量表的平均得分、方差(每個項目得分與剩余各項目得分間的相關(guān)系數(shù)、以該項目為自變量所有其他項目為應(yīng)變量建立回歸方程的值以及值將會改變。有表知第一組數(shù)據(jù)中剔除了兩項,增加到0.874,第一組評酒員紅葡萄酒的,組2尚有35%的內(nèi)容未曾涉及,故信度不高。表格 2第一組紅葡萄酒平方和均方人員之間人員內(nèi)部 項之間殘差總計總均值 = 7.314947.21831938.4945623.50637562.00042509.21826792403
22、2412267918.5293548.7222.34015.57315.8681516.417.000類內(nèi)相關(guān)性95% 置信區(qū)間使用真值 0 的 F 檢驗下限上限值單個測量.409b.362.4607.9182672403.000平均測量.874c.850.8957.9182672403.000表格 3第二組紅葡萄酒平方和均方人員之間1232.54434017.0402778.26036795.30038027.84426992421243026994.5823779.6711.14815.14214.0903293.639.000人員內(nèi)部 項之間殘差總計總均值 = 7.05類內(nèi)相關(guān)性95%
23、置信區(qū)間使用真值 0 的 F 檢驗下限上限值單個測量.230.191.2763.9932692421.000平均測量.750.703.7923.9932692421.000分析比較兩者的F檢驗表明, =516.417<=3293.639,組2的顯著性更強, 而、均小于0.01,表示兩組該量表的重復度量效果良好。綜合分析結(jié)果表明,組一的評酒員可信度更高。(2)可靠性統(tǒng)計量對白葡萄酒的兩組品酒員評分進行分析 同樣利用SPSS可靠性分析,建立Alpha模型對白葡萄酒的品酒員評分數(shù)據(jù)進行檢驗,發(fā)現(xiàn)不同種類的酒,因其釀造,成分的不同,品酒員對葡萄口感,質(zhì)量的分析評價上有差異,得出第一組品酒員白葡萄
24、酒的、,組2的顯著性更強,、均小于0.01 表示兩組該量表的重復度量效果良好。綜合分析結(jié)果表明,白葡萄酒組二的品酒員可信度更高。5.2. 問題二的建模與求解模型建立:聚類分析及歐式距離對樣品和指標(變量)進行分類主要采用聚類分析法,而求取樣品以及類之間的距離有多種方法,其中主要使用歐式距離和最短距離法。(1) 數(shù)據(jù)標準化由于所選數(shù)據(jù)的量綱和數(shù)值大小都不一致,數(shù)值的變化范圍也不同,因此必須首先對所選數(shù)據(jù)進行標準化處理,如果有個樣本,個樣本有個指標,則每個變量可表示為,均值標準方差則標準化后 (2)聚類距離:對樣品進行聚類時,“靠近”往往由某種距離來刻畫。若每個樣品有個指標,故每個樣品可以看成維空
25、間中的一個點, 個樣品就組成維空間中的個點,樣品與指標構(gòu)成一個矩陣,此時就可以用距離來度量樣品之間的接近程度。令表示第個樣品的第個指標, 表示第個樣品與第個樣品之間的距離,最常見最直觀的計算距離的方法是:明考斯基距離()當時, 即為絕對距離當時, 即為歐氏距離當時 稱為切比雪夫距離。當各變量的測量值相差懸殊時,為了計算的準確性,需先將數(shù)據(jù)標準化,然后用標準化后的數(shù)據(jù)進行計算。系統(tǒng)聚類;,將個樣品各自看成一類,然后規(guī)定樣品之間的距離和類與類之間的距離。開始,因每個樣品自成一類,類與類之間的距離與樣品之間的距離是相等的,選擇距離最小的一對并成一個新類,計算新類與其他類的距離,再將距離最近的兩類合并
26、,這樣每次少一類,直至所有的樣品都成一類為止,最終完成養(yǎng)分的分類。計算類與類之間的距離主要有:(1)最短距離法:設(shè)、分別為一類,則最短距離的計算公式為:此時將類與類合并為類,則任意的類和的距離公式為依次下去,最終完成對樣品的分類。(2)最長距離法將類與類合并為類,則任意的類和的距離公式為(3)類平均法將類與類合并為類,則任意的類和的距離公式為(4)重心法將類與類合并為類,則任意的類和的距離公式為模型求解:根據(jù)歐式距離對釀酒葡萄分類(1)對紅葡萄酒進行分類 將附件中的組一評酒員評價標準,算出各項所占權(quán)重并加和,最終求得十位品酒員對每個葡萄酒樣品的平均值,作為27種酒樣品的綜合評價指標,并用葡萄酒
27、的綜合指標以及釀酒葡萄的理化指標形成一個31列28行的原始資料陣,將其數(shù)據(jù)標準化,通過spss進行聚類分析,得到酒樣品的八個類別,并列出每個酒樣品所對應(yīng)的綜合指標,得出下表以及聚類分析樹狀圖 圖表3:不同來源紅葡萄酒聚類分析第一類酒樣品12186715綜合評價指標6.9847.6238.9858.8977.309第二類酒樣合評價指標9.3959.7538.459.3489.1359.5291724520269.9019.7069.0719.8179.139第三類酒樣品25綜合評價指標8.571第四類酒樣品814綜合評價指標9.0039.204第五類酒樣品17.79第六
28、類酒樣品3212923綜合評價指標10.0749.66910.20110.13810.716第七類酒樣品10綜合評價指標9.204第八類酒樣品11綜合評價指標8.662表格 4 葡萄酒的分類與綜合評價指標觀察表中數(shù)據(jù),不難發(fā)現(xiàn)紅葡萄酒樣品1、10、11、25單獨化為一類,而不與綜合指標相近的酒品類為一組,根據(jù)這四種葡萄酒的理化指標以及釀酒葡萄的成分對綜合指標相近的組類進行分析比較,得出酒品1的花色苷含量高達408.028 mg/100g鮮重,單寧22.019 mol/kg、總酚23.604、總黃酮9.480mmol/kg、順式白藜蘆醇3.195mg/kg均高于第一類酒樣品理化指標的數(shù)據(jù)。紅葡萄
29、酒樣品10、11、花色苷含量較低,白藜蘆醇含量較高,樣品25氨基酸含量較低,果穗質(zhì)量含量較高,均與指標相近的類別的理化指標數(shù)據(jù)有較大差異。據(jù)資料分析得,新酒主要以花色苷為主色調(diào),陳酒種單寧起主導作用。有單寧存在,花色苷將減少。氨基酸的含量與人體血液中的氨基酸有著密切聯(lián)系,與脯氨酸成負相關(guān),但與纈氨酸成正相關(guān)。這些含量的高低會影響葡萄酒口感、色澤、純正度,從而評酒員對酒的分數(shù)存在差異。因此,聚類分析結(jié)果在對各項理化指標進行數(shù)據(jù)處理時,達不到組間距離。結(jié)合綜合指標的高低以及聚類分析的結(jié)果,以及每一種釀酒葡萄所對應(yīng)的紅葡萄酒樣品,將釀酒葡萄分為A、B、C、D。分別代表優(yōu)質(zhì)、良好、中等、差四個等級:如
30、下表A葡萄樣品3212923綜合評價指標10.0749.66910.20110.13810.716B葡萄樣合評價指標9.3959.7538.459.3489.1359.5291724520269.9019.7069.0719.8179.139C葡萄樣品258141110綜合評價指標8.5719.0039.2048.6629.204D葡萄樣品121867151綜合評價指標6.9847.6238.9858.8977.3097.79表格 5 釀酒葡萄(紅)的等級劃分 (1)對釀酒葡萄(白)進行分類 由問題一知,第二組評酒員對白葡萄酒評價可信度更高,用聚類分析的歐式距離可分出
31、不同組類,根據(jù)綜合指標的高低劃分出A、B、C、D(分別代表優(yōu)質(zhì)、良好、中等、差)四個等級:其中葡萄樣品氨基酸總量5022.14mg/100g、酒石酸11.790g/L、不含檸檬酸、葡萄花色苷含量較低、葡萄褐變度、黃酮醇含量均遠遠高于同組水平、因此這3種釀酒葡萄的理化指標與其綜合指標相近的組類有一定的差異而達不到組間距離,單獨分為一組。表格 6 釀酒葡萄(白)的等級劃分A葡萄樣品1722綜合指標10.1489.915B葡萄樣品618715113綜合指標9.4929.6829.2379.8029.5549.7859.331C葡萄樣品52092841421綜合指標10.2369.58210.029.
32、9579.6959.659.971葡萄樣品23262121024D綜合指標9.5999.2999.5039.09210.0589.591葡萄樣品8111916綜合指標9.0258.9429.60410.028.5039.35.3. 問題三的建模與求解模型建立相關(guān)性分析相關(guān)分析是描述兩個變量間關(guān)系的密切程度,主要由相關(guān)系數(shù)值表示,當相關(guān)系數(shù)的絕對值越接近于1,則表示兩個變量間的相關(guān)性越顯著。雙變量系數(shù)測量的主要指標有卡方類測量、Spearman相關(guān)系數(shù)、pearson相關(guān)系數(shù)等,由于釀酒葡萄和葡萄酒的數(shù)據(jù)為定距數(shù)據(jù),則在進行兩者間的相關(guān)性檢驗時用pearson相關(guān)系數(shù)來判斷,其公式為:Pears
33、on簡單相關(guān)系數(shù)檢驗統(tǒng)計量為:其中統(tǒng)計量服從個自由度的分布?;貧w分析多元回歸分析是研究多個變量之間關(guān)系的回歸分析方法,確定變量之間數(shù)量的可能形式,并用數(shù)學模型表示如下:其中為截距項,為偏回歸系數(shù),為殘差項。多元回歸方程及其顯著性檢驗建立模型,要對模型進行擬合度檢驗,回歸方程的顯著性檢驗就是檢驗樣本回歸方程的變量的線性關(guān)系是否顯著,即能否根據(jù)樣本來推斷總體回歸方程中的多個回歸系數(shù)中至少有一個不等于0,主要是說明樣本回歸方程的顯著性。檢驗的方法用方差分析,這時因變量的總體變異系本分解為回歸平方和與誤差平方和,即表示為:其中此外可以用檢驗對整個回歸進行顯著性檢驗,即與所考慮的k個變量自變量是否有顯著
34、性線性關(guān)系,即公式為:檢驗的時候分別與的臨界值進行比較,若,認為回歸高度顯著 或稱在0.01水平上顯著;。認為回歸在0.05水平上顯著;則稱回歸在0.01水平上顯著。若,則回歸不顯著,此時與這個自變量的線性關(guān)系就不確切。表格 7 多元線性回歸方差分析表變差來源平方和自由度均方回歸剩余總和模型求解葡萄酒的花色苷與釀酒葡萄個別指標的相關(guān)性Correlations花色苷蘋果酸褐變度DPPH自由基總酚單寧葡萄總黃酮黃酮醇果梗比J1花色苷Pearson Correlation1.633*.696*.655*.728*.688*.566*.352.477*.923*Sig. (2-tailed).000.
35、000.000.000.000.002.071.012.000N27272727272727272727蘋果酸Pearson Correlation.633*1.644*.052.193.235.052.056.230.693*Sig. (2-tailed).000.000.795.334.237.797.782.249.000N27272727272727272727褐變度Pearson Correlation.696*.644*1.295.361.473*.236.421*.498*.767*Sig. (2-tailed).000.000.135.064.013.237.029.008.0
36、00N27272727272727272727DPPH自由基Pearson Correlation.655*.052.2951.857*.645*.836*.428*.501*.567*Sig. (2-tailed).000.795.135.000.000.000.026.008.002N27272727272727272727總酚Pearson Correlation.728*.193.361.857*1.755*.895*.346.391*.613*Sig. (2-tailed).000.334.064.000.000.000.077.044.001N2727272727272727272
37、7單寧Pearson Correlation.688*.235.473*.645*.755*1.688*.385*.350.661*Sig. (2-tailed).000.237.013.000.000.000.047.074.000N27272727272727272727葡萄總黃酮Pearson Correlation.566*.052.236.836*.895*.688*1.263.269.441*Sig. (2-tailed).002.797.237.000.000.000.186.175.021N27272727272727272727黃酮醇Pearson Correlation.3
38、52.056.421*.428*.346.385*.2631.633*.408*Sig. (2-tailed).071.782.029.026.077.047.186.000.035N27272727272727272727果梗比Pearson Correlation.477*.230.498*.501*.391*.350.269.633*1.502*Sig. (2-tailed).012.249.008.008.044.074.175.000.008N27272727272727272727花色苷Pearson Correlation.923*.693*.767*.567*.613*.661
39、*.441*.408*.502*1Sig. (2-tailed).000.000.000.002.001.000.009.035.008N27272727272727272727*. Correlation is significant at the 0.01 level (2-tailed).*. Correlation is significant at the 0.05 level (2-tailed).由表可知,以上各個變量與葡萄酒中的花色苷的p都小于0.01,則可認為在0.01的顯著性水平下,以上各個變量與葡萄酒中的花色苷都顯著相關(guān),可做回歸分析觀察葡萄酒中的花色苷與釀酒葡萄中的果梗
40、比, 蘋果酸, 葡萄總黃酮, 多酚氧化酶活力, 黃酮醇, 單寧, 褐變度, DPPH自由基, 花色苷, 總酚,輸出結(jié)果如下:Model SummarybModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.956a.913.85986.424502.063a. Predictors: (Constant), 果梗比, 蘋果酸, 葡萄總黃酮, 多酚氧化酶活力, 黃酮醇, 單寧, 褐變度, DPPH自由基, 花色苷, 總酚b. Dependent Variable: J1又表可知調(diào)整的判定系數(shù)為0.859,可
41、認為方程的擬合性比較高,即被解釋變量被模型解釋的部分較多,為能解釋的部分較少。ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression1256309.16710125630.91716.820.000aResidual119507.118167469.195Total1375816.28526a. Predictors: (Constant), 果梗比, 蘋果酸, 葡萄總黃酮, 多酚氧化酶活力, 黃酮醇, 單寧, 褐變度, DPPH自由基, 花色苷, 總酚b. Dependent Variable: J1一依據(jù)該表可進行回歸方程的顯著性檢驗,
42、由表我們可以知道F檢驗統(tǒng)計量和P值分別為16.820、0,在0.01的顯著性水平下,由于概率P值小于顯著性水平0.01,則拒絕原假設(shè),認為被解釋變量個解釋變量間存在顯著的線性關(guān)系,可建立線性回歸模型。由此在對方程中個系數(shù)進行檢驗,結(jié)果如下:多元線性回歸模型的求解根據(jù)相關(guān)性的分析,葡萄酒中的花色苷與釀酒葡萄中的果梗比, 蘋果酸, 葡萄總黃酮, 多酚氧化酶活力, 黃酮醇, 單寧, 褐變度, DPPH自由基, 花色苷, 總酚中相關(guān)性較大的幾項,用SPSS 分析多元線性回歸,得出線性關(guān)系的擬合方程。輸入移去的變量b模型輸入的變量移去的變量方法1總酚, 多酚氧化酶活力, 蘋果酸, 果梗比, 黃酮醇, D
43、PPH自由基, 褐變度, 花色苷, 單寧, 葡萄總黃酮.輸入2.多酚氧化酶活力向后(準則: F-to-remove >= .100 的概率)。3.褐變度向后(準則: F-to-remove >= .100 的概率)。4.花色苷向后(準則: F-to-remove >= .100 的概率)。5.黃酮醇向后(準則: F-to-remove >= .100 的概率)。表格 8 葡萄酒花色苷與葡萄理化指標的多元線性回歸輸入/移出變量由于當P<0.01時,因變量與變量之間的相關(guān)性顯著,結(jié)合向后推移法,剔除了多酚氧化酶活力、褐變度、花色苷、黃酮醇、篩選出最吻合的變量。系數(shù)a模
44、型非標準化系數(shù)標準系數(shù)tSig.B標準 誤差試用版5(常量)6.234010.30果梗比-10.13-0.005-4.701E+130蘋果酸-1.670.65-0.017-1.0759E+140葡萄總黃酮30.381.0144.04267E+150單寧0.890.710.422.70DPPH自由基0.720.680.32-10.90總酚0.130.320.068-6.60表格9葡萄酒花色苷與葡萄理化指標的多元線性回歸變量篩選結(jié)果及系數(shù)模型匯總模型RR 方調(diào)整 R 方標準 估計的誤差1.874.890.579.35802.874.829.513.34943.860.778.491.32034.8
45、45.755.467.31185.825.715.449.3080表格 10葡萄酒花色苷與葡萄理化指標的多元線性回歸R方及標準估計的誤差根據(jù)R方值的大小,可判斷出多元線性回歸方程的契合度,觀察模型后退5次得到R方值與標準估計的誤差, =0.715,可知方程的吻合性較高。最后得到葡萄酒花色苷與葡萄理化指標的線性回歸方程為 (其中、分別代表葡萄果梗比、蘋果酸、葡萄總黃酮、單寧、DPPH自由基、總酚含量、葡萄酒花色苷) 以上方程可代表,每1單位的果梗比、蘋果酸、葡萄總黃酮、單寧、DPPH自由基、總酚含量的變化所引起葡萄酒花色苷的變化。從而反映了釀酒葡萄與葡萄酒理化指標的聯(lián)系。5.4. 問題四的建模與
46、求解模型建立首先,尋求如何應(yīng)用葡萄酒的理化指標對葡萄酒質(zhì)量進行綜合評價,然后結(jié)合問題三中,釀酒葡萄與葡萄酒之間的聯(lián)系,我們便可以從釀酒葡萄的理化指標進行對葡萄酒質(zhì)量的客觀評價。(1) 變量間的相關(guān)性及系數(shù)法。一般|r|>0.95,存在顯著性相關(guān);|r|<0.3關(guān)系極弱,認為不相關(guān)。0.5|r|0.8中度相關(guān)、0.3|r|0.5認為低度相關(guān)。 系數(shù)法:對定距變量的數(shù)據(jù)進行計算。公式為 (其中為相關(guān)系數(shù);、分別是變量x、y的均值;、分別是變量、的第個觀測值) 使用SPSS19.0,對葡萄酒的理化指標之間相似或不相似測量,進行距離相關(guān)分析以考察相互接近程度。首先設(shè),其中,分別為外觀、香氣
47、、口感和整體評價的評價指標綜合得分函數(shù),令、分別表示為葡萄酒的理化指標,通過SPSS 19.0作分析兩者之間的相關(guān)性,選取相關(guān)性較大的個指標(210)作為的相關(guān)性指標建立回歸方程如下:(2) 多元線性回歸模型的建立若因變量與解釋變量,具有線性關(guān)系,它們之間的線性回歸模型可表示為: 其中為隨機擾動項觀測值。對于第個觀測值:即:也即:假定:(3) 擬合方程的顯著性檢驗方差分析表:離差名稱平方和自由度均方差回歸RSSKRSS/k(k個解釋變量)殘差ESSn-k-1ESS/n-k-1總離差TSSn-1檢驗:與解釋變量之間的線性關(guān)系是否顯著。1. 2.3. 查表得: 4. 若 ,拒絕,回歸方程顯著 ,接
48、受,回歸方程不顯著(4) 建立葡萄酒理化指標與葡萄酒質(zhì)量之間的關(guān)系通過評價指標知道,外觀、香氣、口感和整體評價在整個葡萄酒的評價中所占權(quán)重是不同的,各個權(quán)重定義為:、,我們定義葡萄酒的總評分值的函數(shù)為:通過對的比較,我們便可以客觀地從一種葡萄酒的含量來判斷葡萄酒的質(zhì)量了。由問題三,我們已經(jīng)知道,釀酒葡萄與葡萄酒的理化指標之間存在著聯(lián)系。于是,我們通過釀酒葡萄與葡萄酒的聯(lián)系,然后通過對葡萄酒成分進行評分,就得到了釀酒葡萄與葡萄質(zhì)量之間的聯(lián)系了。模型求解 變量間的相關(guān)性及系數(shù)法的求解首先,“近似矩陣”表格給出的是各變量之間的相似矩陣,圖中以線框標注了相關(guān)系數(shù)較大的幾對變量。分析外觀與紅葡萄酒成分的相關(guān)性得到圖表 5外觀分析與紅葡萄酒理化指標的相關(guān)系矩陣從上表可以看出外觀分析與花色苷、單寧、總酚、總黃酮、白藜蘆醇、DPPH半抑制體積、L*(D65)、a*(D65)、H平均、C平均含量相關(guān)系較大,與其余的成分相關(guān)性很弱。圖表 6香氣分析與葡萄酒理化指標的相關(guān)系矩陣從香氣分析與紅葡萄酒理化指標的相關(guān)系分析,得出與單寧、總酚、總黃酮、白藜蘆醇
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 麗江古城客棧出租合同范例
- 不銹鋼瓶采購合同標準文本
- 公司擔保借款合同標準文本
- 新學期目標規(guī)劃簡短6篇
- 企業(yè)設(shè)備維修合同標準文本
- 肝功能衰竭的健康宣教
- 公司董事會會議通知【2篇】
- 公司購買紙張合同標準文本
- 公司與醫(yī)院合同標準文本
- 打造音樂活動品牌的突破性戰(zhàn)略計劃
- 2025年江蘇省職業(yè)院校技能大賽高職組(智慧物流)參考試題庫資料及答案
- 上海市松江區(qū)屆2024-2025學年高三上學期一模考試歷史試題(解析版)
- 船舶概論習題及答案
- 2024年北京電子科技職業(yè)學院高職單招語文歷年參考題庫含答案解析
- 臨床醫(yī)學個人能力提升
- 2025年焦慮癥健康教育課件:創(chuàng)新與實踐相結(jié)合
- 北師大版八年級下學期期末數(shù)學練習題及答案
- 定額〔2025〕2號文-關(guān)于發(fā)布2020版電網(wǎng)技術(shù)改造及檢修工程概預(yù)算定額2024年下半年價格
- 《腦出血的外科治療》課件
- 《普通高中體育與健康》(水平五)體能模塊教學計劃
- 職業(yè)生涯規(guī)劃-體驗式學習知到智慧樹章節(jié)測試答案2024年秋華僑大學
評論
0/150
提交評論