葡萄酒的評價 (2)
《葡萄酒的評價 (2)》由會員分享,可在線閱讀,更多相關《葡萄酒的評價 (2)(19頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、題目:葡萄酒的評價 【摘要】 葡萄酒是世界上三大酒種之一,葡萄酒的準確評價和理化指標的評測對我國葡萄酒產(chǎn)業(yè)崛起有著重要意義,本文針對葡萄酒的評價問題進行了建模、求解和相關分析。 對于問題一,首先將原始評分數(shù)據(jù)提取整合為兩個組分別對27種紅葡萄酒樣品和28種白葡萄酒樣品的綜合平均評分,然后利用皮爾遜檢驗判斷出評分結(jié)果無法用正態(tài)分布進行擬合,因而采取非參數(shù)假設檢驗中的Wilcoxon符號秩檢驗方法分別對紅葡萄酒樣品兩組評分結(jié)果、白葡萄酒樣品兩組評分結(jié)果進行顯著性分析,最終得出當α≥0.0118時,紅葡萄酒樣品的兩組評分結(jié)果具有顯著性差異;當α≥0.0376時,白葡萄酒樣品的兩組評分結(jié)果具有顯
2、著性差異。通常情況下選取顯著性水平α=0.05,即兩組評酒員對葡萄酒樣品的評價結(jié)果具有顯著性差異。將兩組評酒員對27種紅葡萄酒、28種白葡萄酒的評分從高到低排序,運用歐式距離判別法求出評分排序與平均分排序的距離,距離越小說明評分越接近平均值,一致性越好,最終通過兩組距離比較確定第一組評分結(jié)果更可信。 對于問題二,需要根據(jù)釀酒葡萄的理化指標和葡萄酒的質(zhì)量對釀酒葡萄進行分級,首先利用Excel軟件的統(tǒng)計工具箱將釀酒葡萄的各項理化指標分別與對應葡萄酒的質(zhì)量評分作相關性分析,得到釀酒葡萄的蛋白質(zhì)含量、DPPH自由基含量、總酚含量、葡萄總黃酮含量和PH值等5個相關性顯著的指標,然后利用加權Topsis
3、法對這5個指標值進行分析,求出各種釀酒葡萄與最優(yōu)方案的接近程度Ci,將Ci劃分為5段,從而可將對應的釀酒葡萄分為5級。 對于問題三,需要分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系,即是要分析兩組隨機變量之間的相關性關系,可以考慮運用多元統(tǒng)計分析中Hotelling典型相關分析法進行求解。首先在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關系數(shù)。然后選取和最初挑選的這對線性組合不相關的線性組合,使其配對,并選取相關系數(shù)最大的一對,如此繼續(xù)下去,直到兩組變量之間的相關性被提取完畢為止,從而最終求得釀酒葡萄與葡萄酒的理化指標之間的相關關系。 對于問題四,需要分析釀酒葡萄和葡萄酒
4、的理化指標對葡萄酒質(zhì)量的影響,因此可利用灰色關聯(lián)度分析的方法進行求解,分別求出釀酒葡萄的理化指標與葡萄酒質(zhì)量的關聯(lián)度、葡萄酒理化指標與其質(zhì)量的關聯(lián)度,通過關聯(lián)度值的大小,即可看出釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響大小。但影響葡萄酒質(zhì)量的因素還有釀造工藝、設備等外部條件,且所得關聯(lián)度最大只有0.7左右,故不能完全用葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)量。 關鍵詞:Wilcoxon符號秩檢驗 Topsis法 典型相關分析 灰色關聯(lián)度 葡萄酒質(zhì)量評價 1.問題重述 1.1問題背景 葡萄酒的生產(chǎn)有著非常久遠的歷史,可上溯至幾千年前,它是一種世界通暢
5、 性酒種,有著廣泛交流的基礎,現(xiàn)已發(fā)展成最主要的酒種之一。葡萄酒的感官分析又叫品酒、評酒,是指評酒員通過眼、鼻、口等感覺器官對葡萄酒的外觀、香氣、滋味及典型性等感官特性進行分析評定的一種分析方法。一方面,評酒員必須要拋開個人的喜好,排除時間、地點、環(huán)境和情緒等的影響,像一臺精密的儀器一樣進行感官分析;另一方面,因為葡萄酒的復雜多樣及變化性,評酒員又必須充分發(fā)揮主觀能動性,將獲得的感覺與大腦中貯存的感官質(zhì)量標準進行比較分析。只有兼顧以上兩個方面,才能保證結(jié)果的精確性。同時各個評酒員之間還必須保證分析結(jié)果的一致性。一致性和精確性是正確性的保證[1]。 確定葡萄酒質(zhì)量時一般是通過聘請一批有資質(zhì)的
6、評酒員進行品評。每個評酒員在對葡萄酒進行品嘗后對其分類指標打分,然后求和得到其總分,從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質(zhì)量。 1.2待解決的問題 根據(jù)題目所提供的某一年份一些葡萄酒的評價結(jié)果和該年份這些葡萄酒的和釀酒葡萄的成分數(shù)據(jù),需建立數(shù)學模型完成下列問題: (1)分析兩組評酒員對葡萄酒樣品的評價結(jié)果有無顯著性差異,并判斷哪一組結(jié)果更為可信; (2)根據(jù)釀酒葡萄的理化指標和葡萄酒的質(zhì)量將葡萄酒樣品對應的釀酒葡萄進行合理分級; (3)建立數(shù)學模型,分析釀酒葡萄與葡萄酒的理化指標之間
7、有何聯(lián)系; (4)分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質(zhì)量。 2模型假設與符號系統(tǒng) 2.1模型假設 針對本問題,作出以下合理假設: (1)題目提供的數(shù)據(jù)準確可靠; (2)每位評酒員的評分在其組內(nèi)同等重要; (3)葡萄酒和釀酒葡萄的理化指標的好壞根據(jù)中國標準網(wǎng)上查閱到的國標或地方標準來判斷; 2.2符號系統(tǒng) 符號 含義 H0 Wilcoxon符號秩檢驗中的原假設 H1 Wilcoxon符號秩檢驗中的備擇假設 n
8、 樣本數(shù)目 M1 第一組對葡萄酒的綜合平均評分結(jié)果 M2 第二組對葡萄酒的綜合平均評分結(jié)果 D 同種酒樣品兩組評分結(jié)果的差值 R 絕對差值|D|的秩值 R+,R- 正、負差值的兩個部分的秩值 T+,T- 符號秩和 S Wilcoxon符號秩統(tǒng)計量 T 符號秩和統(tǒng)計量 σT2 統(tǒng)計量T的方差 z 檢驗統(tǒng)計量 p
9、 臨界顯著性水平 a 顯著性水平 d 總和歐式距離 r 相關系數(shù) Z Topsis法中轉(zhuǎn)換指標歸一化矩陣 Z+ 歸一化矩陣Z中最優(yōu)方案 Z- 歸一化矩陣Z中最劣方案 D+,D- 評價對象與Z+和Z-的距離 W 理化指標的權重 Ci 評價對象與最優(yōu)方案的接近程度 3問題一的建模與求解 3.1問題一的分析 問題一需要分析兩組評酒員的評價
10、結(jié)果有無顯著性差異,可將原始數(shù)據(jù)提煉為四組數(shù)據(jù),分別為第一、二組對27種紅葡萄酒樣品的總體評價結(jié)果,對28種白葡萄酒樣品的總體評價結(jié)果。然后分別針對紅葡萄酒樣品的兩組評價和白葡萄酒樣品的兩組評價作皮爾遜x2檢驗,驗證其是否能較好地服從正態(tài)總體,若能,則可通過方差分析判斷兩組評酒員的評價結(jié)果有無顯著性差異;若不能,則可通過非參數(shù)假設檢驗中的Wilcoxon符號秩檢驗進行分析。對哪一組結(jié)果更為可信的判斷,則可分析每組的10位評酒員對同一樣品酒的評價結(jié)果趨于一致性和穩(wěn)定性的程度,從而進行判定。 3.2數(shù)據(jù)預處理 原始數(shù)據(jù)中,第一組、第二組各有10名評酒員對27種紅葡萄酒樣品和28中白葡萄
11、酒樣品分別作了評價,故將每位評酒員對每種酒樣品的各項評分求和得到總分,然后將同組中每種酒樣品的10個總分取平均值,從而得到第一組對27種紅葡萄酒樣品、28種白葡萄酒樣品的綜合平均評分,和第二組對27種紅葡萄酒樣品、28種白葡萄酒樣品的綜合平均評分,如下表所示: 表3.2-1 兩組評酒員對酒樣品的綜合平均評分 紅葡萄酒 白葡萄酒 酒樣品 第一組評分 第二組評分 酒樣品 第一組評分 第二組評分 1 62.7 68.1 1 82 77.9 2
12、80.3 74 2 74.2 75.8 3 80.4 74.6 3 85.3 75.6 4 68.6 71.2 4 79.4 76.9 5 73.3 72.1 5 71 81.5 6 72.2 66.3 6 68.4 75.5 7 71.5
13、 65.3 7 77.5 74.2 8 72.3 66 8 71.4 72.3 9 81.5 78.2 9 72.9 80.4 10 74.2 69.1 10 74.3 79.8 11 70.1 61.6 11 72.3 71.4 12 53.9
14、 68.3 12 63.3 72.4 13 74.6 68.8 13 65.9 73.9 14 73 72.6 14 72 77.1 15 58.7 65.7 15 72.4 78.4 16 74.9 69.9 16 74 67.3 17 79.3 74
15、.5 17 78.8 80.3 18 59.9 65.4 18 73.1 76.7 19 78.6 72.6 19 72.2 76.4 20 78.6 75.8 20 77.8 76.6 21 77.1 72.2 21 76.4 79.2 22 77.2 71
16、.6 22 71 79.4 23 85.6 77.1 23 75.9 77.4 24 78 71.5 24 73.3 76.1 25 69.2 68.2 25 77.1 79.5 26 73.8 72 26 81.3 74.3 27 73 71.5
17、 27 64.8 77 28 81.3 79.6 3.3模型的建立與求解 3.3.1顯著性分析 分別針對紅葡萄酒的兩組評分結(jié)果和白葡萄酒的兩組評分結(jié)果,進行正態(tài)分布擬合后,利用皮爾遜檢驗發(fā)現(xiàn),兩個正態(tài)分布擬合效果在顯著性水平為0.05和0.1時并不佳,因此判斷兩類葡萄酒的評分結(jié)果并不服從正態(tài)分布。故需采用非參數(shù)假設檢驗的方法來分析兩組評分結(jié)果有無顯著性差異。 下面采用Wilcoxon符號秩檢驗的方法作顯著性分析,以紅葡萄酒為例進行
18、說明。為了比較紅葡萄酒樣品的兩組評分結(jié)果是否有顯著性差異,作出假設檢驗為: H0:兩組評分結(jié)果沒有顯著性差異; H1:兩組評分結(jié)果有顯著性差異。 使用Wilcoxon符號秩檢驗方法的主要步驟見表3.3.1—1中每列中的計算方法和過程,先求出每對數(shù)據(jù)的差值D,按差值絕對值|D|由小到大排列并給秩R,從秩1開始到秩27,樣本數(shù)目n=27,在給秩時,遇到相等的|D|時,使用平均秩,如表中酒樣品3和酒樣品13具有相同的絕對差值5.8,因而平分秩16和秩17,各為秩16.5。當絕對差值的秩值R給出后,將R分成正、負差值的兩個部分秩值R+和R-,最后求符號秩和 由于樣本數(shù)目為27個,和的最小可能值
19、為0,而最大可能值為1+2+…+n=n(n+1)/2。顯然,當有那么,符號秩的平均值為n(n+1)/4,構造Wilcoxon符號秩統(tǒng)計量為: (1) 表3.3.1—1紅葡萄酒樣品評分結(jié)果的Wilcoxon符號秩檢驗 酒樣品 評分結(jié)果 差值D 絕對差值 秩次 符號秩次R n 兩組 M1 M2 D=M1-M2 |D| R - + 1 62.7 68.1 -5.4 5.4
20、 13 13 2 80.3 74 6.3 6.3 21.5 21.5 3 80.4 74.6 5.8 5.8 16.5 16.5 4 68.6 71.2 -2.6 2.6 6 6 5 73.3 72.1 1.2 1.2 3 3 6
21、 72.2 66.3 5.9 5.9 18 18 7 71.5 65.3 6.2 6.2 20 20 8 72.3 66 6.3 6.3 21.5 21.5 9 81.5 78.2 3.3 3.3 8 8 10 74.2 69.1
22、 5.1 5.1 12 12 11 70.1 61.6 8.5 8.5 25.5 25.5 12 53.9 68.3 -14.4 14.4 27 27 13 74.6 68.8 5.8 5.8 16.5 16.5 14 73 72.6 0.4 0.4
23、 1 1 15 58.7 65.7 -7 7 24 24 16 74.9 69.9 5 5 11 11 17 79.3 74.5 4.8 4.8 9 9 18 59.9 65.4 -5.5 5.5 14 14 19 78.6
24、72.6 6 6 19 19 20 78.6 75.8 2.8 2.8 7 7 21 77.1 72.2 4.9 4.9 10 10 22 77.2 71.6 5.6 5.6 15 15 23 85.6 77.1 8.5 8.5
25、 25.5 25.5 24 78 71.5 6.5 6.5 23 23 25 69.2 68.2 1 1 2 2 26 73.8 72 1.8 1.8 5 5 27 73 71.5 1.5 1.5 4 4
26、 84 294 顯然,如果原假設為真,則應該有相同的值,等于n(n+1)/4,因此太大的S值和太小的S值都是我們拒絕原假設的依據(jù)。 對于n>20,當原假設H0為真時,統(tǒng)計量接近于0,統(tǒng)計量T的方差為: (2) 建立檢驗統(tǒng)計量: (3) z近似于服從標準正態(tài)分布。又由可得n(n+1)/2,代入式(3)可得: data examp4_6; input M1 M2; d= M1-M2; cards; 62.7 68.1 80.3 74 8
27、0.4 74.6 68.6 71.2 73.3 72.1 72.2 66.3 71.5 65.3 72.3 66 81.5 78.2 74.2 69.1 70.1 61.6 53.9 68.3 74.6 68.8 73 72.6 58.7 65.7 74.9 69.9 79.3 74.5 59.9 65.4 73 72.6 78.6 75.8 77.1 71.5 77.2 71.6 85.6 77.1 78 71.5 69.2 68.2 73.8 72 78.6 72.2 ; run; proc univar
28、iate data=examp4_6 ; var d; run; 由 p 值檢驗法可知:選取的顯著性水平α >M=0.0015 ,則在顯著性水平α 下拒絕;選取的顯著性水平a>S=0.0074,則在顯著性水平α下拒絕。兩組評酒員對27種紅葡萄酒的評價結(jié)果具有顯著性差異。 綜上所述,在顯著性水平為0.05的情形下,兩組評酒員的評價結(jié)果具有顯著性差異。 3.3.2可信度的判斷 針對原始數(shù)據(jù),分別求出第一組每名評酒員對27種紅葡萄酒和28種白葡萄酒的評分、以及10名評酒員對27種紅葡萄酒和28種白葡萄酒的評分平均分;同理也求出第二組相對應的評分值。然后將每名評酒員對2
29、7種紅葡萄酒的評分和對28種白葡萄酒的評分分別從高到低進行排序,同時將各組對27種紅葡萄酒的平均評分和對28種白葡萄酒的平均評分分別從高到低進行排序。下面以第一組10名評酒員對27種紅葡萄酒的評分以及平均評分的排序為例進行說明,所得結(jié)果如下表3.3.2—1所示 表3.3.2—1第一組對紅葡萄酒的評分排序 紅酒1 品酒員1 品酒員2 品酒員3 品酒員4 品酒員5 品酒員6 品酒員7 品酒員8 品酒員9 品酒員10 平均值排序 酒樣品1 27 22 25 27 13 22 15 23 24 27 24 酒樣品2 13 10 5 4
30、 4 9 1 7 4 20 4 酒樣品3 2 2 4 3 18 3 13 5 6 11 3 酒樣品4 26 24 21 13 24 7 7 21 9 8 23 酒樣品5 6 19 15 19 7 21 23 4 11 22 15 酒樣品6 11 21 18 21 8 19 20 20 11 1 19 酒樣品7 22 20 12 16 23 5 15 26 6 1 20 酒樣品8 21 18 21 15 14 14 20 3 22 11 1
31、8 酒樣品9 4 14 12 1 6 2 7 1 15 6 2 酒樣品10 20 9 8 8 15 13 11 17 20 16 13 酒樣品11 7 25 15 18 22 16 18 19 1 20 21 酒樣品12 25 27 27 25 25 23 27 23 27 24 27 酒樣品13 18 5 11 23 16 11 6 10 22 8 12 酒樣品14 14 16 20 7 10 25 7 10 20 11 16 酒樣品15 18
32、 26 24 24 27 27 26 25 26 11 26 酒樣品16 11 11 10 5 18 16 3 15 18 18 11 酒樣品17 14 13 2 8 1 7 20 6 11 11 5 酒樣品18 22 23 25 25 26 26 25 27 25 25 25 酒樣品19 5 5 7 13 21 4 3 8 10 3 6 酒樣品20 3 5 12 8 8 10 7 10 2 3 6 酒樣品21 7 1 1 5 18 23 5
33、 16 2 18 10 酒樣品22 7 8 15 8 3 14 11 9 16 5 9 酒樣品23 1 2 5 2 2 1 2 2 6 7 1 酒樣品24 14 2 3 8 5 5 18 14 18 23 8 酒樣品25 24 14 9 19 17 20 24 22 11 26 22 酒樣品26 7 11 18 21 12 16 15 10 16 8 14 酒樣品27 14 16 23 16 10 12 13 18 4 16 16
34、 第一組對白葡萄酒的評分排序見附錄2,第二組對紅葡萄酒的評分排序見附錄3,第二組對白葡萄酒的評分排序見附錄4。 如上表3.3.2—1所示,分別求出每名評酒員對27種紅葡萄酒評分的排序與平均評分的排序之間的歐氏距離,再將10名評酒員的歐氏距離求和得到第一組對紅葡萄酒評分排序的總和歐式距離??偤蜌W氏距離的計算公式如下: 由式(6)求得第一組對紅葡萄酒評分排序的總和歐式距離=314.74,同理可求得第一組對白葡萄酒的評分排序的總和歐式距離=399.41,第二組對紅葡萄酒評分排序的總和歐式距離=334.72,第二組對白葡萄酒的評分排序的總和歐式距離=438.96。由和可知,第一組各評酒員對葡萄
35、酒的評分更接近10名評酒員的平均評分,因而說明第一組評分一致性較好,更為可信。 4問題二的建模與求解 4.1問題二的分析 問題二需要根據(jù)釀酒葡萄的理化指標和葡萄酒的質(zhì)量對釀酒葡萄進行分級, 葡萄酒的質(zhì)量評分取自兩組評酒員對紅、白葡萄酒的綜合平均評分的均值,本題分析求解仍以紅葡萄酒樣品及其釀酒葡萄為例進行說明。鑒于釀酒葡萄的理化指標繁多,故將釀酒葡萄的各項理化指標分別與對應的酒樣品質(zhì)量評分作相關性分析,求出相關系數(shù)后,從中選取相關性顯著的理化指標,相關性較差的理化指標則不納入考慮范圍。然后利用加權Topsis法分析求解出
36、各釀酒葡萄的各項理化指標與最優(yōu)方案的接近程度,最后通過接近程度大小的排序從而給出各釀酒葡萄的質(zhì)量排序,對接近程度合理進行分段從而給出各釀酒葡萄的級別。 4.2葡萄酒質(zhì)量與釀酒葡萄理化指標之間的相關性分析 利用Excel軟件的統(tǒng)計工具箱將釀酒葡萄的各項理化指標分別與對應葡萄酒的質(zhì)量評分作相關性分析,求出各相關系數(shù)。 利用相關系數(shù)判斷相關關系的密切程度,通常認為: 根據(jù)上表4.2—1中的判斷依據(jù),對比釀酒葡萄的各項理化指標與對應葡萄 酒質(zhì)量評分的相關系數(shù),相關性顯著的理化指標有釀酒葡萄的蛋白質(zhì)含量、DPPH自由基含量、總酚含量、葡萄總黃酮含量和PH值等5個指標,結(jié)果如下表4.
37、2—2所示。于是,可利用這5個理化指標的值進一步利用加權Topsis法分析求解。 4.3 主成分分析對釀酒葡萄的排序分級 下面以紅葡萄酒樣品對應的釀酒葡萄為例進行說明,首先對相關性顯著的5個理化指標進行屬性趨同化處理,即將低優(yōu)指標和中性指標全轉(zhuǎn)化為高優(yōu)指標。然后將5個理化指標對應27種釀酒葡萄的數(shù)據(jù)進行歸一化處理,得出轉(zhuǎn)換指標歸一化的Z矩陣如下表4.3—1所示,然后進行主成分分析進行排序分級。 主成分分析: data examp4_4; input id x1-x5; cards; 1 0.1910 0.2292 0.2824 0.1918 0.
38、1952 2 0.2163 0.2452 0.3216 0.2794 0.2166 3 0.2020 0.2186 0.2595 0.2183 0.2144 4 0.1830 0.1439 0.1280 0.0906 0.1804 5 0.2022 0.2132 0.2108 0.2080 0.1996 6 0.1853 0.1493 0.1277 0.1384 0.1804 7 0.1682 0.0959 0.1102 0.0702 0.1744 8 0.1929 0.2239 0.1823 0.1716 0.1601 9 0.2420 0.3571 0.36
39、03 0.4146 0.2051 10 0.1883 0.1759 0.1134 0.0937 0.2001 11 0.1874 0.1493 0.0727 0.0510 0.1935 12 0.1704 0.1066 0.1443 0.0789 0.1881 13 0.2093 0.2345 0.1722 0.1483 0.2116 14 0.2071 0.1919 0.1754 0.1580 0.1859 15 0.1812 0.1173 0.1424 0.1115 0.1749 16 0.2014 0.1279 0.1341 0.1853 0.1809 17 0.1895
40、 0.1919 0.1835 0.1760 0.1881 18 0.1774 0.1226 0.0883 0.1062 0.1793 19 0.1880 0.2026 0.2086 0.1912 0.1957 20 0.1931 0.1493 0.1517 0.1651 0.2089 21 0.1947 0.2026 0.1937 0.1521 0.1952 22 0.1688 0.1493 0.1967 0.1588 0.2001 23 0.1877 0.3038 0.3554 0.4916 0.1859 24 0.1816 0.1493 0.1047 0.1661 0.197
41、9 25 0.1855 0.1866 0.1376 0.1086 0.1853 26 0.2028 0.1706 0.0879 0.0684 0.2018 27 0.1824 0.1439 0.1065 0.0953 0.1848 ; run; proc princomp data=examp4_4 prefix=y out=bb; var x1-x5; proc plot data=bb; plot y2*y1 $ id='*'; proc sort data=bb; by descending y1; run; proc
42、 print data=bb; var id y1 y2 x1-x5; run; 將表中的紅葡萄酒對應的釀酒葡萄分別為1,2,3,級產(chǎn)品,根據(jù)prin1區(qū)間[2,6],[0,2][-3,0],其中釀酒葡萄的質(zhì)量從Ⅰ級到Ⅴ級逐漸由好到差。依此標準對照表4.3—2中數(shù)據(jù),則Ⅰ級釀酒葡萄有樣品9和樣品23,樣品2,2級釀酒葡萄有樣品3,13,1,5,19,21,14,17、3級釀酒葡萄有樣品20,8,26,16,22,10,25,24,6,4,27,11,15,12, 26,27。 同理可對白葡萄酒對應的釀酒葡萄進行分級,此處不再贅述。
43、 5問題三的建模與求解 5.1問題三的分析 問題三需要分析釀酒葡萄與葡萄酒的理化指標之間的聯(lián)系,即是要分析兩組隨機變量之間的相關性關系,可以考慮運用多元統(tǒng)計分析中Hotelling典型相關分析法進行求解。Hotelling典型相關分析法是研究兩組變量之間相關性的一種統(tǒng)計分析方法,也是一種降維技術,其基本思想與主成分分析非常相似。 首先在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關系數(shù)。然后選取和最初挑選的這對線性組合不相關的線性組合,使其配對,并選取相關系數(shù)最大的一對,如此繼續(xù)下去,直到兩組變量之間的相關性被提取完畢為止。被選出的線性組
44、合配對稱為典型變量,它們的相關系數(shù)稱為典型相關系數(shù)。典型相關系數(shù)度量了這兩組變量之間聯(lián)系的強度[7]。 5.2典型相關分析模型的建立與求解 把釀酒葡萄的理化指標分別記作 m表示釀酒葡萄第m個理化指標 把葡萄酒的理化指標記作 ,n表示葡萄酒第n個理化指標 本題需要分析和的聯(lián)系,所以用典型相關性分析對和兩個多維 向量進行分析,利用SAS軟件對這兩組變量進行典型相關分析。葡萄酒的理化指標Yi(i=1,2,3…11),稱為因變量組?,F(xiàn)在的問題是:葡萄的理化指標Xj(j=1,2…23),稱為影響組,哪些與葡萄酒的理化指標密切相關,經(jīng)過分析,本文認為解決的最好方法是典型相關分析法。
45、 SAS軟件運行結(jié)果如下: 將葡萄酒的理化指標與釀酒葡萄的理化指標兩組變量間的相關系數(shù)運行結(jié)果整理得到分析結(jié)果,如下表5.2—1所示: 本文認為相關系數(shù)大于0.5則相關性就很明顯了。從表中數(shù)據(jù)看出,同種物質(zhì)在酒中和葡萄中相關性均顯著,不同種物質(zhì)相關性關系分析如下:酒中花色苷與葡萄中單寧,總酚,DPPH自由基,蘋果酸呈明顯正相關,酒中單寧與葡萄中花色苷,總酚,葡萄總黃酮,DPPH自由基,黃酮醇呈明顯正相關,酒中總酚與葡萄中花色苷,單寧,葡萄總黃酮,DPPH自由基呈明顯正相關,酒中酒總黃酮與葡萄中花色苷,單寧,總酚,DPPH自由基呈明顯正相關,酒中白藜蘆醇與葡萄中葡萄總黃酮呈明顯正相關,酒中D
46、PPH自由基與葡萄中花色苷,單寧,總酚,葡萄總黃酮呈明顯正相關,酒中色澤指標與花色苷,單寧呈明顯負相關。 表5.2—1紅葡萄酒理化指標與紅葡萄理化指標間的相關數(shù) 由結(jié)果輸出的典型相關系數(shù),如表5.2—2所示,第一到第九典型相關系數(shù)均為1,第十個典型相關系數(shù)為0.940,它們均比葡萄酒理化指標與葡萄理化指標兩組間的任一相關系數(shù)大,即綜合的典型相關分析效果好于簡單相關分析。由于此處典型性相關系數(shù)是從樣本數(shù)據(jù)得到的,有必要進行總體系數(shù)是否為0的假設檢驗,此處采用檢驗,零假設為對應的典型相關系數(shù)為0.輸出結(jié)果,如表5.2—3所示:在的情況下,第一到第九典型相關系數(shù)是顯著的。如此則舍棄第十,十一
47、對典型變量。 Sig為擬合優(yōu)度,應小于0.1,否則被剔除) 程序運行得到典型相關模型,鑒于原始變量的計量單位不同,不宜直接比較,本文采用標準化的典型系數(shù),給出典型相關模型: 由結(jié)果分析,一共有9對典型相關方程。 在第一對變量中,大部分變量的系數(shù)比較均勻,說明測試結(jié)果越好,則葡萄酒的理化指標與葡萄的理化指標之間的關系越顯著,其整體對于葡萄酒的質(zhì)量的影響越大。同理分析第二到第九對典型變量中的對應系數(shù),也得出類似結(jié)論。 6問題四的建模與求解 6.1問題四的分析 問題四需要分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質(zhì)量的影響,本文分開分析釀酒葡萄的理化指標對葡萄
48、酒質(zhì)量的影響和葡萄酒的理化指標對葡萄酒質(zhì)量的影響。利用灰色關聯(lián)度分析進行求解。灰色關聯(lián)度分析能定量描述事物或因素相互變化的情況,即變化的大小,方向與速度等的相對性。如果事物或因素變化的態(tài)勢基本一致,則認為他們之間的關聯(lián)度較大,反之,關聯(lián)度較小。 6.2灰色關聯(lián)度分析模型的建立與求解 灰色關聯(lián)度方法的計算介紹: (1)原始數(shù)據(jù)的處理: 由于各因素有不同的計量單位,因而原始數(shù)據(jù)存在量綱和數(shù)量級上的差異,在計算關聯(lián)度之前,通常要對原始數(shù)據(jù)進行無量綱化處理。 均值化 (2)關聯(lián)系數(shù)的計算 設經(jīng)過數(shù)據(jù)處理后的參考數(shù)列為:
49、 (14) 比較數(shù)列為: 從幾何角度看,關聯(lián)程度實質(zhì)是參考數(shù)列與比較數(shù)列曲線形狀的相似程度,參考數(shù)列與比較數(shù)列曲線形狀接近,則兩者關聯(lián)度較大;反之參考數(shù)列與比較數(shù)列曲線形狀相差較大,則兩者間的關聯(lián)度較小。因此,可用曲線間的差值大小作為關聯(lián)度的衡量標準。則: (3)關聯(lián)度的計算與比較 由于每個比較數(shù)列與參數(shù)數(shù)列的關聯(lián)程度是通過n個關聯(lián)系數(shù)來反映的,關聯(lián)系數(shù)分散,不便于從整體上進行比較。因此,有必要對關聯(lián)信息做集中處理。而求平均值是一種信息集中的方式。即用比較數(shù)列與參數(shù)數(shù)列各個時期的關聯(lián)系數(shù)的平均值來定量反映這兩個數(shù)列的關聯(lián)程度,其計算公式為: 對于本題問題,
50、灰色關聯(lián)度分析分五步進行: (1)對數(shù)據(jù)做均值化處理。 表6.2—1均值化處理數(shù)列表 2)計算各比較數(shù)列同參考數(shù)列在同一時期的絕對差,例如對表6.2—1的第一行數(shù)據(jù)求絕對差: 表6.2—2絕對差計算表 (3)找出表6.2—2中兩極最大差與最小差并計算關聯(lián)系數(shù),通過查閱參考文獻取分辨系數(shù)得到表6.2—3關聯(lián)系數(shù)計算表 表6.2—3關聯(lián)系數(shù)計算表 (4)計算關聯(lián)度并對關聯(lián)度進行分析 利用表6.2—3,分別對每個數(shù)列每個時期的關聯(lián)系數(shù)的平均值即得關聯(lián)度: 表6.2—4關聯(lián)度 從表6.2—4關聯(lián)度結(jié)果中可以看出a*(D65),C(D65),b*(D65)以及單寧,總酚對葡萄酒質(zhì)量影響比較大,而花色苷和酒總黃酮等對葡萄酒的影響次之。利用同樣的方法得到葡萄的理化指標對葡萄酒質(zhì)量的關聯(lián)度: 表6.2—5關聯(lián)系數(shù)和關聯(lián)度表 從表6.2—5關聯(lián)度的結(jié)果可以看出a*(D65),C(D65),b*(D65),乙醇,乙酸乙酯,單寧,總酚對葡萄酒的質(zhì)量影響比較大,而苯乙醇,酒總黃酮等次之。從結(jié)果還可以看出,雖然葡萄的理化指標和葡萄酒的理化指標對葡萄的質(zhì)量有影響,但每個指標相關度在0.5~0.7之間,所以不能只用理化指標來對葡萄酒的質(zhì)量進行分析,還要結(jié)合其他的方法對葡萄酒的質(zhì)量進行評價。
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。