《偏最小二乘法》PPT課件.ppt
《《偏最小二乘法》PPT課件.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《偏最小二乘法》PPT課件.ppt(23頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
第十一章偏最小二乘法,偏最小二乘回歸是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,它與1983年由伍德和阿巴諾等人首次提出。近十年來(lái),它在理論、方法和應(yīng)用方面都得到了迅速的發(fā)展。密西根大學(xué)的弗耐爾教授稱偏最小二乘回歸為第二代回歸分析方法。偏最小二乘回歸方法在統(tǒng)計(jì)應(yīng)用中的重要性主要的有以下幾個(gè)方面:(1)偏最小二乘回歸是一種多因變量對(duì)多自變量的回歸建模方法。(2)偏最小二乘回歸可以較好地解決許多以往用普通多元回歸無(wú)法解決的問(wèn)題。,在普通多元線形回歸的應(yīng)用中,我們常受到許多限制。最典型的問(wèn)題就是自變量之間的多重共線性。如果采用普通的最小二乘方法,這種變量多重相關(guān)性就會(huì)嚴(yán)重危害參數(shù)估計(jì),擴(kuò)大模型誤差,并破壞模型的穩(wěn)定性。變量多重相關(guān)問(wèn)題十分復(fù)雜,長(zhǎng)期以來(lái)在理論和方法上都未給出滿意的答案,這一直困擾著從事實(shí)際系統(tǒng)分析的工作人員。偏最小二乘回歸中開(kāi)辟了一種有效的技術(shù)途徑,它利用對(duì)系統(tǒng)中的數(shù)據(jù)信息進(jìn)行分解和篩選的方式,提取對(duì)因變量的解釋性最強(qiáng)的綜合變量,辨識(shí)系統(tǒng)中的信息與噪聲,從而更好地克服變量多重相關(guān)性在系統(tǒng)建模中的不良作用。,(3)偏最小二乘回歸之所以被稱為第二代回歸方法,還由于它可以實(shí)現(xiàn)多種數(shù)據(jù)分析方法的綜合應(yīng)用。,偏最小二乘回歸=多元線性回歸分析+典型相關(guān)分析+主成分分析,由于偏最小二乘回歸在建模的同時(shí)實(shí)現(xiàn)了數(shù)據(jù)結(jié)構(gòu)的簡(jiǎn)化,因此,可以在二維平面圖上對(duì)多維數(shù)據(jù)的特性進(jìn)行觀察,這使得偏最小二乘回歸分析的圖形功能十分強(qiáng)大。在一次偏最小二乘回歸分析計(jì)算后,不但可以得到多因變量對(duì)多自變量的回歸模型,而且可以在平面圖上直接觀察兩組變量之間的相關(guān)關(guān)系,以及觀察樣本點(diǎn)間的相似性結(jié)構(gòu)。這種高維數(shù)據(jù)多個(gè)層面的可視見(jiàn)性,可以使數(shù)據(jù)系統(tǒng)的分析內(nèi)容更加豐富,同時(shí)又可以對(duì)所建立的回歸模型給予許多更詳細(xì)深入的實(shí)際解釋。,一、偏最小二乘回歸的建模原理和方法,(一)建模原理設(shè)有q個(gè)因變量{y1,y2,…,yq}和p個(gè)自變量{x1,x2,…,xp}。為了討論兩組變量之間的關(guān)系,觀測(cè)了n個(gè)樣本點(diǎn)。偏最小二乘回歸開(kāi)始與典型相關(guān)分析相同,分別在X與Y中提取出主成分。設(shè){t1,t2,…,tr}為{x1,x2,…,xp}的主成分,{u1,u2,…,ur}為{y1,y2,…,yq},其中r=min(p,q)。,(1)t1和u1應(yīng)盡可能大地?cái)y帶他們各自數(shù)據(jù)表中的變異信息;(2)t1和u1的相關(guān)程度能夠達(dá)到最大。這兩個(gè)要求表明,t1和u1應(yīng)盡可能好的代表數(shù)據(jù)表X和Y,同時(shí)自變量的成分t1對(duì)因變量的成分u1又有最強(qiáng)的解釋能力。,在第一個(gè)成分t1和u1被提取后,偏最小二乘回歸分別實(shí)施X對(duì)t1的回歸以及Y對(duì)t1的回歸。如果回歸方程已經(jīng)達(dá)到滿意的精度,則算法終止;否則,將利用X被t1解釋后的殘余信息以及Y被t1解釋后的殘余信息進(jìn)行第二輪的成分提取。如此往復(fù),直到能達(dá)到一個(gè)較滿意的精度為止。若最終對(duì)X共提取了m個(gè)成分{t1,t2,…,tr},偏最小二乘將通過(guò)實(shí)施Y1,Y2,…,Yq對(duì){t1,t2,…,tr}的回歸,然后再表達(dá)成YK關(guān)于原變量X1,X2,…,Xp的回歸方程,其中k=1,2,…,q。,(二)計(jì)算方法推導(dǎo),首先將數(shù)據(jù)做標(biāo)準(zhǔn)化處理。設(shè)X組變量標(biāo)準(zhǔn)化的觀測(cè)值矩陣為,設(shè)Y組變量標(biāo)準(zhǔn)化的觀測(cè)值矩陣為,求X組變量的第一主成分t1,w1為第一主成分的系數(shù)向量,w1是一個(gè)單位向量。t1=X0w1求Y組變量的第一主成分t1,c1為第一主成分的系數(shù)向量,c1是一個(gè)單位向量。u1=Y0c1有Var(t1)=maxVar(u1)=max?(t1,u1)=max,因此綜合起來(lái),在偏最小二乘回歸中,我們要求與的協(xié)方差達(dá)到最大,既,(1)求w1和c1,對(duì)Q分別求關(guān)于c1,w2,?1,?2和的偏導(dǎo)并令之為零,有,采用拉格朗日乘數(shù)法,討論有約束條件的極值問(wèn)題。,可以推出,則,,記,可得,,可見(jiàn),w1是矩陣的特征向量,對(duì)應(yīng)的特征值為。所以w1是對(duì)應(yīng)于矩陣最大特征值的單位特征向量。而另一方面,c1是對(duì)應(yīng)于矩陣最大特征值的單位特征向量c1。,注意這里t1和u1分別為n維向量,是n個(gè)個(gè)案在兩組變量的主成分的取值。,分別求X0和Y0對(duì)t1和u1的兩個(gè)回歸方程,,,,根據(jù)最小二乘估計(jì)的原理,則,稱?1為模型效應(yīng)載荷量。,2.建立回歸方程,3.用殘差代替X0和Y0的進(jìn)行以上的工作,在第二步工作中,由于第一對(duì)主成分并未將相關(guān)的信息提取完,所以需要再重復(fù)第一步工作,在殘差矩陣E0和F0中再提取第二對(duì)主成分。,分別求E1和F1對(duì)t2和u2的兩個(gè)回歸方程,即,,,,根據(jù)最小二乘估計(jì)的原理,則,進(jìn)而有,4.設(shè)n?p數(shù)據(jù)觀測(cè)矩陣的秩為r=min(n,p),則存在r個(gè)成分t1,t2,…,tr。使得,將(3)式代入(2)式,并合并同類項(xiàng),非標(biāo)準(zhǔn)化的偏最小二乘回歸方程為,5.抽取主成分個(gè)數(shù)l的確定,至于抽取幾個(gè)主成份進(jìn)行偏最小二乘模型,需要進(jìn)行進(jìn)一步的檢驗(yàn)。當(dāng)然一定小于r。我們首先定義殘差平方和其中i為第i個(gè)樣本點(diǎn),j為第j個(gè)指標(biāo),k為主成分的個(gè)數(shù)。通常情況下,選擇使殘差平方和最小的個(gè)數(shù)l。有四種方法。,(1)舍一交叉驗(yàn)證法,依次舍去第i(i=1,2,…,n)個(gè)樣本點(diǎn),用余下的n-1個(gè)樣本點(diǎn)做偏最小二乘回歸模型,并預(yù)測(cè)相應(yīng)的,k為主成分的個(gè)數(shù)。,選擇使PRESS(k)最小的主成分的個(gè)數(shù)。,(2)分批交叉驗(yàn)證法,分批交叉驗(yàn)證法是每次留下q個(gè)觀測(cè)作為檢驗(yàn)數(shù)據(jù),q=1是為“舍一交叉驗(yàn)證方法”。類似按預(yù)測(cè)殘差平方和達(dá)到最小的主成分個(gè)數(shù)。,(3)分裂樣本交叉驗(yàn)證法,與分批交叉驗(yàn)證法不同的是分裂樣本法所扣留的樣本不是連續(xù)的,而是燈具抽取的。例如第一次抽{1,11,…},第二次抽{2,12,22,…}等等。然后再根據(jù)預(yù)測(cè)殘差平方和最小的原則,確定主成份的個(gè)數(shù)l。,(4)隨機(jī)樣本交叉驗(yàn)證,按隨機(jī)的原則來(lái)扣留樣本,再根據(jù)預(yù)測(cè)殘差平方和最小的原則,確定主成份的個(gè)數(shù)。,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 偏最小二乘法 最小二乘法 PPT 課件
鏈接地址:http://www.3dchina-expo.com/p-11501503.html