《2022年高中數(shù)學(xué)(北師大版)選修1-2教案:第1章 拓展資料:回歸模型的殘差分析》由會(huì)員分享,可在線閱讀,更多相關(guān)《2022年高中數(shù)學(xué)(北師大版)選修1-2教案:第1章 拓展資料:回歸模型的殘差分析(5頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、
2022年高中數(shù)學(xué)(北師大版)選修1-2教案:第1章 拓展資料:回歸模型的殘差分析
判斷回歸模型的擬合效果是回歸分析的重要內(nèi)容,在回歸分析中,通常用殘差分析來判斷回歸模型的擬合效果。下面具體分析殘差分析的途徑及具體例子。
一、 殘差分析的兩種方法
1、差分析的基本方法是由回歸方程作出殘差圖,通過觀測(cè)殘差圖,以分析和發(fā)現(xiàn)觀測(cè)數(shù)據(jù)中可能出現(xiàn)的錯(cuò)誤以及所選用的回歸模型是否恰當(dāng);在殘差圖中,殘差點(diǎn)比較均勻地落在水平區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高,回歸方程的預(yù)報(bào)精度越高。
2、可以進(jìn)一步通過相關(guān)指數(shù)來衡量回歸模型的擬合效果,一般規(guī)律是
2、越大,殘差平方和就越小,從而回歸模型的擬合效果越好。
二、 典例分析:
例1、某運(yùn)動(dòng)員訓(xùn)練次數(shù)與運(yùn)動(dòng)成績(jī)之間的數(shù)據(jù)關(guān)系如下:
次數(shù)/x
30
33
35
37
39
44
46
50
成績(jī)/y
30
34
37
39
42
46
48
51
試預(yù)測(cè)該運(yùn)動(dòng)員訓(xùn)練47次以及55次的成績(jī)。
解答:(1)作出該運(yùn)動(dòng)員訓(xùn)練次數(shù)x與成績(jī)y之間的散點(diǎn)圖,如圖1所示,由散點(diǎn)圖可知,它們之間具有線性相關(guān)關(guān)系。
(2)列表計(jì)算:
次數(shù)
成績(jī)
30
30
900
900
900
33
34
1089
1156
1122
35
3、37
1225
1369
1295
37
39
1369
1521
1443
39
42
1521
1764
1638
44
46
1936
2116
2024
46
48
2116
2304
2208
50
51
2500
2601
2550
由上表可求得,,,
,所以
,所以回歸直線方程為
(3)計(jì)算相關(guān)系數(shù)
將上述數(shù)據(jù)代入得,查表可知
,而,故y與x之間存在顯著的相關(guān)關(guān)系。
(4)殘差分析:
作殘差圖如圖2,由圖可知,殘差點(diǎn)比較均勻地分布在水平帶狀區(qū)域中,說明選用的模型比較合適。
計(jì)算殘差的方差得,說明預(yù)報(bào)的精
4、度較高。
(5)計(jì)算相關(guān)指數(shù)
計(jì)算相關(guān)指數(shù)=0.9855.說明該運(yùn)動(dòng)員的成績(jī)的差異有98.55%是由訓(xùn)練次數(shù)引起的。
(6)做出預(yù)報(bào)
由上述分析可知,我們可用回歸方程作為該運(yùn)動(dòng)員成績(jī)的預(yù)報(bào)值。
將x=47和x=55分別代入該方程可得y=49和y=57,
故預(yù)測(cè)運(yùn)動(dòng)員訓(xùn)練47次和55次的成績(jī)分別為49和57.
點(diǎn)評(píng):一般地,建立回歸模型的基本步驟為:
(1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量;
(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等);
(3)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性
5、回歸方程y=bx+a);
(4)按一定規(guī)則估計(jì)回歸方程中的參數(shù)(如最小二乘法);
(5)得出結(jié)果后分析殘差圖是否有異常(個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性等等),若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等。
例2、某城區(qū)為研究城鎮(zhèn)居民月家庭人均生活費(fèi)支出和月人均收入的相關(guān)關(guān)系,隨機(jī)抽取10戶進(jìn)行調(diào)查,其結(jié)果如下:
月人均收入x/元
月人均生活費(fèi)y/元
300
255
390
324
420
335
520
360
570
450
700
520
760
580
800
600
850
630
1080
750
試預(yù)測(cè)人均月收
6、入為1100元和人均月收入為1200元的兩個(gè)家庭的月人均生活費(fèi)。
解答:作出散點(diǎn)分布圖如圖,由圖可知,月人均生活費(fèi)與人均收入之間具有線性相關(guān)關(guān)系。
通過計(jì)算可知,,,
,所以
,所以回歸直線方程為
計(jì)算相關(guān)系數(shù)得,而查表知,故月人均收入與月人均生活費(fèi)之間具有顯著相關(guān)關(guān)系。
作殘差圖如圖,由圖可知,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適。
計(jì)算相關(guān)指數(shù)得=0.9863,說明城鎮(zhèn)居民的月人均生活費(fèi)的差異有98.63%是由月人均收入引起的。
由以上分析可知,我們可以利用回歸方程來作為月生活費(fèi)的預(yù)報(bào)值。
將x=1100代入回歸方程得y=784.59元;將x=1200代入回歸方程得y=850.58元。
故預(yù)測(cè)月人均收入分別為1100元和1200元的兩家庭的月人均生活費(fèi)分別為784.59元和850.58元。