《萬變不離其宗五【選修1-11-24-5】:專題五 統(tǒng)計案例 Word版含解析》由會員分享,可在線閱讀,更多相關《萬變不離其宗五【選修1-11-24-5】:專題五 統(tǒng)計案例 Word版含解析(5頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、
一、題之源:課本基礎知識
1.變量間的相關關系
(1)常見的兩變量之間的關系有兩類:一類是函數(shù)關系,另一類是相關關系;與函數(shù)關系不同,相關關系是一種非確定性關系.
(2)從散點圖上看,點分布在從左下角到右上角的區(qū)域內(nèi),兩個變量的這種相關關系稱為正相關,點分布在左上角到右下角的區(qū)域內(nèi),兩個變量的相關關系為負相關.
2.兩個變量的線性相關
(1)從散點圖上看,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,稱兩個變量之間具有線性相關關系,這條直線叫回歸直線.
(2)回歸方程為=x+,其中=,=-.
(3)通過求Q= (yi-bxi-a)2的最小值而得出回歸直線的方法,
2、即求回歸直線,使得樣本數(shù)據(jù)的點到它的距離的平方和最小,這一方法叫做最小二乘法.
(4)相關系數(shù):
當r>0時,表明兩個變量正相關;
當r<0時,表明兩個變量負相關.
r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系,通常|r|大于0.75時,認為兩個變量有很強的線性相關性.
3.獨立性檢驗
假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為:
y1
y2
總計
x1
a
b
a+b
x2
c
d
c+d
總計
a+c
b+d
3、a+b+c+d
K2=(其中n=a+b+c+d為樣本容量).
二、題之本:思想方法技巧
1.在研究兩個變量之間是否存在某種關系時,必須從散點圖入手.對于散點圖,可以做出如下判斷:
(1)如果所有的樣本點都落在某一函數(shù)曲線上,就用該函數(shù)來描述變量之間的關系,即變量之間具有函數(shù)關系.
(2)如果所有的樣本點都落在某一函數(shù)曲線附近,變量之間就有相關關系.
(3)如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系.
2.分析兩個變量相關關系的常用方法:
(1)利用散點圖進行判斷;
(2)利用相關系數(shù)r進行判斷.
3.
(1)回歸分析是對具有相關關系的兩個變量進行統(tǒng)計
4、分析的方法,只有在散點圖大致呈線性時,求出的回歸直線方程才有實際意義,否則無意義.
(2)根據(jù)回歸方程進行的估計僅是一個預測值,而不是真實發(fā)生的值.
(3)用最小二乘法求回歸方程,關鍵在于正確求出系數(shù),,由于,的計算量較大,計算時應仔細小心.
4.線性回歸分析的方法、步驟
(1)畫出兩個變量的散點圖;
(2)求相關系數(shù)r,并確定兩個變量的相關程度的高低;
(3)用最小二乘法求回歸直線方程=x+,
(4)利用回歸直線方程進行預報.
注:①對于非線性(可線性化)的回歸分析,一般是利用條件及我們熟識的函數(shù)模型,將題目中的非線性關系轉化為線性關系進行分析,最后還原.②利用相關指數(shù)R
5、2=1-刻畫回歸效果時,R2越大,意味著殘差平方和越小,模型的擬合效果越好.
5.獨立性檢驗的一般步驟
(1)假設兩個分類變量x與y沒有關系;
(2)計算出K2的觀測值,其中
K2=;
(3)把K2的值與臨界值比較,作出合理的判斷.
6.獨立性檢驗的注意事項
(1)在列聯(lián)表中注意事件的對應及相關值的確定,不可混淆.
(2)在實際問題中,獨立性檢驗的結論僅是一種數(shù)學關系表述,得到的結論有一定的概率出錯.
(3)對判斷結果進行描述時,注意對象的選取要準確無誤,應是對假設結論進行的含概率的判斷,而非其他.
三、題之變:課本典例改編
1.原題(選修1-2第6頁例2)一只紅鈴
6、蟲的產(chǎn)卵數(shù) 和溫度 有關,現(xiàn)收集了 7 組觀測數(shù)據(jù)列于表中,試建立 與 之間的回歸方程。
溫度
21
23
25
27
29
32
35
產(chǎn)卵數(shù)個
7
11
21
24
66
115
325
改編 為了對2006年佛山市中考成績進行分析,在60分以上的全體同學中隨機抽出8位,他們的數(shù)學(已折算為百分制)、物理、化學分數(shù)對應如下表,
學生編號
1
2
3
4
5
6
7
8
數(shù)學分數(shù)x
60
65
70
75
80
85
90
95
物理分數(shù)y
72
77
80
84
88
90
93
95
7、
化學分數(shù)z
67
72
76
80
84
87
90
92
(1) 若規(guī)定85分(包括85分)以上為優(yōu)秀,求這8位同學中數(shù)學和物理分數(shù)均為優(yōu)秀的概率;
(2) 用變量y與x、z與x的相關系數(shù)說明物理與數(shù)學、化學與數(shù)學的相關程度;
(3) 求y與x、z與x的線性回歸方程(系數(shù)精確到0.01),并用相關指數(shù)比較所求回歸模型的效果.
參考數(shù)據(jù):,,,,,,,,,,.
【解析】(1) 由表中可以看出,所選出的8位同學中,數(shù)學和物理分數(shù)均為優(yōu)秀的人數(shù)是3人,其概率是.
(2) 變量y與x、z與x的相關系數(shù)分別是
、.
可以看出,物理與數(shù)學、化學與數(shù)學的成績都是高
8、度正相關.
(3) 設y與x、z與x的線性回歸方程分別是、.
根據(jù)所給的數(shù)據(jù),可以計算出,
.
所以y與x和z與x的回歸方程分別是、.
又y與x、z與x的相關指數(shù)是、.
故回歸模型比回歸模型的擬合的效果好.
2.原題(選修1-2第19頁復習參考題A組第2題)改編 甲乙兩個學校高三年級分別有1100人,1000人,為了了解兩個學校全體高三年級學生在該地區(qū)二??荚嚨臄?shù)學成績情況,采用分層抽樣方法從兩個學校一共抽取了 105名學生的數(shù)學成績,并作出了如下的頻數(shù)分布統(tǒng)計表,規(guī)定考試成績在內(nèi)為優(yōu)秀,甲校:
乙校:
(I )計算的值;
(II)由以上統(tǒng)計數(shù)據(jù)填寫右面列聯(lián)表,若按是否優(yōu)秀來判斷,是否有97.5% 的把握認為兩個學校的數(shù)學成績有差異.
附:
【解析】 (I )
(II),故有
97.5% 的把握認為兩個學校的數(shù)學成績有差異.