《2018年秋高中數(shù)學(xué) 第1章 統(tǒng)計案例階段復(fù)習(xí)課學(xué)案 新人教A版選修1-2》由會員分享,可在線閱讀,更多相關(guān)《2018年秋高中數(shù)學(xué) 第1章 統(tǒng)計案例階段復(fù)習(xí)課學(xué)案 新人教A版選修1-2(7頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、
第一課 統(tǒng)計案例
[核心速填]
1.線性回歸方程
對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),回歸直線y=bx+a的斜率和截距的最小二乘估計公式分別為==,=-,其中(,)稱為樣本點的
中心.
2.線性回歸模型為y=bx+a+e,其中e為隨機誤差.
3.殘差i=y(tǒng)i-i.
4.刻畫回歸效果的方法
(1)殘差平方和法
殘差平方和(yi-)2越小,模型擬合效果越好.
(2)殘差圖法
殘差圖形成的帶狀區(qū)域的寬度越窄,模型擬合效果越好.
(3)相關(guān)指數(shù)R2法
R2越接近1,模型擬合效果越好.
5.K2公式
K2=,其中n=a+b+
2、c+d.
[題型探究]
線性回歸分析
某城市理論預(yù)測2014年到2018年人口總數(shù)與年份的關(guān)系如表所示:
年份201x(年)
0
1
2
3
4
人口數(shù)y(十萬)
5
7
8
11
19
(1)請畫出上表數(shù)據(jù)的散點圖;
(2)請根據(jù)上表提供的數(shù)據(jù),求出y關(guān)于x的線性回歸方程=x+;
(3)據(jù)此估計2022年該市人口總數(shù).
【導(dǎo)學(xué)號:48662025】
[解] (1)散點圖如圖:
(2)因為==2,
==10,
0×5+1×7+2×8+3×11+4×19=132,
02+12+22+32+42=30,
所以==3.2,
=-=3.6
3、.
所以線性回歸方程為=3.2x+3.6.
(3)令x=8,則=3.2×8+3.6=29.2,
故估計2020年該城市人口總數(shù)為29.2(十萬).
[規(guī)律方法] 解決回歸分析問題的一般步驟
(1)畫散點圖.根據(jù)已知數(shù)據(jù)畫出散點圖.
(2)判斷變量的相關(guān)性并求回歸方程.通過觀察散點圖,直觀感知兩個變量是否具有相關(guān)關(guān)系;在此基礎(chǔ)上,利用最小二乘法求回歸系數(shù),然后寫出回歸方程.
(3)回歸分析.畫殘差圖或計算R2,進(jìn)行殘差分析.
(4)實際應(yīng)用.依據(jù)求得的回歸方程解決實際問題.
[跟蹤訓(xùn)練]
1.在一段時間內(nèi),某種商品的價格x元和需求量y件之間的一組數(shù)據(jù)為:
x(元)
14
4、
16
18
20
22
y(件)
12
10
7
5
3
且知x與y具有線性相關(guān)關(guān)系,求出y關(guān)于x的線性回歸方程,并說明擬合效果的好壞.
[解] =×(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
=142+162+182+202+222=1 660,
=122+102+72+52+32=327,
iyi=14×12+16×10+18×7+20×5+22×3=620,
所以===-1.15,
所以=7.4+1.15×18=28.1,
所以y對x的線性回歸方程為=-1.15x+28.1,
列出殘差表為
yi-i
0
5、
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
所以(yi-i)2=0.3,
(yi-)2=53.2,
R2=1-≈0.994.
所以R2≈0.994,擬合效果較好.
獨立性檢驗
戶外運動已經(jīng)成為一種時尚運動,某單位為了了解員工喜歡戶外運動是否與性別有關(guān),決定從本單位全體650人中采用分層抽樣的辦法抽取50人進(jìn)行問卷調(diào)查,得到了如下列聯(lián)表:
喜歡戶外運動
不喜歡戶外運動
總計
男性
5
女性
10
總計
50
已知在這50人中隨機抽取1人抽到喜歡戶外運動的員工的概率是
6、.
(1)請將上面的列聯(lián)表補充完整;
(2)求該公司男、女員工各多少人;
(3)在犯錯誤的概率不超過0.005的前提下能否認(rèn)為喜歡戶外運動與性別有關(guān)?并說明你的理由.
下面的臨界值表僅供參考:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(參考公式:K2=,其中
n=a+b+c+d)
【導(dǎo)學(xué)號:48662026】
[解] (1)因為在全部50人中隨機抽取1人抽到喜歡戶外運動的員工的概率是,
所以喜歡戶
7、外運動的男女員工共30人,其中男員工20人,列聯(lián)表補充如下:
喜歡戶外運動
不喜歡戶外運動
總計
男性
20
5
25
女性
10
15
25
總計
30
20
50
(2)該公司男員工人數(shù)為25÷50×650=325(人),則女員工有325人.
(3)K2的觀測值k=≈8.333>7.879,所以在犯錯誤的概率不超過0.005的前提下認(rèn)為喜歡戶外運動與性別有關(guān).
[規(guī)律方法] 獨立性檢驗問題的求解策略
(1)等高條形圖法:依據(jù)題目信息畫出等高條形圖,依據(jù)頻率差異來粗略地判斷兩個變量的相關(guān)性.
(2)K2統(tǒng)計量法:通過公式
先計算觀測值k,再與
8、臨界值表作比較,最后得出結(jié)論.
[跟蹤訓(xùn)練]
2.研究人員選取170名青年男女大學(xué)生的樣本,對他們進(jìn)行一種心理測驗.發(fā)現(xiàn)有60名女生對該心理測驗中的最后一個題目的反應(yīng)是:作肯定的有22名,否定的有38名;男生110名在相同的項目上作肯定的有22名,否定的有88名.問:性別與態(tài)度之間是否存在某種關(guān)系?分別用條形圖和獨立性檢驗的方法判斷.
[解] 建立性別與態(tài)度的2×2列聯(lián)表如下:
肯定
否定
總計
男生
22
88
110
女生
22
38
60
總計
44
126
170
根據(jù)列聯(lián)表中所給的數(shù)據(jù),可求出男生中作肯定態(tài)度的頻率為=0.2,女生中作肯定態(tài)度
9、的頻率為≈0.37.作等高條形圖如圖,其中兩個深色條形的高分別表示男生和女生中作肯定態(tài)度的頻率,比較圖中深色條形的高可以發(fā)現(xiàn),女生中作肯定態(tài)度的頻率明顯高于男生中作肯定態(tài)度的頻率,因此可以認(rèn)為性別與態(tài)度有關(guān)系.
根據(jù)列聯(lián)表中的數(shù)據(jù)得到K2的觀測值
k=≈5.622>5.024.
因此,在犯錯誤的概率不超過0.025的前提下認(rèn)為性別和態(tài)度有關(guān)系.
轉(zhuǎn)化與化歸思想
某種書每冊的成本費y(元)與印刷冊數(shù)x(千冊)有關(guān),經(jīng)統(tǒng)計得到數(shù)據(jù)如下:
x
1
2
3
5
10
20
30
50
100
200
y
10.15
5.52
4.08
2.85
2
10、.11
1.62
1.41
1.30
1.21
1.15
檢驗每冊書的成本費y與印刷冊數(shù)的倒數(shù)之間是否具有線性相關(guān)關(guān)系.如有,求出y對x的回歸方程.
思路探究:令z=,使問題轉(zhuǎn)化為z與y的關(guān)系,然后用回歸分析的方法,求z與y的回歸方程,進(jìn)而得出x與y的回歸方程.
[解] 把置換為z,則有z=,
從而z與y的數(shù)據(jù)為
z
1
0.5
0.333
0.2
0.1
0.05
0.033
0.02
0.01
0.005
y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
可作出散點圖(圖
11、略),從圖可看出,變換后的樣本點分布在一條直線的附近,因此可以用線性回歸方程來擬合.
=×(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1,
=×(10.15+5.52+4.08+…+1.15)=3.14,
=12+0.52+0.3332+…+0.012+0.0052≈1.415,
iyi=1×10.15+0.5×5.52+…+0.005×1.15
=15.221 02,
所以=≈8.976,
=-=3.14-8.976×0.225 1≈1.120,
所以所求的z與y的回歸方程為=8.976z+1.120.
又因
12、為z=,所以=+1.120.
[規(guī)律方法] 非線性回歸方程轉(zhuǎn)化為線性回歸問題求解步驟.
(1)確定變量,作出散點圖.
(2)根據(jù)散點圖,選擇恰當(dāng)?shù)臄M合函數(shù).
(3)變量置換,通過變量置換把非線性回歸問題轉(zhuǎn)化為線性回歸問題,并求出線性回歸方程.
(4)分析擬合效果:通過計算相關(guān)指數(shù)或畫殘差圖來判斷擬合效果.
(5)根據(jù)相應(yīng)的變換,寫出非線性回歸方程.
[跟蹤訓(xùn)練]
3.在某化學(xué)試驗中,測得如下表所示的6對數(shù)據(jù),其中x(單位:min)表示化學(xué)反應(yīng)進(jìn)行的時間,y(單位:mg)表示未轉(zhuǎn)化物質(zhì)的質(zhì)量.
x/min
1
2
3
4
5
6
y/mg
39.8
32.2
13、
25.4
20.3
16.2
13.3
(1)設(shè)y與x之間具有關(guān)系y=cdx,試根據(jù)測量數(shù)據(jù)估計c和d的值(精確到0.001);
(2)估計化學(xué)反應(yīng)進(jìn)行到10 min時未轉(zhuǎn)化物質(zhì)的質(zhì)量(精確到0.1).
【導(dǎo)學(xué)號:48662027】
[解] (1)在y=cdx兩邊取自然對數(shù),令ln y=z,ln c=a,lnd=b,則z=a+bx.由已知數(shù)據(jù),得
x
1
2
3
4
5
6
y
39.8
32.2
25.4
20.3
16.2
13.3
z
3.684
3.472
3.235
3.011
2.785
2.588
由公式得≈3.905 5,≈-0.221 9,則線性回歸方程為=3.905 5-0.221 9x.而ln c=3.905 5,lnD=-0.221 9,
故c≈49.675,d≈0.801,
所以c,d的估計值分別為49.675和0.801.
(2)當(dāng)x=10時,由(1)所得公式可得y≈5.4(mg).
所以,化學(xué)反應(yīng)進(jìn)行到10 min時未轉(zhuǎn)化物質(zhì)的質(zhì)量約為5.4 mg.
7