《高考數(shù)學(xué)理二輪復(fù)習(xí)教師用書:第1部分 重點強化專題 專題3 第7講 回歸分析、獨立性檢驗 Word版含答案》由會員分享,可在線閱讀,更多相關(guān)《高考數(shù)學(xué)理二輪復(fù)習(xí)教師用書:第1部分 重點強化專題 專題3 第7講 回歸分析、獨立性檢驗 Word版含答案(10頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、
高考數(shù)學(xué)精品復(fù)習(xí)資料
2019.5
第7講 回歸分析、獨立性檢驗
題型1 回歸分析
(對應(yīng)學(xué)生用書第23頁)
■核心知識儲備………………………………………………………………………
1.變量的相關(guān)性
(1)正相關(guān):在散點圖中,點散布在從左下角到右上角的區(qū)域.
(2)負相關(guān):在散點圖中,點散布在從左上角到右下角的區(qū)域.
(3)相關(guān)系數(shù)r:當r>0時,兩變量正相關(guān);當r<0時,兩變量負相關(guān);當|r|≤1且|r|越接近于1,相關(guān)程度越高,當|r|≤1且|r|越接近于0,相關(guān)程度越低.
2.線性回歸方程
方程=x
2、+稱為線性回歸方程,其中=,=-.(,)稱為樣本中心點.
■典題試解尋法………………………………………………………………………
【典題】 (20xx全國Ⅰ卷)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響.對近8年的年宣傳費xi和年銷售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.
圖71
表中wi=,w]=.
(1)根據(jù)散點圖判斷,y=a+bx與y=c+d哪一個適宜作為年銷售量y關(guān)于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判
3、斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;
(3)已知這種產(chǎn)品的年利潤z與x,y的關(guān)系為z=0.2y-x.根據(jù)(2)的結(jié)果回答下列問題:
①年宣傳費x=49時,年銷售量及年利潤的預(yù)報值是多少?
②年宣傳費x為何值時,年利潤的預(yù)報值最大?
【導(dǎo)學(xué)號:07804047】
附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其回歸直線v=α+βu的斜率和截距的最小二乘估計分別為,=-.
[解] (1)由散點圖可以判斷,y=c+d適宜作為年銷售量y關(guān)于年宣傳費x的回歸方程類型.
(2)令w=,先建立y關(guān)于w的線性回歸方程.
由于===68,
=- =563-686.
4、8=100.6,
所以y關(guān)于w的線性回歸方程為=100.6+68w,
因此y關(guān)于x的回歸方程為=100.6+68.
(3)①由(2)知,當x=49時,
年銷售量y的預(yù)報值=100.6+68=576.6,
年利潤z的預(yù)報值=576.60.2-49=66.32.
②根據(jù)(2)的結(jié)果知,年利潤z的預(yù)報值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以當==6.8,即x=46.24時,取得最大值.
故年宣傳費為46.24千元時,年利潤的預(yù)報值最大.
[類題通法]求線性回歸方程的步驟:
■對點即時訓(xùn)練………………………………………………………………………
5、
某品牌20xx款汽車即將上市,為了對這款汽車進行合理定價,某公司在某市五家4S店分別進行了兩天試銷售,得到如下數(shù)據(jù):
4S店
甲
乙
丙
丁
戊
單價x/萬元
18.0
18.6
18.2
18.8
18.4
19.0
18.3
18.5
18.5
18.7
銷量y/輛
88
78
85
75
82
66
82
78
80
76
(1)分別以五家4S店的平均單價與平均銷量為散點,求出單價與銷量的回歸直線方程=x+;
(2)在大量投入市場后,銷量與單價仍服從(1)中的關(guān)系,且該款汽車的成本為12萬元/輛,為使該款汽車獲得最大利潤,則該
6、款汽車的單價約為多少萬元(保留一位小數(shù))?
附:=,=-.
[解] (1)五家4S店的平均單價和平均銷量分別為(18.3,83),(18.5,80),(18.7,74),(18.4,80) ,(18.6,78),
∴==18.5,
==79,
∴===-20.
∴=-=79-(-20)18.5=79+370=449,
∴=-20x+449.
(2)設(shè)該款汽車的單價應(yīng)為x萬元,
設(shè)利潤f(x)=(x-12)(-20x+449)=-20x2+689x-5 388,
f′(x)=-40x+689,令-40x+689=0,解得x≈17.2,
故當x≈17.2時,f(x)取得最大值
7、.
∴要使該款汽車獲得最大利潤,該款汽車的單價約為17.2萬元.
■題型強化集訓(xùn)………………………………………………………………………
(見專題限時集訓(xùn)T1、T3、T5、T6、T7、T9、T10、T11、T12、T14)
題型2 獨立性檢驗
(對應(yīng)學(xué)生用書第24頁)
■核心知識儲備………………………………………………………………………
獨立性檢驗的步驟
(1)確定分類變量,獲取樣本頻數(shù),得到列聯(lián)表.
(2)求觀測值:k=.
(3)根據(jù)臨界值表,作出正確判斷.如果k≥kα,就推斷“X與Y有關(guān)系”,這種推斷犯錯誤的概率不超過α,否則就認為在犯錯誤的概率不超過α的前提下不能推斷“
8、X與Y有關(guān)系”.
■典題試解尋法………………………………………………………………………
【典題】 (20xx鄭州第一次質(zhì)量預(yù)測)人機大戰(zhàn)也引發(fā)全民對圍棋的關(guān)注,某學(xué)校社團為調(diào)查學(xué)生學(xué)習(xí)圍棋的情況,隨機抽取了100名學(xué)生進行調(diào)查.根據(jù)調(diào)查結(jié)果繪制的學(xué)生日均學(xué)習(xí)圍棋時間的頻率分布直方圖如圖72所示,將日均學(xué)習(xí)圍棋時間不低于40分鐘的學(xué)生稱為“圍棋迷”.
圖72
(1)根據(jù)已知條件完成下面的列聯(lián)表,并據(jù)此資料判斷是否有95%的把握認為“圍棋迷”與性別有關(guān)?
非圍棋迷
圍棋迷
合計
男
女
10
55
合計
(2)將上述調(diào)查所得到的頻率視為
9、概率.現(xiàn)在從該地區(qū)大量學(xué)生中,采用隨機抽樣方法每次抽取1名學(xué)生,抽取3次,記被抽取的3名學(xué)生中的“圍棋迷”人數(shù)為X.若每次抽取的結(jié)果是相互獨立的,求X的分布列,期望E(X)和方差D(X).
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.05
0.01
k0
3.841
6.635
[思路分析] (1)頻率分布直方圖22列聯(lián)表下結(jié)論;
(2)頻率計算二項分布計算E(X)、D(X).
[解] (1)由頻率分布直方圖可知,在抽取的100人中,“圍棋迷”有25人,
從而22列聯(lián)表如下:
非圍棋迷
圍棋迷
合計
男
30
15
45
女
45
10、10
55
合計
75
25
100
將22列聯(lián)表中的數(shù)據(jù)代入公式計算,得
K2==
=≈3.030,
因為3.030<3.841,所以沒有95%的把握認為“圍棋迷”與性別有關(guān).
(2)由頻率分布直方圖知抽到“圍棋迷”的頻率為0.25,將頻率視為概率,即從該地區(qū)學(xué)生中抽取一名“圍棋迷”的概率為.由題意知,X~B,從而X的分布列為
X
0
1
2
3
P
E(X)=3=,D(X)=3=.
[類題通法] 獨立性檢驗的方法
(1)在22列聯(lián)表中,如果兩個變量沒有關(guān)系,則應(yīng)滿足ad-bc≈0.|ad-bc|越小,說
11、明兩個變量之間關(guān)系越弱;|ad-bc|越大,說明兩個變量之間關(guān)系越強.
(2)解決獨立性檢驗的應(yīng)用問題,一定要按照獨立性檢驗的步驟進行求解.
■對點即時訓(xùn)練………………………………………………………………………
某課題組對全班45名同學(xué)的飲食習(xí)慣進行了一次調(diào)查,并用如圖73所示的莖葉圖表示45名同學(xué)的飲食指數(shù).說明:飲食指數(shù)低于70的人被認為喜食蔬菜,飲食指數(shù)不低于70的人被認為喜食肉類.
圖73
(1)根據(jù)莖葉圖,完成下面22列聯(lián)表,并判斷是否有90%的把握認為“喜食蔬菜還是喜食肉類與性別有關(guān)”,說明理由;
喜食蔬菜
喜食肉類
合計
男同學(xué)
女同學(xué)
12、
合計
(2)用分層抽樣的方法按照喜食蔬菜、喜食肉類從全班同學(xué)中隨機抽取15名同學(xué)進行進一步調(diào)查,記抽到的喜食肉類的女同學(xué)的人數(shù)為ξ,求ξ的分布列和數(shù)學(xué)期望E(ξ).
【導(dǎo)學(xué)號:07804048】
附:K2=.
P(K2≥k0)
0.10
0.05
0.01
k0
2.706
3.841
6.635
[解] (1)根據(jù)莖葉圖,完成的22列聯(lián)表如下:
喜食蔬菜
喜食肉類
合計
男同學(xué)
19
6
25
女同學(xué)
17
3
20
合計
36
9
45
計算得K2==0.562 5<2.706,
對照臨界值得出,沒有9
13、0%的把握認為“喜食蔬菜還是喜食肉類與性別有關(guān)”.
(2)因為從喜食肉類的同學(xué)中抽取的人數(shù)為9=3,所以ξ的可能取值有0,1,2,3.
P(ξ=0)==,
P(ξ=1)==,
P(ξ=2)==,
P(ξ=3)==.
所以ξ的分布列為
ξ
0
1
2
3
P
所以ξ的數(shù)學(xué)期望E(ξ)=0+1+2+3=1.
■題型強化集訓(xùn)………………………………………………………………………
(見專題限時集訓(xùn)T2、T4、T8、T13)
三年真題| 驗收復(fù)習(xí)效果
(對應(yīng)學(xué)生用書第26頁)
1.(20xx全國Ⅱ卷)根據(jù)下面給出的2004年至我國二氧化硫年排放量(單位
14、:萬噸)柱形圖,以下結(jié)論中不正確的是( )
圖74
A.逐年比較,減少二氧化硫排放量的效果最顯著
B.我國治理二氧化硫排放顯現(xiàn)成效
C.以來我國二氧化硫年排放量呈減少趨勢
D.以來我國二氧化硫年排放量與年份正相關(guān)
D [對于A選項,由圖知從到二氧化硫排放量下降得最多,故A正確.對于B選項,由圖知,由到矩形高度明顯下降,因此B正確.對于C選項,由圖知從以后除稍有上升外,其余年份都是逐年下降的,所以C正確.由圖知以來我國二氧化硫年排放量與年份負相關(guān),故選D.]
2.(20xx全國Ⅲ卷)如圖75所示,是我國至生活垃圾無害化處理量(單位:億噸)的折線圖.
圖75
注:年份代
15、碼1-7分別對應(yīng)年份2008-20xx.
(1)由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請用相關(guān)系數(shù)加以說明;
(2)建立y關(guān)于t的回歸方程(系數(shù)精確到0.01),預(yù)測我國生活垃圾無害化處理量.
【導(dǎo)學(xué)號:07804049】
參考數(shù)據(jù):yi=9.32,tiyi=40.17,=0.55,≈2.646.
參考公式:相關(guān)系數(shù)r=,回歸方程=+t中斜率和截距的最小二乘估計公式分別為=,=-.
[解] (1)由折線圖中的數(shù)據(jù)和附注中的參考數(shù)據(jù)得
=4, (ti-)2=28,=0.55,
(ti-)(yi-)=tiyi-yi=40.17-49.32=2.89,
所以r≈≈0.
16、99.
因為y與t的相關(guān)系數(shù)近似為0.99,說明y與t的線性相關(guān)程度相當大,從而可以用線性回歸模型擬合y與t的關(guān)系.
(2)由=≈1.331及(1)得
==≈0.103.
=-≈1.331-0.1034≈0.92.
所以y關(guān)于t的回歸方程為=0.92+0.10t.
將對應(yīng)的t=9代入回歸方程得=0.92+0.109=1.82.
所以預(yù)測我國生活垃圾無害化處理量約為1.82億噸.
3.(20xx全國Ⅱ卷)海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如76所示:
圖76
(
17、1)設(shè)兩種養(yǎng)殖方法的箱產(chǎn)量相互獨立,記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg,新養(yǎng)殖法的箱產(chǎn)量不低于50 kg”,估計A的概率;
(2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān);
箱產(chǎn)量<50 kg
箱產(chǎn)量≥50 kg
舊養(yǎng)殖法
新養(yǎng)殖法
(3)根據(jù)箱產(chǎn)量的頻率分布直方圖,求新養(yǎng)殖法箱產(chǎn)量的中位數(shù)的估計值(精確到0.01).
附:
K2=.
[解] (1)記B表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg”,C表示事件“新養(yǎng)殖法的箱產(chǎn)量不低于50 kg”.
由題意知P(A)=P(BC)=P(B)P(C).
舊養(yǎng)殖法的箱產(chǎn)
18、量低于50 kg的頻率為
(0.012+0.014+0.024+0.034+0.040)5=0.62,
故P(B)的估計值為0.62.
新養(yǎng)殖法的箱產(chǎn)量不低于50 kg的頻率為
(0.068+0.046+0.010+0.008)5=0.66,
故P(C)的估計值為0.66.
因此,事件A的概率估計值為0.620.66=0.409 2.
(2)根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表
箱產(chǎn)量<50 kg
箱產(chǎn)量≥50 kg
舊養(yǎng)殖法
62
38
新養(yǎng)殖法
34
66
K2=≈15.705.
由于15.705>6.635,故有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān).
(3)因為新養(yǎng)殖法的箱產(chǎn)量頻率分布直方圖中,箱產(chǎn)量低于50 kg的直方圖面積為
(0.004+0.020+0.044)5=0.34<0.5,
箱產(chǎn)量低于55 kg的直方圖面積為
(0.004+0.020+0.044+0.068)5=0.68>0.5,
故新養(yǎng)殖法產(chǎn)量的中位數(shù)的估計值為
50+≈52.35(kg).