《高考數(shù)學(xué)一輪復(fù)習(xí) 第十章 概率、統(tǒng)計及統(tǒng)計案例 10.2 統(tǒng)計及統(tǒng)計案例課件 文》由會員分享,可在線閱讀,更多相關(guān)《高考數(shù)學(xué)一輪復(fù)習(xí) 第十章 概率、統(tǒng)計及統(tǒng)計案例 10.2 統(tǒng)計及統(tǒng)計案例課件 文(33頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第十章 概率、統(tǒng)計及統(tǒng)計案例高考文數(shù)高考文數(shù)10.2統(tǒng)計及統(tǒng)計案例統(tǒng)計及統(tǒng)計案例知識清單考點一抽樣方法考點一抽樣方法1.三種抽樣方法的比較2.分層抽樣中公式的運用抽樣比=.3.簡單隨機抽樣每次每個個體被抽到的概率都相等,都是 .在抽樣過程中,每個個體被抽到的概率都是 .樣本容量個體總量各層所抽取的個體數(shù)各層個體數(shù)量1NnN4.系統(tǒng)抽樣的步驟當(dāng)是整數(shù)時,(1)先將總體中每一個個體編號.(2)確定分段間隔k=,對編號進行分段.(3)在第一段用抽簽法確定第一個個體編號t(tk).(4)按照一定的規(guī)則抽取樣本,通常是抽取t,t+k,t+2k,t+(n-1)k.當(dāng)不是整數(shù)時,先隨機地從總體中剔除余數(shù)個個
2、體,然后按上述步驟進行.NnNnNn考點二頻率分布直方圖與莖葉圖考點二頻率分布直方圖與莖葉圖1.頻率分布直方圖的特征(1)各個小矩形的面積和為1.(2)縱軸的含義為,矩形的面積=組距=頻率.(3)樣本數(shù)據(jù)的平均數(shù)的估計值等于每個小矩形的面積乘矩形底邊中點橫坐標(biāo)之和.(4)眾數(shù)為最高矩形的底邊中點的橫坐標(biāo).2.莖葉圖的優(yōu)點莖葉圖的優(yōu)點是可以保留原始數(shù)據(jù),而且可以隨時記錄,這給數(shù)據(jù)的記錄和表示都帶來了方便.頻率組距頻率組距考點三樣本的數(shù)字特征考點三樣本的數(shù)字特征1.眾數(shù)、中位數(shù)、平均數(shù)2.方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差反映了數(shù)據(jù)波動程度的大小.(1)方差:s2=(x1-)2+(x2-)2+(xn-)2;
3、1nxxx(2)標(biāo)準(zhǔn)差:s=.注意:方差和標(biāo)準(zhǔn)差描述了一組數(shù)據(jù)與平均數(shù)的離散程度,反映了一組數(shù)據(jù)相對于平均數(shù)的波動情況,標(biāo)準(zhǔn)差和方差越大,說明這組數(shù)據(jù)的波動性越大.3.關(guān)于平均數(shù)、方差的有關(guān)性質(zhì)(1)若x1,x2,xn的平均數(shù)為,那么mx1+a,mx2+a,mxn+a的平均數(shù)為m+a.(2)數(shù)據(jù)x1,x2,xn與數(shù)據(jù)x1=x1+a,x2=x2+a,xn=xn+a的方差相等.(3)若x1,x2,xn的方差為s2,那么ax1+b,ax2+b,axn+b的方差為a2s2.222121()()() nxxxxxxnxx考點四變量間的相關(guān)性考點四變量間的相關(guān)性1.回歸直線方程為=+x,其中其中(,)為樣
4、本點的中心,=xi,=yi.2.樣本相關(guān)系數(shù)r=.如果|r|r0.05,那么表明有95%的把握認(rèn)為x與y具有線性相關(guān)關(guān)系.如果|r|r0.05,那么求回歸直線方程沒有意義.yab1122211()(),().nniiiiiinniiiixxyyx ynxybxxxnxaybxxyx1n1niy1n1ni1222211niiinniiiix ynxyxnxyny3.相關(guān)指數(shù):R2=1-.R2越大,模型的擬合效果越好;R2越小,模型的擬合效果越差.4.相關(guān)系數(shù)r.|r|1,表示兩個變量的線性相關(guān)性越強.|r|0,表明兩個變量之間幾乎不存在線性相關(guān)性.通常|r|0.75時,認(rèn)為兩個變量有很強的線性相
5、關(guān)性.2121()()niiiniiyyyy考點五獨立性檢驗考點五獨立性檢驗1.分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.2.列聯(lián)表:列出兩個分類變量的頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)如下:可構(gòu)造一個隨機變量K2=,其中n=a+b+c+d為樣本容量.3.獨立性檢驗利用獨立性假設(shè)、隨機變量K2來確定是否有一定把握認(rèn)為“兩個分類變量有關(guān)系”的方法稱為兩個分類變量的獨立性檢驗.兩個分類變量X和Y是否有關(guān)系的判斷標(biāo)準(zhǔn):統(tǒng)計學(xué)研究表明:當(dāng)K23.841時,認(rèn)為X與Y無關(guān);當(dāng)K23
6、.841時,有95%的把握說X與Y有關(guān);當(dāng)K26.635時,有99%的把握說X與Y有關(guān);當(dāng)K210.828時,有99.9%的把握說X與Y有關(guān).2()()()()()n adbcab cd ac bd系統(tǒng)抽樣與分層抽樣的特點及步驟系統(tǒng)抽樣與分層抽樣的特點及步驟1.系統(tǒng)抽樣(1)適用于元素個數(shù)很多且均衡的總體;(2)各個個體被抽到的機會均等;(3)總體分組后,在起始部分采用的是簡單隨機抽樣;(4)如果總體容量N能被樣本容量n整除,則抽樣間隔k=,如果總體容量N不能被樣本容量n整除,可隨機地從總體中剔除余數(shù)個個體,然后再按系統(tǒng)抽樣的方法抽樣.2.分層抽樣適用于由差異明顯的幾部分組成的總體,抽取的步驟
7、是:(1)按某種特征將總體分成若干部分.(2)按比例確定每層抽取的個體數(shù).Nn方法技巧方法1(3)各層按簡單隨機抽樣或系統(tǒng)抽樣的方法抽取個體.(4)綜合每層抽取的個體,組成樣本.例1(2016廣東肇慶三模,3)一個總體中有100個個體,隨機編號為0,1,2,99.依編號順序平均分成10個小組,組號依次為一,二,三,十.現(xiàn)用系統(tǒng)抽樣方法抽取一個容量為10的樣本,如果在第一組隨機抽取的號碼為m,那么在第k組中抽取的號碼個位數(shù)字與m+k的個位數(shù)字相同.若m=6,則在第七組中抽取的號碼是(A)A.63B.64C.65D.66解析若m=6,則在第7組中抽取的號碼個位數(shù)字與13的個位數(shù)字相同,而第7組中的
8、編號依次為60,61,62,63,69,故在第7組中抽取的號碼是63.頻率分布直方圖頻率分布直方圖1.小長方形的面積=組距=頻率.2.各小長方形的面積之和等于1.例2(2017安徽黃山二模,19)全世界越來越關(guān)注環(huán)境保護問題,某監(jiān)測站點于2016年8月某日起連續(xù)n天監(jiān)測空氣質(zhì)量指數(shù)(AQI),數(shù)據(jù)統(tǒng)計如下表:頻率組距方法2(1)根據(jù)所給統(tǒng)計表和頻率分布直方圖中的信息求出n,m的值,并完成頻率分布直方圖;(2)由頻率分布直方圖,求該組數(shù)據(jù)的平均數(shù)與中位數(shù);(3)在空氣質(zhì)量指數(shù)分別為(50,100和(150,200的監(jiān)測數(shù)據(jù)中,用分層抽樣的方法抽取5天,從中任意選取2天,求事件A“兩天空氣質(zhì)量等級
9、都為良”發(fā)生的概率.解析(1)0.00450=,n=100,20+40+m+10+5=100,m=25.=0.008;=0.005;=0.002;=0.001.由此完成頻率分布直方圖,如圖:20n40100 5025100 5010100 505100 50(2)由頻率分布直方圖得該組數(shù)據(jù)的平均數(shù)為250.00450+750.00850+1250.00550+1750.00250+2250.001 50=95,0,50的頻率為0.00450=0.2,(50,100的頻率為0.00850=0.4,中位數(shù)為50+50=87.5.(3)由題意知在空氣質(zhì)量指數(shù)為(50,100和(150,200的監(jiān)測天
10、數(shù)中分別抽取4天和1天,在所抽取的5天中,將空氣質(zhì)量指數(shù)為(50,100的4天分別記為a,b,c,d;將空氣質(zhì)量指數(shù)為(150,200的1天記為e,從中任取2天的基本事件為(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),共10個,0.50.20.4其中事件A“兩天空氣質(zhì)量等級都為良”包含的基本事件為(a,b),(a,c),(a,d),(b,c),(b,d),(c,d),共6個,所以P(A)=.61035樣本的數(shù)字特征樣本的數(shù)字特征1.利用頻率分布直方圖估計樣本的數(shù)字特征(1)在樣本數(shù)據(jù)的頻率分布直方圖中,眾數(shù)就是最高矩形底
11、邊中點的橫坐標(biāo).(2)在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等,由此可以估計中位數(shù)的值.(3)平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小矩形的面積與小矩形底邊中點的橫坐標(biāo)的積之和.2.平均數(shù):=;方差:s2=(x1-)2+(x2-)2+(xn-)2;x123nxxxxn1nxxx方法3標(biāo)準(zhǔn)差:s=.方差、標(biāo)準(zhǔn)差描述數(shù)據(jù)的離散程度.例3(2017湖北黃岡3月質(zhì)檢,7)已知數(shù)據(jù)x1,x2,x3,xn是某市n(n3,nN*)個普通職工的年收入,設(shè)這n個數(shù)據(jù)的中位數(shù)為x,平均數(shù)為y,方差為z,如果再加上世界首富的年收入xn+1,則這(n+1)個數(shù)據(jù)中,下列說法正確的
12、是(B)A.年收入平均數(shù)可能不變,中位數(shù)可能不變,方差可能不變B.年收入平均數(shù)大大增大,中位數(shù)可能不變,方差變大C.年收入平均數(shù)大大增大,中位數(shù)可能不變,方差也不變D.年收入平均數(shù)大大增大,中位數(shù)一定變大,方差可能不變222121()()() nxxxxxxn解析數(shù)據(jù)x1,x2,x3,xn是某市n(n3,nN*)個普通職工的年收入,xn+1為世界首富的年收入,則xn+1遠(yuǎn)大于x1,x2,x3,xn,故這(n+1)個數(shù)據(jù)中,年收入平均數(shù)大大增大;中位數(shù)可能不變,也可能稍微變大;由于數(shù)據(jù)的集中程度受到xn+1的影響比較大,更加離散,所以方差變大.回歸分析的應(yīng)用回歸分析的應(yīng)用分析兩個變量的相關(guān)關(guān)系時
13、,我們可根據(jù)樣本數(shù)據(jù)散點圖確定兩個變量之間是否存在相關(guān)關(guān)系,還可利用最小二乘法求出回歸直線方程.把樣本數(shù)據(jù)表示的點在直角坐標(biāo)系中作出,構(gòu)成的圖叫散點圖.從散點圖上,我們可以分析出兩個變量是否存在相關(guān)關(guān)系.如果這些點大致分布在通過散點圖中心的一條直線附近,那么就說這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線,直線方程叫做回歸直線方程.求回歸直線方程的步驟:(1)整理數(shù)據(jù),計算出,xiyi,.(2)計算回歸系數(shù),公式為1ni2ix1nixyab方法4(3)寫出回歸直線方程=x+.例4(2015重慶,17,13分)隨著我國經(jīng)濟的發(fā)展,居民的儲蓄存款逐年增長.設(shè)某地區(qū)城鄉(xiāng)居民人民幣儲蓄存款(年
14、底余額)如下表:1221,.niiiniix ynxybxnxaybxyba(1)求y關(guān)于t的回歸方程=t+;(2)用所求回歸方程預(yù)測該地區(qū)2015年(t=6)的人民幣儲蓄存款.附:回歸方程=t+中,=,=-.ybaybab1221niiiniit yntytntaybt解析(1)列表計算如下:這里n=5,=ti=3,=yi=7.2.又ltt=-n=55-532=10,lty=tiyi-n=120-537.2=12,從而=1.2,=-=7.2-1.23=3.6,2itt1n1ni155y1n1ni3651ni2it2t1nitybtyttll1210aybt故所求回歸方程為=1.2t+3.6.
15、(2)將t=6代入回歸方程可預(yù)測該地區(qū)2015年的人民幣儲蓄存款為=1.26+3.6=10.8(千億元).yy獨立性檢驗的思想方法獨立性檢驗的思想方法1.獨立性檢驗的思想來自于統(tǒng)計上的假設(shè)檢驗思想,它與反證法類似,它們都是先假設(shè)結(jié)論不成立,然后根據(jù)是否能推出“矛盾”來判定結(jié)論是否成立.但二者“矛盾”的含義不同,反證法中的“矛盾”是指不符合邏輯的事件發(fā)生;而假設(shè)檢驗中的“矛盾”是指不符合邏輯的小概率事件發(fā)生,即在結(jié)論不成立的假設(shè)下推出有利于結(jié)論成立的小概率事件的發(fā)生.2.獨立性檢驗的一般步驟:(1)獨立性檢驗原理只能解決兩個對象,每個對象有兩類屬性的問題,所以對于一個實際問題,我們要首先確定能否
16、用獨立性檢驗的思想加以解決;方法5(2)如果確實屬于這類問題,要科學(xué)地抽取樣本,樣本容量要適當(dāng),不可太小;(3)根據(jù)數(shù)據(jù)列出22列聯(lián)表;(4)提出假設(shè)H0:所研究的兩類對象(X、Y)無關(guān);(5)根據(jù)公式計算K2=的值;(6)比較觀測值k與臨界值表中相應(yīng)的檢驗水平,根據(jù)小概率原理肯定或者否定假設(shè),即判斷X、Y是否相關(guān).例5(2017安徽池州4月模擬,18)某職稱晉級評定機構(gòu)對參加某次專業(yè)技術(shù)考試的100人的成績進行了統(tǒng)計,繪制的頻率分布直方圖如圖所示.規(guī)定80分以上者晉級成功,否則晉級失敗(滿分為100分).2()()()()()n adbcab cd ac bd(1)求圖中a的值;(2)估計該
17、次考試的平均分(同一組中的數(shù)據(jù)用該組的區(qū)間中點值代表);(3)根據(jù)已知條件完成下面22列聯(lián)表,并判斷能否有85%的把握認(rèn)為“晉級成功”與性別有關(guān).x參考公式:K2=,其中n=a+b+c+d2()()()()()n adbcab cd ac bd解析(1)由頻率分布直方圖中各小長方形面積總和為1,得(2a+0.020+0.030+0.040)10=1,解得a=0.005.(2)由頻率分布直方圖知各小組的中點值依次是55,65,75,85,95,對應(yīng)的頻率分別為0.05,0.30,0.40,0.20,0.05,則估計該次考試的平均分為=550.05+650.3+750.4+850.2+95 0.05=74(分).(3)由頻率分布直方圖知,晉級成功的頻率為0.2+0.05=0.25,故晉級成功的人數(shù)為1000.25=25,填寫22列聯(lián)表如下:xK2=2.6132.072,所以有85%的把握認(rèn)為“晉級成功”與性別有關(guān).2100 (16 41 34 9)25 75 50 50