《高一數(shù)學(xué)《用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征》.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《高一數(shù)學(xué)《用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征》.ppt(37頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、2.2 用樣本估計(jì)總體,.2.2用樣本的數(shù)字特征估計(jì)總體的 數(shù)字特征,問(wèn)題提出,1.對(duì)一個(gè)未知總體,我們常用樣本的頻率分布估計(jì)總體的分布,其中表示樣本數(shù)據(jù)的頻率分布的基本方法有哪些?,2.美國(guó)NBA在20062007年度賽季中,甲、乙兩名籃球運(yùn)動(dòng)員在隨機(jī)抽取的12場(chǎng)比賽中的得分情況如下: 甲運(yùn)動(dòng)員得分:12,15,20,25,31,31, 36,36,37,39,44,49. 乙運(yùn)動(dòng)員得分:8,13,14,16,23,26, 28,38,39,51,31,29.,如果要求我們根據(jù)上面的數(shù)據(jù),估計(jì)、比較甲,乙兩名運(yùn)動(dòng)員哪一位發(fā)揮得比較穩(wěn)定,就得有相應(yīng)的數(shù)據(jù)作為比較依據(jù),即通過(guò)樣本數(shù)據(jù)對(duì)
2、總體的數(shù)字特征進(jìn)行研究,用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征.,甲運(yùn)動(dòng)員得分:12,15,20,25,31,31, 36,36,37,39,44,49. 乙運(yùn)動(dòng)員得分:8,13,14,16,23,26, 28,38,39,51,31,29.,用樣本數(shù)字特征,估計(jì)總體數(shù)字特征,知識(shí)探究(一):眾數(shù)、中位數(shù)和平均數(shù),思考1:在初中我們學(xué)過(guò)眾數(shù)、中位數(shù)和平均數(shù)的概念,這些數(shù)據(jù)都是反映樣本信息的數(shù)字特征,對(duì)一組樣本數(shù)據(jù)如何求眾數(shù)、中位數(shù)和平均數(shù)?,思考2:在城市居民月均用水量樣本數(shù)據(jù)的頻率分布直方圖中,你認(rèn)為眾數(shù)應(yīng)在哪個(gè)小矩形內(nèi)?由此估計(jì)總體的眾數(shù)是什么?,,思考3:在頻率分布直方圖中,每個(gè)小
3、矩形的面積表示什么?中位數(shù)左右兩側(cè)的直方圖的面積應(yīng)有什么關(guān)系?,思考4:在城市居民月均用水量樣本數(shù)據(jù)的頻率分布直方圖中,從左至右各個(gè)小矩形的面積分別是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估計(jì)總體的中位數(shù)是什么?,,0.5-0.04-0.08-0.15-0.22=0.01,0.010.5=0.02,中位數(shù)是2+0.02=2.02.,思考5:平均數(shù)是頻率分布直方圖的“重心”,在城市居民月均用水量樣本數(shù)據(jù)的頻率分布直方圖中,各個(gè)小矩形的重心在哪里?從直方圖估計(jì)總體在各組數(shù)據(jù)內(nèi)的平均數(shù)分別為多少?,0.25,0.75,1.25,1.75,2.2
4、5, 2.75,3.25,3.75,4.25.,思考6:根據(jù)統(tǒng)計(jì)學(xué)中數(shù)學(xué)期望原理,將頻率分布直方圖中每個(gè)小矩形的面積與小矩形底邊中點(diǎn)的橫坐標(biāo)之積相加,就是樣本數(shù)據(jù)的估值平均數(shù). 由此估計(jì)總體的平均數(shù)是什么?,0.250.04+0.750.08+1.250.15+1.750.22+2.250.25+2.750.14+3.25 0.06+3.750.04+4.250.02=2.02(t). 平均數(shù)是2.02.,平均數(shù)與中位數(shù)相等,是必然還是巧合?,思考7:從居民月均用水量樣本數(shù)據(jù)可知,該樣本的眾數(shù)是2.3,中位數(shù)是2.0,平均數(shù)是1.973,這與我們從樣本頻率分布直方圖得出的結(jié)論有偏差,你能解釋
5、一下原因嗎?,頻率分布直方圖損失了一些樣本數(shù)據(jù),得到的是一個(gè)估計(jì)值,且所得估值與數(shù)據(jù)分組有關(guān).,注:在只有樣本頻率分布直方圖的情況下,我們可以按上述方法估計(jì)眾數(shù)、中位數(shù)和平均數(shù),并由此估計(jì)總體特征.,思考8:一組數(shù)據(jù)的中位數(shù)一般不受少數(shù)幾個(gè)極端值的影響,這在某些情況下是一個(gè)優(yōu)點(diǎn),但它對(duì)極端值的不敏感有時(shí)也會(huì)額成為缺點(diǎn),你能舉例說(shuō)明嗎?樣本數(shù)據(jù)的平均數(shù)大于(或小于)中位數(shù)說(shuō)明什么問(wèn)題?你怎樣理解“我們單位的收入水平比別的單位高”這句話的含義?,,如:樣本數(shù)據(jù)收集有個(gè)別差錯(cuò)不影響中位數(shù);大學(xué)畢業(yè)生憑工資中位數(shù)找單位可能收入較低. 平均數(shù)大于(或小于)中位數(shù),說(shuō)明樣本數(shù)據(jù)中存在許多較大(或較?。┑?/p>
6、極端值. 這句話具有模糊性甚至蒙騙性,其中收入水平是員工工資的某個(gè)中心點(diǎn),它可以是眾數(shù)、中位數(shù)或平均數(shù).,知識(shí)探究(二):標(biāo)準(zhǔn)差,樣本的眾數(shù)、中位數(shù)和平均數(shù)常用來(lái)表示樣本數(shù)據(jù)的“中心值”,其中眾數(shù)和中位數(shù)容易計(jì)算,不受少數(shù)幾個(gè)極端值的影響,但只能表達(dá)樣本數(shù)據(jù)中的少量信息. 平均數(shù)代表了數(shù)據(jù)更多的信息,但受樣本中每個(gè)數(shù)據(jù)的影響,越極端的數(shù)據(jù)對(duì)平均數(shù)的影響也越大.當(dāng)樣本數(shù)據(jù)質(zhì)量比較差時(shí),使用眾數(shù)、中位數(shù)或平均數(shù)描述數(shù)據(jù)的中心位置,可能與實(shí)際情況產(chǎn)生較大的誤差,難以反映樣本數(shù)據(jù)的實(shí)際狀況,因此,我們需要一個(gè)統(tǒng)計(jì)數(shù)字刻畫(huà)樣本數(shù)據(jù)的離散程度.,思考1:在一次射擊選拔賽中,甲、乙兩名運(yùn)動(dòng)員各射擊10次,
7、每次命中的環(huán)數(shù)如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 甲、乙兩人本次射擊的平均成績(jī)分別為多少環(huán)?,,,思考2:甲、乙兩人射擊的平均成績(jī)相等,觀察兩人成績(jī)的頻率分布條形圖,你能說(shuō)明其水平差異在那里嗎?,環(huán)數(shù),甲的成績(jī)比較分散,極差較大,乙的成績(jī)相對(duì)集中,比較穩(wěn)定.,環(huán)數(shù),思考3:對(duì)于樣本數(shù)據(jù)x1,x2,,xn,設(shè)想通過(guò)各數(shù)據(jù)到其平均數(shù)的平均距離來(lái)反映樣本數(shù)據(jù)的分散程度,那么這個(gè)平均距離如何計(jì)算?,,思考4:反映樣本數(shù)據(jù)的分散程度的大小,最常用的統(tǒng)計(jì)量是標(biāo)準(zhǔn)差,一般用s表示.假設(shè)樣本數(shù)據(jù)x1,x2,,xn的平均數(shù)為,則標(biāo)準(zhǔn)差的計(jì)算公式是:,
8、,那么標(biāo)準(zhǔn)差的取值范圍是什么?標(biāo)準(zhǔn)差為0的樣本數(shù)據(jù)有何特點(diǎn)?,s0,標(biāo)準(zhǔn)差為0的樣本數(shù)據(jù)都相等.,標(biāo)準(zhǔn)差越大離散程度越大,數(shù)據(jù)較分散;標(biāo)準(zhǔn)差越小離散程度越小,數(shù)據(jù)較集中在平均數(shù)周?chē)?,知識(shí)遷移,s甲=2,s乙=1.095.,2.2 用樣本估計(jì)總體,.2.2用樣本的數(shù)字特征估計(jì)總體的 數(shù)字特征2,知識(shí)回顧,1.如何根據(jù)樣本頻率分布直方圖,分別估計(jì)總體的眾數(shù)、中位數(shù)和平均數(shù)?,(1)眾數(shù):最高矩形下端中點(diǎn)的橫坐標(biāo).,(2)中位數(shù):直方圖面積平分線與橫軸交點(diǎn)的橫坐標(biāo).,(3)平均數(shù):每個(gè)小矩形的面積與小矩形底邊中點(diǎn)的橫坐標(biāo)的乘積之和.,2.對(duì)于樣本數(shù)據(jù)x1,x2,,xn,其標(biāo)準(zhǔn)差如何計(jì)算?,樣本數(shù)字
9、特征例題分析,知識(shí)補(bǔ)充,1.標(biāo)準(zhǔn)差的平方s2稱(chēng)為方差,有時(shí)用方差代替標(biāo)準(zhǔn)差測(cè)量樣本數(shù)據(jù)的離散度.方差與標(biāo)準(zhǔn)差的測(cè)量效果是一致的,在實(shí)際應(yīng)用中一般多采用標(biāo)準(zhǔn)差.,2.現(xiàn)實(shí)中的總體所包含的個(gè)體數(shù)往往很多,總體的平均數(shù)與標(biāo)準(zhǔn)差是未知的,我們通常用樣本的平均數(shù)和標(biāo)準(zhǔn)差去估計(jì)總體的平均數(shù)與標(biāo)準(zhǔn)差,但要求樣本有較好的代表性.,,,3.對(duì)于城市居民月均用水量樣本數(shù)據(jù),其平均數(shù) ,標(biāo)準(zhǔn)差s=0.868. 在這100個(gè)數(shù)據(jù)中, 落在區(qū)間( -s, +s)=1.105,2.841外的有28個(gè); 落在區(qū)間( -2s, +2s)=0.237,3.709外的只有4個(gè); 落在區(qū)間( -3s, +3s)=-0.631,
10、4.577外的有0個(gè).,,,一般地,對(duì)于一個(gè)正態(tài)總體,數(shù)據(jù)落在區(qū)間( -s, +s)、 ( -2s, +2s)、( -3s, +3s)內(nèi)的百分比分別為68.3%、95.4%、99.7%,這個(gè)原理在產(chǎn)品質(zhì)量控制中有著廣泛的應(yīng)用(參考教材P79“閱讀與思考”).,例題分析,例1 畫(huà)出下列四組樣本數(shù)據(jù)的條形圖, 說(shuō)明他們的異同點(diǎn). (1) ,,,,,,,,; (2) ,,,,,,,,;,,,,,,,(3) ,,,,,,,,; (4) ,,,,,,,,.,,,,,,,,,,例2 甲、乙兩人同時(shí)生產(chǎn)內(nèi)徑為25.40mm的一種零件,為了對(duì)兩人的生產(chǎn)質(zhì)量進(jìn)行評(píng)比,從他們生產(chǎn)的零件中各隨機(jī)抽取20件,量得
11、其內(nèi)徑尺寸如下(單位:mm):,甲 : 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39,乙: 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48,從生產(chǎn)零件內(nèi)徑的尺寸看,誰(shuí)生產(chǎn)的零件質(zhì)量較高?,,,,,甲生產(chǎn)的零件內(nèi)徑更
12、接近內(nèi)徑標(biāo)準(zhǔn),且穩(wěn)定程度較高,故甲生產(chǎn)的零件質(zhì)量較高.,說(shuō)明:1.生產(chǎn)質(zhì)量可以從總體的平均數(shù)與標(biāo)準(zhǔn)差兩個(gè)角度來(lái)衡量,但甲、乙兩個(gè)總體的平均數(shù)與標(biāo)準(zhǔn)差都是不知道的,我們就用樣本的平均數(shù)與標(biāo)準(zhǔn)差估計(jì)總體的平均數(shù)與標(biāo)準(zhǔn)差. 2.問(wèn)題中25.40mm是內(nèi)徑的標(biāo)準(zhǔn)值,而不是總體的平均數(shù).,例3 以往招生統(tǒng)計(jì)顯示,某所大學(xué)錄取的新生高考總分的中位數(shù)基本穩(wěn)定在550分,若某同學(xué)今年高考得了520分,他想報(bào)考這所大學(xué)還需收集哪些信息?,要點(diǎn):(1)查往年錄取的新生的平均分?jǐn)?shù).若平均數(shù)小于中位數(shù)很多,說(shuō)明最低錄取線較低,可以報(bào)考; (2)查往年錄取的新生高考總分的標(biāo)準(zhǔn)差.若標(biāo)準(zhǔn)差較大,說(shuō)明新生的錄取分?jǐn)?shù)較分散
13、,最低錄取線可能較低,可以考慮報(bào)考.,例4 在去年的足球甲A聯(lián)賽中,甲隊(duì)每場(chǎng)比賽平均失球數(shù)是1.5,全年比賽失球個(gè)數(shù)的標(biāo)準(zhǔn)差為1.1;乙隊(duì)每場(chǎng)比賽平均失球數(shù)是2.1,全年比賽失球個(gè)數(shù)的標(biāo)準(zhǔn)差為0.4.你認(rèn)為下列說(shuō)法是否正確,為什么? (1)平均來(lái)說(shuō)甲隊(duì)比乙隊(duì)防守技術(shù)好; (2)乙隊(duì)比甲隊(duì)技術(shù)水平更穩(wěn)定; (3)甲隊(duì)有時(shí)表現(xiàn)很差,有時(shí)表現(xiàn)又非常 好; (4)乙隊(duì)很少不失球.,例5 有20種不同的零食,它們的熱量含量如下: 110 120 123 165 432 190 174 235 428 318 249 280 162 146 210 120 123 120 150 140,(1)以上
14、20個(gè)數(shù)據(jù)組成總體,求總體平均數(shù)與總體標(biāo)準(zhǔn)差; (2)設(shè)計(jì)一個(gè)適當(dāng)?shù)碾S機(jī)抽樣方法,從總體中抽取一個(gè)容量為7的樣本,計(jì)算樣本的平均數(shù)和標(biāo)準(zhǔn)差.,(1)總體平均數(shù)為199.75,總體標(biāo)準(zhǔn)差為95.26.,(1)以上20個(gè)數(shù)據(jù)組成總體,求總體平均數(shù)與總體標(biāo)準(zhǔn)差; (2)設(shè)計(jì)一個(gè)適當(dāng)?shù)碾S機(jī)抽樣方法,從總體中抽取一個(gè)容量為7的樣本,計(jì)算樣本的平均數(shù)和標(biāo)準(zhǔn)差.,(2)可以用抽簽法抽取樣本,樣本的平均數(shù)和標(biāo)準(zhǔn)差與抽取的樣本有關(guān).,小結(jié)作業(yè),1.對(duì)同一個(gè)總體,可以抽取不同的樣本,相應(yīng)的平均數(shù)與標(biāo)準(zhǔn)差都會(huì)發(fā)生改變.如果樣本的代表性差,則對(duì)總體所作的估計(jì)就會(huì)產(chǎn)生偏差;如果樣本沒(méi)有代表性,則對(duì)總體作出錯(cuò)誤估計(jì)的可能性就非常大,由此可見(jiàn)抽樣方法的重要性.,2.在抽樣過(guò)程中,抽取的樣本是具有隨機(jī)性的,如從一個(gè)包含6個(gè)個(gè)體的總體中抽取一個(gè)容量為3的樣本就有20中可能抽樣,因此樣本的數(shù)字特征也有隨機(jī)性. 用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征,是一種統(tǒng)計(jì)思想,沒(méi)有惟一答案.,3.在實(shí)際應(yīng)用中,調(diào)查統(tǒng)計(jì)是一個(gè)探究性學(xué)習(xí)過(guò)程,需要做一系列工作,我們可以把學(xué)到的知識(shí)應(yīng)用到自主研究性課題中去.,作業(yè): 學(xué)法大視野第8課時(shí),