《用樣本的數(shù)字特征估計總體的數(shù)字特征 課件.ppt》由會員分享,可在線閱讀,更多相關《用樣本的數(shù)字特征估計總體的數(shù)字特征 課件.ppt(26頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、2.2.2 用樣本的數(shù)字特征估計總體的數(shù)字特征 一 、復習眾數(shù)、中位數(shù)、平均數(shù)的概念 2、中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個數(shù)據(jù)(或最中間兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù) 1、眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù) 眾數(shù)、中位數(shù)、平均數(shù)都是描述一組數(shù)據(jù)的集中趨勢的特征數(shù),只是描述的角度不同,其中以平均數(shù)的應用最為廣泛. 3、平均數(shù): 一般地,如果n個數(shù) ,那么, 叫做這n個數(shù)的平均數(shù)。 1 2, ,., nx x x1 21 ( . )nx x x xn 1、求下列各組數(shù)據(jù)的眾數(shù)(1)、1 ,2,3,3,3,5,5,8,8,8,9,9眾數(shù)是:3和8
2、(2)、1 ,2,3,3,3,5,5,8,8,9,9眾數(shù)是:32、求下列各組數(shù)據(jù)的中位數(shù)(1)、1 ,2,3,3,3,4,6,8,8,8,9,9(2)1 ,2,3,3,3,4,8,8,8,9,9中位數(shù)是:5中位數(shù)是:4 3、在一次中學生田徑運動會上,參加男子跳高的17名運動員的成績?nèi)缦卤硭荆撼煽?米) 150 160 165 170 175 180 185 190人數(shù)2 3 2 3 4 1 1 1分別求這些運動員成績的眾數(shù),中位數(shù)與平均數(shù) 。解:在17個數(shù)據(jù)中,1.75出現(xiàn)了4次,出現(xiàn)的次數(shù)最多,即這組數(shù)據(jù)的眾數(shù)是1.75上面表里的17個數(shù)據(jù)可看成是按從小到大的順序排列的,其中第9個數(shù)據(jù)1.
3、70是最中間的一個數(shù)據(jù),即這組數(shù)據(jù)的中位數(shù)是1.70;答:17名運動員成績的眾數(shù)、中位數(shù)、平均數(shù)依次是1.75(米)、1.70(米)、1.69(米)。 這組數(shù)據(jù)的平均數(shù)是 1 (1.50 2 1.60 3 . 1.90 1) 1.6917x 米 二 、怎么由頻率分布直方圖求眾數(shù),中位數(shù)和平均數(shù)? 例如,在上一節(jié)抽樣調(diào)查的100位居民的月均用水量的數(shù)據(jù)中,我們得知這一組樣本數(shù)據(jù)的 ,并畫出過這組數(shù)據(jù)的頻率分布直方圖.眾數(shù) =2.3(t)中位數(shù)=2.0(t)平均數(shù)=2.0(t)現(xiàn)在,觀察這組數(shù)據(jù)的頻率分布直方圖,能否得出這組數(shù)據(jù)的眾數(shù)、中位數(shù)和平均數(shù)?眾數(shù)、中位數(shù)和平均數(shù) 0.5 2.521.51
4、 43.53 4.5 頻率組距 歸納總結(jié)得: 因為在頻率分布直方圖中,各小長方形的面積表示相應各組的頻率,也顯示出樣本數(shù)據(jù)落在各小組的比例的大小,所以從圖中可以看到,在區(qū)間2,2.5)的小長方形的面積最大,即這組的頻率是最大的,也就是說月均用水量在區(qū)間2,2.5)內(nèi)的居民最多,即眾數(shù)就是在區(qū)間2,2.5)內(nèi)。 眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的中點的橫坐標。 0.5 2.521.51 43.53 4.5 頻率組距 2.25 0.5 2.521.51 43.53 4.5 頻率組距 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 提示:中位數(shù)
5、左邊的數(shù)據(jù)個數(shù)與右邊的數(shù)據(jù)個數(shù)是相等的。 0.5 2.521.51 43.53 4.5 頻率組距 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 前四個小矩形的面積和=0.49后四個小矩形的面積和=0.26 2.02 歸納總結(jié)得: 在樣本中,有50的個體小于或等于中位數(shù),也有50的個體大于或等于中位數(shù),因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應該相等,由此可以估計中位數(shù)的值。在這個頻率分布直方圖中,左邊的直方圖的面積代表50個單位,右邊的直方圖也是代表50個單位,它們的分界線與x軸交點的橫坐標就是中位數(shù)。 中位數(shù)在樣本數(shù)據(jù)的頻率分布直方
6、圖中,就是把頻率分布直方圖劃分左右兩個面積相等的分界線與x軸交點的橫坐標。 思考討論以下問題:1、2.02這個中位數(shù)的估計值,與樣本的中位數(shù)值2.0不一樣,你能解釋其中原因嗎?答:2.02這個中位數(shù)的估計值,與樣本的中位數(shù)值2.0不一樣,這是因為樣本數(shù)據(jù)的頻率分布直方圖,只是直觀地表明分布的形狀,但是從直方圖本身得不出原始的數(shù)據(jù)內(nèi)容,直方圖已經(jīng)損失一些樣本信息。所以由頻率分布直方圖得到的中位數(shù)估計值往往與樣本的實際中位數(shù)值不一致. 0.5 2.521.51 43.53 4.5 頻率組距 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 提示:在頻率分布直
7、方圖中,各個組的平均數(shù)如何找? 0.5 2.521.51 43.53 4.5 頻率組距 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02. . . . .0.75 1.75 2.25 2.75 3.25 3.75 4.251.250.5 提示:與小長方形面積的比例有關嗎? 0.5 2.521.51 43.53 4.5 頻率組距 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.022.02. . . . .0.75 1.75 2.25 2.75 3.25 3.75 4.251.250.5 總結(jié)歸納得: 平均數(shù)是頻率分布直
8、方圖的“重心”,是直方圖的平衡點。 先找出每個小長方形的“重心”,即每小組的平均數(shù),再按比例算出直方圖的平均數(shù)。 平均數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,等于頻率分布圖中每個小長方形面積乘以小矩形底邊中點的橫坐標之和。 總結(jié):眾數(shù):最高矩形的中點的橫坐標中位數(shù):在頻率分布直方圖中,中位數(shù)的左右兩邊的直方圖的面積相等,都為0.5平均數(shù):每個小矩形的面積乘以中點的橫坐標之和 三 、三種數(shù)字特征的優(yōu)缺點 1、眾數(shù)體現(xiàn)了樣本數(shù)據(jù)的最大集中點,但它對其它數(shù)據(jù)信息的忽視使得無法客觀地反映總體特征。 2、中位數(shù)是樣本數(shù)據(jù)所占頻率的等分線,它不受少數(shù)幾個極端值的影響,這在某些情況下是優(yōu)點,但它對極端值的不敏感有時
9、也會成為缺點。 3、平均數(shù)與每一個樣本的數(shù)據(jù)有關,與眾數(shù)、中位數(shù)比較起來,平均數(shù)可以反映出更多的關于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中的極端值的影響較大,而且越極端,對平均數(shù)的影響就越大。當樣本數(shù)據(jù)質(zhì)量較差時,用平均數(shù)來估計,可靠性不高,可能會與實際情況產(chǎn)生較大的誤差。 四、思考討論以下問題:1、樣本中位數(shù)不受少數(shù)極端值的影響,這在某些情況下是一個優(yōu)點,但它對極端值的不敏感有時也會成為缺點。你能舉例說明嗎?答:優(yōu)點:對極端數(shù)據(jù)不敏感的方法能夠有效地預防錯誤數(shù)據(jù)的影響。對極端值不敏感有利的例子:例如當樣本數(shù)據(jù)質(zhì)量比較差,即存在一些錯誤數(shù)據(jù)(如數(shù)據(jù)錄入錯誤、測量錯誤等)時,用抗極端數(shù)據(jù)強的中位數(shù)
10、表示數(shù)據(jù)的中心值更準確。 缺點:(1)出現(xiàn)錯誤的數(shù)據(jù)也不知道;(2)對極端值不敏感有弊的例子:某人具有初級計算機專業(yè)技術水平,想找一份收入好的工作。這時如果采用各個公司計算機專業(yè)技術人員收入的中位數(shù)作為選擇工作的參考指標就會冒這樣的風險:很可能所選擇公司的初級計算機專業(yè)技術水平人員的收入很低,其原因是中位數(shù)對極小的數(shù)據(jù)不敏感。這里更好的方法是同時用平均工資和中位數(shù)作為參考指標,選擇平均工資較高且中位數(shù)較大的公司就業(yè). 思考討論以下問題:3、“用數(shù)據(jù)說話”,這是我們經(jīng)常聽到的一句話。但是,數(shù)據(jù)有時也會被利用,從而產(chǎn)生誤導。例如,一個企業(yè)中,絕大多數(shù)人是一線工人,他們的年收入可能是一萬元左右,另有
11、一些經(jīng)理層次的人,年收入過到幾十萬元。這時年收入的平均數(shù)比中位數(shù)大得多。盡管這時的中位數(shù)比平均數(shù)更合理些,但是這個企業(yè)的老板到人力市場去招聘工人時,也許更可能用平均數(shù)來回答有關工次待遇的指問。 你認為“我們單位的收入水平比別的單位高”這句話應當怎么解釋? 答: 我認為這句話是這樣解釋的:這個企業(yè)的老板以員工平均工資收入水平去描述他們單位的收入情況。我覺得這是不合理的,因為這些員工當中,少數(shù)經(jīng)理層次的收入與大多數(shù)一般員工收入的差別比較大,所以平均數(shù)不能反映該單位員工的收入水平。這個老板的話有誤導與蒙騙行為。 課后練習 假設你是一名交通部門的工作人員,你打算向市長報告國家對本市26個公路項目投資的
12、平均資金數(shù)額,其中一條新公路的建設投資為2000萬元人民幣,另外25個項目的投資是20100萬元。中位數(shù)是25萬元,平均數(shù)是100萬元,眾數(shù)是20萬元。你會選擇哪一種數(shù)據(jù)特征來表示國家對每一個項目投資的平均金額?你選擇這種數(shù)字特征的缺點是什么? 答: 這里應該采用平均數(shù)來表示每一個國家項目的平均金額,因為這能反映所有項目的信息。但平均數(shù)會受到極端數(shù)據(jù)2000萬元的影響,所以大多數(shù)項目投資金額都和平均數(shù)相差比較大。 四.小結(jié)1.學習利用頻率直方圖估計總體的眾數(shù) 、中位數(shù)和平均數(shù)的方法。2.介紹眾數(shù)、中位數(shù)和平均數(shù)這三個特征數(shù)的優(yōu)點和缺點。3.學習如何利用眾數(shù)、中位數(shù)和平均數(shù)的特征去分析解決實際問題。