抽樣調查-多階段抽樣培訓課件
《抽樣調查-多階段抽樣培訓課件》由會員分享,可在線閱讀,更多相關《抽樣調查-多階段抽樣培訓課件(47頁珍藏版)》請在裝配圖網上搜索。
1、返回8.1 引 言 前面提到的整群抽樣雖然前面提到的整群抽樣雖然有很多優(yōu)點,但是由于群內單有很多優(yōu)點,但是由于群內單元通常具有相似性(表現(xiàn)為群元通常具有相似性(表現(xiàn)為群內相關系數(shù)大于零)。尤其是內相關系數(shù)大于零)。尤其是當群比較大時,人們自然會想當群比較大時,人們自然會想到沒有必要對群內所有單元都到沒有必要對群內所有單元都進行調查,而只要對群內單元進行調查,而只要對群內單元進行再抽樣,對被抽中的單元進行再抽樣,對被抽中的單元進行調查,這就是常用的多階進行調查,這就是常用的多階段抽樣。段抽樣。返回一、多階段抽樣的定義 先在總體單元(初級單元)中抽出樣本單先在總體單元(初級單元)中抽出樣本單元,并
2、不對這個樣本單元中的所有下一級單元元,并不對這個樣本單元中的所有下一級單元(二級單元)都進行調查,而是在其中再抽出若(二級單元)都進行調查,而是在其中再抽出若干個二級單元并進行調查。干個二級單元并進行調查。這種抽樣方法稱為二階段抽樣。同樣的道這種抽樣方法稱為二階段抽樣。同樣的道理,還可以有三階段抽樣、四階段抽樣等。對于理,還可以有三階段抽樣、四階段抽樣等。對于二階段以上的抽樣,二階段以上的抽樣,統(tǒng)稱為統(tǒng)稱為多階段抽樣多階段抽樣。返回二、多階段抽樣的優(yōu)點(1)(1)多階段抽樣保持了整群抽樣的樣本比較集中、多階段抽樣保持了整群抽樣的樣本比較集中、便于調查、節(jié)約費用等優(yōu)點。便于調查、節(jié)約費用等優(yōu)點。
3、(2)(2)多階段抽樣不需要編制所有小單元的樣本框。多階段抽樣不需要編制所有小單元的樣本框。三、抽選方法與推斷原理 多階段抽樣時,每一個階段的抽樣可以相同,也多階段抽樣時,每一個階段的抽樣可以相同,也可以不同。它通常與分層抽樣、整群抽樣、系統(tǒng)抽樣可以不同。它通常與分層抽樣、整群抽樣、系統(tǒng)抽樣結合使用。多階段抽樣時,抽樣是分步進行的,因此,結合使用。多階段抽樣時,抽樣是分步進行的,因此,討論估計量的均值及其方差時,需要分階段進行這要討論估計量的均值及其方差時,需要分階段進行這要用到下面的性質用到下面的性質。返回性質1 對于兩階段抽樣,有式中,式中,為在固定初級單元時對第二階抽樣求均為在固定初級單
4、元時對第二階抽樣求均值和方差;值和方差;為對第一階抽樣求均值和方差。為對第一階抽樣求均值和方差。性質性質1 1可以推廣到多階段抽樣的情形,例如可以推廣到多階段抽樣的情形,例如對于三階段抽樣,有對于三階段抽樣,有返回8.2 初級單元大小相等的二階抽樣第一階段在總體第一階段在總體N N個初級單元中,以簡單隨機個初級單元中,以簡單隨機抽樣抽取抽樣抽取n n個初級單元,第二階段在被抽中的初級個初級單元,第二階段在被抽中的初級單元包含的單元包含的M M個二級單元中,以簡單隨機抽樣抽取個二級單元中,以簡單隨機抽樣抽取m m個二級單元,即最終接受調查的單元個二級單元,即最終接受調查的單元。例如:某個新開發(fā)的
5、小區(qū)擁有相同戶型的例如:某個新開發(fā)的小區(qū)擁有相同戶型的1515個個單元的樓盤,居民已經陸續(xù)搬入新居,每個單元住單元的樓盤,居民已經陸續(xù)搬入新居,每個單元住有有1212戶居民,為調查居民家庭裝修情況,準備從戶居民,為調查居民家庭裝修情況,準備從180180戶居民戶中抽取戶居民戶中抽取2020戶進行調查。如下表:戶進行調查。如下表:返回編號單 元 房 號123456789101112131415一棟A座一棟B座一棟C座二棟A座二棟B座二棟C座三棟A座三棟B座三棟C座四棟A座四棟B座四棟C座五棟A座五棟B座五棟C座 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8
6、 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9
7、10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 返回表中紅字為抽中的房號。這時,初級單元有15個,每個初級單元擁有二級單元12個。首先將單元從1到15編號,在15單元中隨機抽取5個單元,分別是1,6,9,12,13號;然后在被抽中的單元中,進行第二次抽樣,即分別在12戶居民戶中隨機抽取4戶。一、符號說明初級單元和初級單元擁有的二級單元個數(shù):N,M第一階段和第二階段抽樣的樣本量:n ,m 第i個初級單元中的第j個二級單元的觀測值:樣本中第i個初級單元中的第j個二級單元的觀測值:返回第一階段和第二階段的抽樣比:第i個初
8、級 單 元 按二級單元的平均 值:按二級單元的平均值:初級單元間的方差:返回初級單元內的方差:由 的表達式可知,若記則有即 是 的平均值。同理有返回二、估計量及其性質(一)總體均值的估計性質2 對于初級單元大小相等的二階抽樣,如果兩個階段都是簡單隨機抽樣,且對每個初級單元,第二階抽樣是相互獨立進行的,則對總體均值 的無偏估計為:其方差為:的無偏估計為:返回【例8.1】欲調查4月份100家企業(yè)的某項指標,首先從100家企業(yè)中抽取了一個有板有5家樣本企業(yè)的簡單隨機樣本,調查人員對5家企業(yè)分別在調查月內隨機抽取3天作為調查日,要求樣本企業(yè)只填寫這3天的流水帳。調查的結果如下。樣 本 企 業(yè)第一日第二
9、日第三日12345573851486259416053556450634954要求根據(jù)這些數(shù)據(jù)推算不100家企業(yè)該指標的總量,并給出估計的95%置信區(qū)間。返回解 將企業(yè)作為初級單元,將每一天看著二級單元。調查月內擁有30天(即擁有30個二級單元)。首先在初級單元中抽取一個n=5的簡單隨機樣本再對每個樣本的二級單元分別獨立抽取一個m=3的簡單隨機樣本由題意,N=100,M=30,n=5,m=3首先計算樣本初級單元的均值 、方差 :返回樣 本 企 業(yè)123456043585057133939719于是得到:返回 置信度為置信度為95%95%的置信區(qū)間為:的置信區(qū)間為:1608001.9692161
10、608001.969216在上面的方差估計式中,第一項是主要的,第二項在上面的方差估計式中,第一項是主要的,第二項要小得多要小得多!返回(二)對總體比例的估計 如果要估計總體中具有所研究特征的二級單元數(shù)占全體全體二級單元數(shù)的比例,則式中,為第i個初級單元中具有所研究特征的二級單元數(shù),則對P的估計為:式中,為第i個初級單元中具有所研究特征的二級單元數(shù)。返回性質3 對于二階抽樣,如果兩個階段都是簡單隨機抽樣,則有估計量 的方差為:的無偏估計為:式中,返回【例8.2】欲調查某個新小區(qū)居民家庭裝潢聘請裝潢公司的比例。我們在15個單元中隨機抽取了5個單元,在這5個單元分別隨機抽取了4戶居民進行調查,對這
11、20戶的調查結果如下表:樣本單元第一戶第二戶第三戶第四戶一棟A座二棟C座三棟C座四棟C座五棟B座是否否否是是是否否否否否否否否否否是否否要求根據(jù)這些數(shù)據(jù)推算居民家庭裝潢聘請裝潢公司的比例。返回解:記聘請裝潢公司的居民戶為“1”,否則記為“0”。這里,N=15,M=12,n=5,m=4 ,因此,其方差的估計為:P的置信區(qū)間為:返回8.3 初級單元大小不等的二階抽樣 一般而言,初級單元的大小是不相等的,如果按初級單元的大小分層后,層內初級單元的大小差別仍很大,則需用本節(jié)介紹的方法來處理二階抽樣的問題。當初級單元大小不等時,一般采用不等概抽樣。一、符號說明總體中初級單元個數(shù)及第一階抽取的樣本量:N,
12、n第i個初級單元中二級單元數(shù):第i個初級單元中第二階抽樣的樣本量:第i個初級單元中第j個二級單元的觀測值:樣本中第i個初級單元中第j個二級單元的觀測值:返回第一階和第二階的抽樣比:二級單元個數(shù):指標總和:第i個初級單元指標總和:第i個初級單元按二級單元的平均值:返回按二級單元的平均值:初級單元間的方差:第i個初級單元二級單元間的方差:返回二、估計量及其性質(一)對初級單元進行簡單隨機抽樣如果二階抽樣中每個階段都采用簡單隨機抽樣,并且每個初級單元中二級單元的抽樣是相互獨立的,則對總體總和的估計可以采用簡單估計,也可以考慮采用比率估計。1.簡單估計量 對總體總和的簡單估計為:根據(jù)性質1,不僅可以證
13、明這個估計量是無偏的,并且它的方差為:返回的一個無偏估計為:式中,返回2.比率估計量 由于初級單元的大小 不同,往往造成初級單元的觀測值 差異很大,使得估計量方差 的第一項很大,從而估計量的方差也就變得很大。這時,可以考慮將初級單元的大小 作為輔助變量,采用比率估計量對總體總和進行估計。對總體總和的估計量為:返回 這是一個有偏估計量,但隨著樣本量的增加,其偏倚將趨于零。其近似均方誤差為:返回的樣本估計為:式中,返回(二)對初級單元進行放回不等概抽樣利用第五章的方法,事先規(guī)定每個初級單元被抽中的概率 對被抽中的初級單元,再抽取個二級單元。對總體總和的估計通常是構造初級單元指標總量的無偏估計 ,然
14、后利用第五章介紹的Hansen-HuRwitz估計量對總體總量Y進行估計。由于 是 的無偏估計,由性質1,可以證明是Y的無偏估計。且 的方差為:返回的一個無偏估計為:注意上述對第二階抽樣并沒有做出特別的規(guī)定,而且估計量的方差估計式與第二階抽樣的方式無關。在實際工作中,如果初級單元大小不相等,通常人們喜歡在第一階抽樣時按放回的與二級單元數(shù)成比例的不等概抽樣;第二階抽樣則采用簡單隨機抽樣,且每個樣本初級單元的樣本量都相等,此時,估計量的形式非常簡單。返回 【例8.3】某小區(qū)擁有10座高層建筑,每座高層建筑擁有的樓層數(shù)如下表:高層建筑ABCDEFGHIJ樓層1212161510161018 16 2
15、0 用二階抽樣方法抽出10個樓層進行調查,第一階抽樣為放回的、按與每座建筑擁有的樓層數(shù)成比例的不等概抽樣抽取5座建筑,第二階按簡單隨機抽樣對每座建筑抽取兩層。對10個樓層居民人數(shù)的調查結果如下表:一階樣本序號12345居民數(shù)18,1215,1819,1316,1016,11返回解:已知 n=5,m=2,注意到這個樣本是自加權的,根據(jù)P181公式(8.29),得估計量的方差為:=9776.625估計量的標準差為:返回(三)對初級單元進行不放回不等概抽樣 不放回不等概抽樣的效率比放回的效率高,因此,有時人們也會傾向于用不放回不等概抽樣來抽取初級單元。這時可利用第五章介紹的不放回不等概抽樣的結果對總
16、體總量進行推算。當然估計量的推算比較復雜。對總體總量Y的估計可以采用Horvitz-Thompson(赫魏茲-湯普森)估計。返回8.4 其他問題一、總樣本量及最優(yōu)樣本量的配置 對于二階抽樣,應該抽多少二級單元,即確定n m為多少,一般可采用兩種方法:1.根據(jù)調查費用,確定可以調查的樣本量。2.根據(jù)簡單隨機抽樣時應抽樣本量,再乘以設計 效應deff獲得。由于影響精度的主要原因是初級單元之間的差異,所以多抽一些初級單元,少抽一些二級單元較好。但往往初級單元的調查費用比二級單元要高。返回考慮費用函數(shù)為最簡單的一種形式:式中,為與樣本量無關的固定費用,如公司的辦公費、場租費等;為每調查一個初級單元的費
17、用;為每調查一個二級單元的費用。則 m 的最優(yōu)值為:式中,實際使用時,m 應為整數(shù),但計算出的 往往不是整數(shù),令 為的 整數(shù)部分,則m的取值規(guī)則為:返回 求出m之后,根據(jù)總費用函數(shù),就可以確定n,從而確定最優(yōu)抽樣比 和返回二、三階及多階抽樣(一)各級單元大小相等的多階段抽樣 如果總體擁有N個初級單元,每個初級單元擁有M個二級單元,每個二級單元又擁有K個三級單元,各階的樣本量分別為 n,m,k,每個階段都按簡單隨機抽樣,則三級單元總體均值的估計為:其方差為:方差的無偏估計為:返回 由于方差的主要項為第一項,其次為第二項,第三項幾乎可以忽略。所以對于更高階的抽樣,估計量的方差計算一般只計算到第二階
18、至第三階就可以了。(二)各級單元大小不相等時的多階段抽樣(略)返回(三)多階抽樣的實例 某調查公司接受了一項關于全國城市成年居民人均奶制品消費支出及每天至少喝一杯鮮奶人數(shù)的比例情況的調查。確定抽樣范圍為全國地級及以上城市中的成年居民。成年居民指年滿18周歲以上的居民。第一步:確定抽樣方式。調查公司決定采用多階段抽樣方法進行方案設計,調查的最小單元為成年居民。確定調查的各個階段為城市、街道、居委會、居民戶,在居民中利用而維隨機表抽取成年居民。第二步:確定樣本量及各階段樣本量的分配。按簡單隨機抽樣,在95%置信度下,絕對誤差為5%取使方差達到最大的比例P=0.5,則全國樣本量為:返回 根據(jù)以往調查
19、經驗,估計回答率為b=80%,因此調整樣本量為:多階段抽樣的效率比簡單隨機抽樣的效率低,這里取設計效率為deff=3.2,則在全國范圍內應調查的樣本量為:各階段的樣本量配置為:初級單元:20個城市;二級單元:80個街道,每個樣本市內抽4個街道;返回三級單元:160個居委會,每個樣本街道內抽2個居委會;四級單元:1600個居民戶,每個樣本居委會內抽10個居 民戶。在樣本居民戶內,隨機抽取一名成年 居民。第三步:確定抽樣的操作方法。第一階段 在全國城市中按與人口數(shù)成比例的放回的不等概抽樣,即PPS抽樣。第二、三階段 分別按人口數(shù)成比例的不等概等距抽樣。以第二階段為例,在某個被抽中的城市中,將其所屬
20、的街道編號,搜集各街道的人口數(shù),賦予每個街道與人口相同的代碼數(shù);根據(jù)該市總人口數(shù)除以樣本量4,然后對代碼進行隨機起點的第距抽樣,則被抽中代碼所在的街道為樣本街道。返回第四階段 分別在每個居委會中,按等距抽樣抽出10個居民戶。即根據(jù)居委會擁有的居民戶數(shù)除以樣本量10得到抽樣間距,然后隨機起點等距抽樣。在每個樣本居民戶,調查員按二維隨機表抽取一名成年居民。二維隨機表的使用如下:1.隨機號的確定。2.選出被訪者。返回序號姓名性別年齡1234567891011121肖明男531111111111112汪紅女522112121212213肖曉波男233211322131234肖曉玲女2141322314
21、324155412341235426631524351462771436252574388457126375319951438276528101035941728694111161510498327612127294116183105返回第四步:總體估計 記各樣本城市的80位樣本居民中,奶制品消費總支出為 ,則各樣本城市人均奶制品消費支出為:返回 全國1600名居民組成的樣本中,奶制品消費總支出為 則成年居民人均奶制品消費支出為:方差估計為:對總體比例的推算可以借用對均值的推算公式。記各樣本城市的80位樣本居民中,每天至少喝一杯鮮奶的人數(shù)為,則各樣本城市每天至少喝一杯鮮奶的人數(shù)比例為:返回全國
22、1600名居民組成的樣本中,每天至少喝一杯鮮奶的總人數(shù)為 ,則成年居民中每天至少喝一杯鮮奶的人數(shù)的比例為:p的方差的估計為:式中,返回 本章小結本章小結(1)(1)對于大規(guī)模的抽樣對于大規(guī)模的抽樣調查項目調查項目,通常采用多通常采用多階段抽樣方法階段抽樣方法;(2)(2)多階段抽樣方法多階段抽樣方法可以可以看做對樣本群內的單元進看做對樣本群內的單元進行再抽樣的一種方法行再抽樣的一種方法;(3)(3)一般來說一般來說,多階段抽樣多階段抽樣的前幾階采用的前幾階采用PPS抽樣抽樣,最最后一階采用等概率抽樣后一階采用等概率抽樣.返回本章作業(yè)本章作業(yè)(1 1)熟悉本章附錄的證明;)熟悉本章附錄的證明;(2 2)思考書后習題)思考書后習題1,1,習題習題2 2;(3 3)在作業(yè)本上完成書后)在作業(yè)本上完成書后習題習題3-3-習題習題5 5。(第八章結束)返回演講完畢,謝謝觀看!
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 川渝旅游日記成都重慶城市介紹推薦景點美食推薦
- XX國有企業(yè)黨委書記個人述責述廉報告及2025年重點工作計劃
- 世界濕地日濕地的含義及價值
- 20XX年春節(jié)節(jié)后復工安全生產培訓人到場心到崗
- 大唐女子圖鑒唐朝服飾之美器物之美繪畫之美生活之美
- 節(jié)后開工第一課輕松掌握各要點節(jié)后常見的八大危險
- 廈門城市旅游介紹廈門景點介紹廈門美食展示
- 節(jié)后開工第一課復工復產十注意節(jié)后復工十檢查
- 傳統(tǒng)文化百善孝為先孝道培訓
- 深圳城市旅游介紹景點推薦美食探索
- 節(jié)后復工安全生產培訓勿忘安全本心人人講安全個個會應急
- 預防性維修管理
- 常見閥門類型及特點
- 設備預防性維修
- 2.乳化液泵工理論考試試題含答案