《外語教學與研究統(tǒng)計方法.ppt》由會員分享,可在線閱讀,更多相關《外語教學與研究統(tǒng)計方法.ppt(40頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、外語教學與研究統(tǒng)計方法,為什么要學習統(tǒng)計方法?,1. 統(tǒng)計方法給我們一種看問題的視角、分析問題的手段,使我們可以從數(shù)量的角度,分析和認識現(xiàn)象的特點、規(guī)律、模式、趨勢或關系。 2. 統(tǒng)計方法給我們一種精確測量的手段。例如對于“水平高”的概念,我們可以用數(shù)學計量的手段給予更精確的描述。 3. 可以使我們對現(xiàn)象的數(shù)量表現(xiàn),做出更科學的判斷。 4. 增強研究的自主性。數(shù)據(jù)收集的過程是自主的,對數(shù)據(jù)的處理和分析是原創(chuàng)的,得出的結(jié)論大大避免了抄襲的危險。,第一講 基本概念1. 數(shù)據(jù)類型:定類數(shù)據(jù)與定距數(shù)據(jù)2. 總體與樣本3. 誤差:抽樣誤差與非抽樣誤差4. 顯著性與顯著水平,1. 不同的數(shù)據(jù)需要采用不同的
2、統(tǒng)計方法; 2. 人們一般研究的都是樣本; 3. 統(tǒng)計中誤差無所不在; 4. 顯著性反映的是研究結(jié)論的確定性。,數(shù)據(jù)類型之:定類數(shù)據(jù) 定類數(shù)據(jù)是一種分類數(shù)據(jù)。它是對觀測對象按不同特性分類,并統(tǒng)計各類出現(xiàn)的次數(shù)(頻數(shù))后得到的結(jié)果。,例如可以按性別、班級、課程等進行分類統(tǒng)計。定類測量中的類沒有大小之分,只有頻數(shù)高低。不能在類之間進行數(shù)學運算。,數(shù)據(jù)類型之:定距數(shù)據(jù) 定距數(shù)據(jù)是對測量對象按一定尺度測量后得出的數(shù)值。所用測量尺度有恒定的單位,單位之間的距離是相等的。,例如對成績、年齡等的測量通常得到的是定距數(shù)據(jù)。人們可以對定距數(shù)據(jù)進行數(shù)學運算,比較不同數(shù)值之間的大小。,總體總體指具有相同特征或
3、者性質(zhì)的所有個體之和??傮w可大可小。例如二語學習者是大總體,某校一年級新生則是小總體。,樣本 樣本指從總體中選取的一部分個體。由于常常不能直接研究總體,所以人們常常通過樣本來推斷總體。 樣本有隨機樣本和非隨機樣本之分。,抽樣誤差抽樣誤差是客觀存在。只要從總體中抽取樣本,就會存在抽樣誤差。,從一個總體中抽取的樣本均值與總體均值之間多數(shù)存在差異。 從一個總體中抽取的不同樣本均值之間也多數(shù)存在差異。 為了減少抽樣誤差,最好用隨機抽取的大樣本。,,Mean=28,Mean1=25,Mean2=30,非抽樣誤差非抽樣誤差是由于技術上原因,如測量工具不準,或是人為操作造成的誤差。,比較典型的非抽樣誤差是考
4、試分數(shù)合計錯誤,或者是數(shù)據(jù)錄入失誤。 避免非抽樣誤差的方法是仔細測量和認真錄入與核對。,顯著性顯著性的概念涉及統(tǒng)計分析結(jié)果的可靠性。顯著性檢驗用于驗證統(tǒng)計結(jié)果是自然存在的還是由偶然因素如誤差造成的。,顯著性水平 顯著性水平是衡量顯著性的標準。在社會科學和應用語言學研究中,通常設定的顯著水平為p=0.05。 大于0.05的統(tǒng)計結(jié)果,通常說無顯著差異,或無顯著相關。 等于/小于0.05的統(tǒng)計結(jié)果,通常說有顯著差異,或顯著相關。,描述統(tǒng)計,平均值、標準差、交互表、頻數(shù)表,平均值:所有個值之和除以個值的數(shù)目??傮w均值用表示,樣本均值用表示。,70個學生的四級平均成績,標準差:是數(shù)據(jù)內(nèi)部差異的一種量度。
5、標準差越大,內(nèi)部差異也越大。例:兩個班期末考試平均分相等,甲班的標準差為5分,乙班的標準差為10分,說明乙班的內(nèi)部差異大于甲班。,70個學生四級成績的標準差,Empirical Rule1 經(jīng)驗法則1,正態(tài)分布的數(shù)據(jù) -1 +1 大約68的數(shù)值在均值的一個標準差范圍內(nèi),,,,,Empirical Rule2,正態(tài)分布的數(shù)據(jù) -2 +2 大約95的數(shù)值在均值的2個標準差范圍內(nèi)。,,,,,Empirical Rule3,正態(tài)分布的數(shù)據(jù) -3 +3 幾乎全部(99.7)數(shù)值在3個標準差范圍內(nèi)。,,,,,大學英語四級考試成績分布,均值:50
6、0 標準差:70 430 500 570 大約68的四級考試分數(shù)在430到570之間。,,,,,大學英語四級考試成績分布2,360 500 640 大約95的考試分數(shù)在360到640之間。,,,,,英語四級考試成績分布,290 500 710 幾乎全部(99.7)數(shù)值在290到710之間。,,,,,交互表交互表是對定類數(shù)據(jù)的一種歸納和表現(xiàn)形式。交互表根據(jù)行數(shù)和列數(shù),分別有2x2表, 2x3表,或者j x k表。,,頻數(shù)表一種頻數(shù)表是簡單羅列數(shù)據(jù)中每個數(shù)值出現(xiàn)的次數(shù);另一種頻數(shù)表是按一定的區(qū)間,分組統(tǒng)計和羅列數(shù)值出現(xiàn)的次數(shù)。,,推斷統(tǒng)計推斷統(tǒng)計主要根據(jù)概率理論,利用
7、各種分布模型,進行組之間、變量之間的差異或相關的顯著性檢驗。,推斷統(tǒng)計主要回答的問題是: 1)不同組或不同變量的均值之間存在的差異是否顯著? 2)兩個變量之間的相關關系是否顯著?,常用的差異檢驗方法1)獨立樣本的t檢驗2)成對樣本的t檢驗3)一元方差分析4)卡方檢驗,一般情況下: 1)如果數(shù)據(jù)是定距數(shù)據(jù),根據(jù)數(shù)據(jù)情況,分別采用前三種方法; 2)如果數(shù)據(jù)是定類數(shù)據(jù),采用卡方檢驗的方法。,獨立樣本t檢驗(independent sample t-test)獨立樣本t檢驗用于檢驗同一個變量下的兩組數(shù)值之間是否存在顯著差異。,應用的研究問題: 1)一次考試中的兩個班的成績是否存在顯著性差異? 2)一次
8、考試中的男女生的成績是否存在顯著性差異?,獨立樣本t檢驗要看計算出的t值和對應的sig.值,或者說顯著性水平。如果sig.值大于0.05,兩組之間沒有顯著差異,如果sig.值小于0.05,兩組之間存在顯著差異。在報告時,要報告t值和sig.值。,例:獨立樣本t檢驗的結(jié)果顯示,多媒體教學實驗班和常規(guī)教學班(對照班)的英語水平不存在顯著性差異(t=1.11, p0.05)。也就是說,多媒體教學并沒有帶來比常規(guī)教學更好的教學效果。,成對樣本的t檢驗(paired sample t-test)成對樣本的t檢驗用于檢驗就同一個變量對同一組對象兩次收集的數(shù)據(jù)之間是否存在顯著差異。,應用的研究問題: 1)某
9、年級學生進校時英語水平和現(xiàn)在英語水平之間是否存在顯著差異? 2)某級學生經(jīng)過一年的學習后,學習動機是否發(fā)生了改變?,成對樣本t檢驗也看計算出的t值和對應的sig.值,或者說顯著性水平。如果sig.值大于0.05,成對樣本沒有顯著差異,如果sig.值小于0.05,樣本之間存在顯著差異。在報告時,要報告t值和sig.值。,例:成對樣本t檢驗的結(jié)果顯示,某年級新生進校后經(jīng)過一段時間的學習,成績有了顯著提高,第二次考試成績顯著高于進校時的成績(t=3.12, p<0.05)。,方差檢驗(F檢驗)(F-test)方差檢驗用于檢驗一個變量下的三組之間是否存在顯著性差異。,例1:研究問題:三種詞匯學習方法的
10、效果是否有顯著差異? 方法1:有意學習 方法2:附帶學習 方法3:附帶學習+有意注意 例2:研究問題:三種詞匯教學方法的效果是否有顯著差異? 方法1:詞表法 方法2:閱讀法 方法3:寫作法,方差分析要看計算出的F值和對應的sig.值,或者說顯著性水平。如果sig.值大于0.05,說明各組間沒有顯著差異,如果sig.值小于0.05,至少兩組之間存在顯著差異。在報告時,要報告F值和sig.值。,例:研究問題:三種不同的詞匯學習方法對詞匯學習是否有不同的效果? 對詞匯考試數(shù)據(jù)的方差分析顯示,三種方法對詞匯學習有不同的效果(F=12, p<0.05)。,方差分析的后檢驗(post hoc test),
11、如果要檢驗那兩組之間存在顯著性差異,可以 1)每兩組之間做獨立樣本的t檢驗; 2)做方差分析的后檢驗,看那兩組之間存在差異。,相關分析(correlation test)相關分析考察兩個變量之間是否存在一定的關系;如果是,這種關系有多強;而且要檢驗這種關系是否具有顯著性。,例如: 1)學習者二語詞匯水平與閱讀理解水平的關系? 2)學習者二語詞塊知識與二語水平的關系? 3)學習者二語學習動機與二語水平之間的關系?,相關分析要看計算出的r值和對應的sig.值。如果sig.值大于0.05,說明變量之間沒有顯著相關;如果sig.值小于0.05,說明變量之間存在顯著相關。在報告時,要報告r值和sig.值
12、。,例:經(jīng)過統(tǒng)計,我們發(fā)現(xiàn)搭配能力與語言能力中度相關。其中, 搭配能力與閱讀能力相關系數(shù)為.47,顯著性達到p < .001; 搭配能力與寫作能力的相關系數(shù)為.514,顯著性達到p< .001;搭配能力與聽力的相關系數(shù)為.443,顯著性也達到p < .001;搭配能力成績與三項成績總和的相關系數(shù)為.545,顯著性達到p < .001。(黃強,2002),卡方檢驗卡方檢驗應用于定類數(shù)據(jù)。1)對單向(單行、單列)分類數(shù)據(jù)的分析;2)對多向(多行、多列)分類數(shù)據(jù)的分析。,單向分類數(shù)據(jù) 多向分類數(shù)據(jù),卡方檢驗用于單向分類數(shù)據(jù)的檢驗,單向分類數(shù)據(jù)的卡方檢驗要回答的問題是:“觀察數(shù)據(jù)的分布是否符合某個期望
13、分布?” 例如: 1)學生考試成績的分布是否符合均等分布? 或者:各類成績的學生人數(shù)是否相等? 2)學生考試成績的分布是否符合正態(tài)分布? 檢驗假設是: 1)學生考試成績的分布符合均等分布。 或者:各類成績的學生人數(shù)相等。 2)學生考試成績的分布符合正態(tài)分布。,卡方檢驗用于多向分類數(shù)據(jù)的檢驗,多向分類數(shù)據(jù)的卡方檢驗要回答的問題是:“兩個因素之間是否相互獨立,或者說不存在任何關系?” 例如: 1)教齡與對影響學習效果因素的看法是否有關? 檢驗假設是: 1)教齡與看法無關。,卡方檢驗要看計算出的卡方值和對應的sig.值。如果sig.值大于0.05,說明因素之間沒有顯著關系;如果sig.值小于0.05,說明因素之間存在顯著關系。在報告時,要報告卡方值和sig.值。,1) 學生考試成績符合均等分布,即各類成績的學生人數(shù)是相同的(卡方值=8.783, p=0.0670.05)。 2) 教齡與對影響學習效果的因素的看法之間有關系(卡方值=23.25, p=.000 <0.05)。,,,,,