《外語教學與研究統(tǒng)計方法.ppt》由會員分享,可在線閱讀,更多相關《外語教學與研究統(tǒng)計方法.ppt(40頁珍藏版)》請在裝配圖網上搜索。
1、外語教學與研究統(tǒng)計方法,為什么要學習統(tǒng)計方法?,1. 統(tǒng)計方法給我們一種看問題的視角、分析問題的手段,使我們可以從數量的角度,分析和認識現象的特點、規(guī)律、模式、趨勢或關系。 2. 統(tǒng)計方法給我們一種精確測量的手段。例如對于“水平高”的概念,我們可以用數學計量的手段給予更精確的描述。 3. 可以使我們對現象的數量表現,做出更科學的判斷。 4. 增強研究的自主性。數據收集的過程是自主的,對數據的處理和分析是原創(chuàng)的,得出的結論大大避免了抄襲的危險。,第一講 基本概念1. 數據類型:定類數據與定距數據2. 總體與樣本3. 誤差:抽樣誤差與非抽樣誤差4. 顯著性與顯著水平,1. 不同的數據需要采用不同的
2、統(tǒng)計方法; 2. 人們一般研究的都是樣本; 3. 統(tǒng)計中誤差無所不在; 4. 顯著性反映的是研究結論的確定性。,數據類型之:定類數據 定類數據是一種分類數據。它是對觀測對象按不同特性分類,并統(tǒng)計各類出現的次數(頻數)后得到的結果。,例如可以按性別、班級、課程等進行分類統(tǒng)計。定類測量中的類沒有大小之分,只有頻數高低。不能在類之間進行數學運算。,數據類型之:定距數據 定距數據是對測量對象按一定尺度測量后得出的數值。所用測量尺度有恒定的單位,單位之間的距離是相等的。,例如對成績、年齡等的測量通常得到的是定距數據。人們可以對定距數據進行數學運算,比較不同數值之間的大小。,總體總體指具有相同特征或
3、者性質的所有個體之和。總體可大可小。例如二語學習者是大總體,某校一年級新生則是小總體。,樣本 樣本指從總體中選取的一部分個體。由于常常不能直接研究總體,所以人們常常通過樣本來推斷總體。 樣本有隨機樣本和非隨機樣本之分。,抽樣誤差抽樣誤差是客觀存在。只要從總體中抽取樣本,就會存在抽樣誤差。,從一個總體中抽取的樣本均值與總體均值之間多數存在差異。 從一個總體中抽取的不同樣本均值之間也多數存在差異。 為了減少抽樣誤差,最好用隨機抽取的大樣本。,,Mean=28,Mean1=25,Mean2=30,非抽樣誤差非抽樣誤差是由于技術上原因,如測量工具不準,或是人為操作造成的誤差。,比較典型的非抽樣誤差是考
4、試分數合計錯誤,或者是數據錄入失誤。 避免非抽樣誤差的方法是仔細測量和認真錄入與核對。,顯著性顯著性的概念涉及統(tǒng)計分析結果的可靠性。顯著性檢驗用于驗證統(tǒng)計結果是自然存在的還是由偶然因素如誤差造成的。,顯著性水平 顯著性水平是衡量顯著性的標準。在社會科學和應用語言學研究中,通常設定的顯著水平為p=0.05。 大于0.05的統(tǒng)計結果,通常說無顯著差異,或無顯著相關。 等于/小于0.05的統(tǒng)計結果,通常說有顯著差異,或顯著相關。,描述統(tǒng)計,平均值、標準差、交互表、頻數表,平均值:所有個值之和除以個值的數目??傮w均值用表示,樣本均值用表示。,70個學生的四級平均成績,標準差:是數據內部差異的一種量度。
5、標準差越大,內部差異也越大。例:兩個班期末考試平均分相等,甲班的標準差為5分,乙班的標準差為10分,說明乙班的內部差異大于甲班。,70個學生四級成績的標準差,Empirical Rule1 經驗法則1,正態(tài)分布的數據 -1 +1 大約68的數值在均值的一個標準差范圍內,,,,,Empirical Rule2,正態(tài)分布的數據 -2 +2 大約95的數值在均值的2個標準差范圍內。,,,,,Empirical Rule3,正態(tài)分布的數據 -3 +3 幾乎全部(99.7)數值在3個標準差范圍內。,,,,,大學英語四級考試成績分布,均值:50
6、0 標準差:70 430 500 570 大約68的四級考試分數在430到570之間。,,,,,大學英語四級考試成績分布2,360 500 640 大約95的考試分數在360到640之間。,,,,,英語四級考試成績分布,290 500 710 幾乎全部(99.7)數值在290到710之間。,,,,,交互表交互表是對定類數據的一種歸納和表現形式。交互表根據行數和列數,分別有2x2表, 2x3表,或者j x k表。,,頻數表一種頻數表是簡單羅列數據中每個數值出現的次數;另一種頻數表是按一定的區(qū)間,分組統(tǒng)計和羅列數值出現的次數。,,推斷統(tǒng)計推斷統(tǒng)計主要根據概率理論,利用
7、各種分布模型,進行組之間、變量之間的差異或相關的顯著性檢驗。,推斷統(tǒng)計主要回答的問題是: 1)不同組或不同變量的均值之間存在的差異是否顯著? 2)兩個變量之間的相關關系是否顯著?,常用的差異檢驗方法1)獨立樣本的t檢驗2)成對樣本的t檢驗3)一元方差分析4)卡方檢驗,一般情況下: 1)如果數據是定距數據,根據數據情況,分別采用前三種方法; 2)如果數據是定類數據,采用卡方檢驗的方法。,獨立樣本t檢驗(independent sample t-test)獨立樣本t檢驗用于檢驗同一個變量下的兩組數值之間是否存在顯著差異。,應用的研究問題: 1)一次考試中的兩個班的成績是否存在顯著性差異? 2)一次
8、考試中的男女生的成績是否存在顯著性差異?,獨立樣本t檢驗要看計算出的t值和對應的sig.值,或者說顯著性水平。如果sig.值大于0.05,兩組之間沒有顯著差異,如果sig.值小于0.05,兩組之間存在顯著差異。在報告時,要報告t值和sig.值。,例:獨立樣本t檢驗的結果顯示,多媒體教學實驗班和常規(guī)教學班(對照班)的英語水平不存在顯著性差異(t=1.11, p0.05)。也就是說,多媒體教學并沒有帶來比常規(guī)教學更好的教學效果。,成對樣本的t檢驗(paired sample t-test)成對樣本的t檢驗用于檢驗就同一個變量對同一組對象兩次收集的數據之間是否存在顯著差異。,應用的研究問題: 1)某
9、年級學生進校時英語水平和現在英語水平之間是否存在顯著差異? 2)某級學生經過一年的學習后,學習動機是否發(fā)生了改變?,成對樣本t檢驗也看計算出的t值和對應的sig.值,或者說顯著性水平。如果sig.值大于0.05,成對樣本沒有顯著差異,如果sig.值小于0.05,樣本之間存在顯著差異。在報告時,要報告t值和sig.值。,例:成對樣本t檢驗的結果顯示,某年級新生進校后經過一段時間的學習,成績有了顯著提高,第二次考試成績顯著高于進校時的成績(t=3.12, p<0.05)。,方差檢驗(F檢驗)(F-test)方差檢驗用于檢驗一個變量下的三組之間是否存在顯著性差異。,例1:研究問題:三種詞匯學習方法的
10、效果是否有顯著差異? 方法1:有意學習 方法2:附帶學習 方法3:附帶學習+有意注意 例2:研究問題:三種詞匯教學方法的效果是否有顯著差異? 方法1:詞表法 方法2:閱讀法 方法3:寫作法,方差分析要看計算出的F值和對應的sig.值,或者說顯著性水平。如果sig.值大于0.05,說明各組間沒有顯著差異,如果sig.值小于0.05,至少兩組之間存在顯著差異。在報告時,要報告F值和sig.值。,例:研究問題:三種不同的詞匯學習方法對詞匯學習是否有不同的效果? 對詞匯考試數據的方差分析顯示,三種方法對詞匯學習有不同的效果(F=12, p<0.05)。,方差分析的后檢驗(post hoc test),
11、如果要檢驗那兩組之間存在顯著性差異,可以 1)每兩組之間做獨立樣本的t檢驗; 2)做方差分析的后檢驗,看那兩組之間存在差異。,相關分析(correlation test)相關分析考察兩個變量之間是否存在一定的關系;如果是,這種關系有多強;而且要檢驗這種關系是否具有顯著性。,例如: 1)學習者二語詞匯水平與閱讀理解水平的關系? 2)學習者二語詞塊知識與二語水平的關系? 3)學習者二語學習動機與二語水平之間的關系?,相關分析要看計算出的r值和對應的sig.值。如果sig.值大于0.05,說明變量之間沒有顯著相關;如果sig.值小于0.05,說明變量之間存在顯著相關。在報告時,要報告r值和sig.值
12、。,例:經過統(tǒng)計,我們發(fā)現搭配能力與語言能力中度相關。其中, 搭配能力與閱讀能力相關系數為.47,顯著性達到p < .001; 搭配能力與寫作能力的相關系數為.514,顯著性達到p< .001;搭配能力與聽力的相關系數為.443,顯著性也達到p < .001;搭配能力成績與三項成績總和的相關系數為.545,顯著性達到p < .001。(黃強,2002),卡方檢驗卡方檢驗應用于定類數據。1)對單向(單行、單列)分類數據的分析;2)對多向(多行、多列)分類數據的分析。,單向分類數據 多向分類數據,卡方檢驗用于單向分類數據的檢驗,單向分類數據的卡方檢驗要回答的問題是:“觀察數據的分布是否符合某個期望
13、分布?” 例如: 1)學生考試成績的分布是否符合均等分布? 或者:各類成績的學生人數是否相等? 2)學生考試成績的分布是否符合正態(tài)分布? 檢驗假設是: 1)學生考試成績的分布符合均等分布。 或者:各類成績的學生人數相等。 2)學生考試成績的分布符合正態(tài)分布。,卡方檢驗用于多向分類數據的檢驗,多向分類數據的卡方檢驗要回答的問題是:“兩個因素之間是否相互獨立,或者說不存在任何關系?” 例如: 1)教齡與對影響學習效果因素的看法是否有關? 檢驗假設是: 1)教齡與看法無關。,卡方檢驗要看計算出的卡方值和對應的sig.值。如果sig.值大于0.05,說明因素之間沒有顯著關系;如果sig.值小于0.05,說明因素之間存在顯著關系。在報告時,要報告卡方值和sig.值。,1) 學生考試成績符合均等分布,即各類成績的學生人數是相同的(卡方值=8.783, p=0.0670.05)。 2) 教齡與對影響學習效果的因素的看法之間有關系(卡方值=23.25, p=.000 <0.05)。,,,,,