為什么要學統計學?
在校園里,統計學課程確實不那么受歡迎,盡管教這門課的人(就是我們啦)不愿意承認。很大一部分學生選統計學課程,其實是因為他們的院系將其定為必修課。在這種情況下,學生有權問“為什么要學統計學?”在這里,我至少可以給出兩個很好的答案。傳統的答案是,我們希望學生學會一套特定的分析數據的技能(包括公式和程序),這樣他們就能夠讀懂實驗文獻,并能夠分析自己的數據。還有一個更加寬泛的、適用于更多學生的答案,那就是善于與數字和數據打交道,對于學生的終身職業發展非常重要。我們中的大多數人(不僅是那些從事實驗工作的人)在工作中經常遇到數據,所以,對于數據處理方法的廣博理解就成為一項重要的、可以待價而沽的技能。根據我的經驗,那些修過統計學課程的學生即使覺得自己已經把學過的技能忘得一干二凈,還是比他們的同事更善于解讀數據。現在的世界越來越受定量數據的支配,也越來越強烈地需要統計學技術。統計學并不完全是關于數字的學問,它關系到我們如何理解世界。當然,對于統計學家來說,其重要工作之一就是回答諸如“在新環境中攝取的可卡因是否比在熟悉的環境中攝取的具有更強效力”這類問題。但是,我們不要忘記,這里談論的話題是“藥物成癮”或“環境對學習和記憶的影響”。我們的實驗結果已經超出了認知或行為科學家的有限視野。還要記住,大多數人看到的數字與嚴格控制的實驗無關,而與以下研究有關:為了購物中心建設而開展的交通問題研究,住宅密度對當地學校預算的影響研究,以及針對新產品的營銷研究。所有這些例子都要用到本書闡述的許多統計學的基本概念。
為什么需要本教材?
為了充分體現統計學課程的價值。教師看到本書之前想必就已經深信統計學的價值了,而我希望的是,學生們至少可以拓寬他們的思路。但是上面這個問題并沒有得到回答——還有其他許多教材,為什么要用這一本?部分答案可以歸結為寫作風格:我特意將其設定為對學生和教師而言都既有趣又有用的一本書。它采用了一種比較輕松的文體,每個例子都以一個合理的研究作為背景,而且幾乎所有的例子都源于已經發表的文獻。如果要求人們學習一系列統計學技術,卻不提供實際運用這些技術的情境作為例子,那這門課就沒有多大意義了。
我為本書設計的目標是向心理學、教育學以及其他行為科學提供一本入門級統計學教材。本書對讀者的數學背景要求不高,學過高中代數即可;這里強調的是統計程序的邏輯,而不是統計學公式的推導。
在過去的25年中,數據分析領域發生了天翻地覆的變化。過去,我們用計算器,坐在那里手動輸入數據解方程,現在多半是在計算機上運行統計軟件。事實上,為了某些目的,我們還可能運行一些從互聯網上免費下載的用Java等語言編寫的在線程序(我有時還會使用下載到智能手機里的應用程序)。隨著統計方法的進步,相應的教學方法也必須改變。雖然我們現在不能也不應該完全摒棄對于公式和計算的重視,但確實是時候多考慮點別的方面了。我們可以將計算上省下來的時間用于更好地解讀統計結果。這正是本書努力要做的事情。過去,我們只是簡單地宣布樣本間的差異是顯著還是不顯著,以后要過渡到能解釋這些差異對于實驗背后的目的意味著什么。在我看來,這是一個從分析數字到分析數據的轉變。這意味著,兩組之間是否存在差異已經不再那么重要,更重要的是理解這種差異的含義。
在從使用計算器轉向使用計算機的過程中,我改變了對公式的看法。過去,我經常給出一個定義公式,接著立即跳到計算公式。但是,如果不用那么擔心計算而應更多地關心理解,我就可以回過頭去運用定義公式。我希望這也會讓學生輕松一點。除此之外,在這個版本中,我還在計算機解決方案上額外花了相當多的時間,部分原因是,觀察計算機解決問題的方式有助于理解統計學方法。盡管這種方式未必總是有效,但它已經足以讓我強調,能夠用計算機程序來求解是非常重要的。(求出解后還可以稍做改變,重新運行程序,看看會發生什么。)
獨一無二的特色
本書有多項特色,使其有別于為同一讀者群編寫的其他書籍。特色之一就是剛剛提到的一個做法——從研究文獻中尋找例子。我試圖做到,讓選來做例子的研究回答的是學生感興趣的問題。在這些例子當中,有情境對過量吸食海洛因的影響,有日常壓力與心理癥狀之間的關系,有影響課程評價的變量,有父母早逝對兒童敏感性的影響,還有影響記憶隨年齡變化關系的變量。我想讓學生對提出的問題產生一定的投入感,并且希望說明,統計分析并非僅僅是運用幾個方程式那么簡單。
在本書大多數章中都專門設置了一節內容用例子來討論如何運用SPSS和R軟件。讀者建議我多關注R而不是SPSS。R正在成為計算的標準,并且它還是一個不斷開發中的、免費的軟件包。SPSS是一個商業軟件包,許多學院和大學都購買了許可證。R稍微有點難學,但它確實正在成為未來的統計軟件。至于免費軟件,這絕非嘲笑R的理由。我的目的是讓學?熟悉計算機輸出的形式,以及其中包含的各種信息。我不是想讓學生成為統計軟件的專家,但我致力于向他們提供修改代碼并完成自己的任務所需要的知識。此外,我特別需要用R來直觀地闡明統計學中的概念。
但是,如果學生打算用這些計算機軟件,我不會讓他們僅僅為了作業而購買SPSS手冊或R教材。我在網上放了兩本SPSS手冊,鼓勵學生閱讀。它們不像印刷品那么完整,但足以教會學生使用SPSS。我建議使用那個簡明手冊,而詳細手冊可以用于查閱其他的信息。我在每一章也都介紹了關于R用法的網絡文檔,學生應該能夠照此進行統計分析;而要做自己的分析時,可以對代碼進行相應的修改。
本教材所有例題和習題所用的數據文件都可以在我為本書維護的網站*上找到。通過網站中的鏈接,可以獲得所有數據。這些數據文件都采用美國信息交換標準代碼(American Standard Code for Information Interchange,ASCII)格式,因此幾乎任何統計軟件都可以讀取。(我還提供了SPSS格式的數據文件副本。)文件的第一行都是變量名,可以直接導入軟件。只需點擊數據瀏覽器的“保存”選項,就可以將數據保存到你的計算機中。有了這些文件,師生就可以輕松地結合教材使用任何統計軟件。
在前面提到的網站上還能找到一份學生手冊。它給出了半數練習題的完整答案,本書最后對這些問題只做了簡短解答,這份手冊可以作為一個補充。但是,我只給出了奇數題的答案,因為許多教師更喜歡布置教材和學生答題手冊上沒有給出答案的習題(或考試題)。(我非常清楚這會得罪學生,有時還會收到他們表示不悅的郵件,但我還是要平衡一下學生的要求與教師的愿望。)我向教師提供所有習題的答案。這些答案還經常帶有評語,例如,“在課堂上你可以指出……”或“我提出這個問題是為了……”我在編寫這個新版本時也通讀了這些評語,我覺得這些評論中有很多(盡管不是全部)對學生也相當有用,所以在學生手冊中也加入了不少這樣的內容。有的評語可能看上去沒有幫助或不符合上下文,但是我認為大部分都值得一讀。我的網頁還包含了許多轉向其他網站的鏈接,通過它們,你可以找到很好的例題、用于演示統計方法的程序、更詳細的術語表等。既然人們花費了大量時間通過互聯網提供可用的材料,就應該好好利用這些材料。
為什么需要這個新版本?
每當作者推出一個新版本時,我們自然會問:在二手圖書市場廣泛流通的舊版本是不是出了什么問題?通常來說,編寫一個新版本是為了吸收本領域的新內容,并剔除不再需要的內容。而且,除了許多人都能想到的研究,還有許多新的研究工作尚在進行之中。但是,這個版本采用了與前一個版本不同的做法。在介紹新內容的時候,我把自己當成初學者去閱讀,并花大力氣找到闡述和復習概念的方法。例如,我知道Y軸是垂直軸,但大多數人不知道,那么只講一次是不夠的。所以,我經常這樣寫:“在Y(垂直)軸上……”如果你開始以這種方式看待本書,你會發現許多地方需要說明——特別是因為我有一位長期從事中學教育的妻子,她比我更了解教育學。(其實,她讀了本書每一章內容,并提出了許多富有成效的建議。)在每一章的開頭,我還列出了閱讀本章所需的重要概念。我的希望是,如果你不清楚這些概念,就請復習一下。
在必要的地方,我利用專欄插入了一些重要的解釋,這種專欄可以將多個要點綜合在一起,以突出顯示你真正需要理解的材料,或闡明難以理解的概念。書中還穿插了著名統計學家的小傳。尤其是在20世紀上半葉,這個領域有許多有趣(而且脾氣暴躁)的人,很值得了解一二。我還刪除了原先每一章中非常簡短且用處不大的總結,代之以更完整的各章總結。我的目標是將全章內容濃縮成幾段,讓你在其上花的時間更值得。前段時間,我在閱讀關于Java的編程文本,發現有位作者在每一章的末尾都插入了一些簡單的問題和答案。我發現,從這些簡單的問題中可以學到很多東西,所以在這一版中,我將仿照他的做法。希望這些問題真的能夠有效地將你的注意力集中到各章的諸多重點之上。
本書的一個重要特征就是更加重視效應量的計算。行為科學統計正在迅速擺脫只報告統計學上是否具有顯著意義的局面,轉而報告更能說明研究結果的效應程度和重要程度的數據指標。這方面的內容加入得比較晚,但是它們將體現在我對教材文本所做的持續改變中。這樣做不僅符合這個領域的趨勢,而且其重要性在于,這可以使學生和研究人員仔細思考研究結果的真正含義。在介紹效應量時,我試圖傳達這樣一種觀念:作者試圖向讀者說明研究發現了什么,而且有多種不同的方法可以實現這一目標。在某些情況下,只要考察平均數之差或比例之差就足夠了。而在另一些情況下,標準化的數量指標,例如科恩氏d(Cohen’ s d),還是有幫助的。我還將盡可能避開基于相關的數量指標,因為我覺得它們提供的信息遠遠達不到讀者的要求。
統計學領域發生的一個重要變化就是向所謂的“重抽樣統計學”的轉變。由于現在的計算機(即使是簡單的臺式機)能以極高的速度進行運算,我們已經有可能采用以前想過但從未用過的方式來審視統計結果。這些程序的優點之一,就是它們不再要求數據符合那么多假設。從某些方面看,它們就像我們多年來一直使用的比較傳統的非參數統計學,而且它們更強大。我修改了傳統的非參數統計的那一章,使其幾乎完全避開手工計算,并用節省出來篇幅介紹重抽樣方面的內容。這樣做有一個好處,一旦我說明了某一種分析的重抽樣技術,學生就很容易明白對其做出怎樣的修改能適用于其他實驗設計。
我還保留了早期版本中一部分叫作“直觀的統計學”的內容。這些內容都是圍繞著由科羅拉多大學的Gary McClelland編寫的一組Java程序寫成的。這些程序能讓學生自己直觀地看明白書中討論的許多概念。學生可以打開這些程序,改變其中的參數,查看會產生什么結果。有一個很好的例子,是用一個程序說明異質子樣本在相關分析中的影響,請參見第9章第9.16節。這些程序可以直接在我先前提到的網站上找到。
這一版有一個重要補充,就是增加了關于元分析的章節。元分析是同時對眾多研究進行分析。例如,關于抑郁癥治療已經有了許多研究。對抑郁癥的元分析就是將所有這些研究結合起來,并試圖根據這些或相似、或不同的發現得出新的結論。目前對循證醫學的重視就是一個很好的例子。例如,如果我要接受癌癥治療,我希望這種治療依據的不僅僅是上周發表的最新研究,也不僅僅是我的腫瘤科醫生最喜歡的研究。在這種情況下,我們真正需要的是,行為科學不僅限于判斷統計學意義是否顯著,更要重視效應量的大小。20年前的統計學導論教材是不會介紹對于眾多研究的元分析方法的。
除了上面提到的特色,通過出版社網站(我的網站上有一個鏈接),你還可以找到本書的配套網址,其中包含了許多對學生有用的內容。其中包括一本統計學輔導書,這是一套多項選擇題,內容涵蓋各章的主要問題。每當學生做出錯誤選擇時,就會出現一個解釋問題材料、幫助學生了解正確答案的方框。這些測試題不是我編寫的,但是我覺得這些題目已經足夠好。網站上還有鏈接指向其他資源,包括對基礎算術的復習,以及其他例子和補充材料。
內容的組織和覆蓋范圍
本節主要是給教師看的,因為這里提到的內容,學生應該還不很了解。如果你是學生,可以跳過這一節。
本書的前七章專門講解標準的描述統計學,包括數據的呈現方式、集中量和差異量的計量、正態分布以及直接應用于后續內容的概率論。
第8章闡述假設檢驗和抽樣分布,這是對推斷統計學的通俗介紹。這一章經過專門設計,為了讓學生繞過一大堆公式和紛繁復雜的統計檢驗方法,直接學習假設檢驗的基本邏輯。
第9章、第10章和第11章涉及相關和回歸,包括多元回歸。
第12—14章專門講授了關于平均數的檢驗,主要是t檢驗。
第15章涉及統計功效及其計算方法,這是一種易于理解和應用的方法。
第16—18章講方差分析。其中包括簡單的重復測量設計,但沒有涉及混合設計。這三章內容包括運用費舍保護性t檢驗進行基本多重比較,這個t不僅是一個易于理解的統計量,在某些限定條件下,其在統計功效和錯誤率方面也有很好的表現。應早期版本的部分讀者的要求,新版本中加入了Bonferroni檢驗,它在控制錯誤率方面表現出色,而且只要使用得當,其功效也不會大幅下降。新版本還介紹了效應度和效應量,大大擴充了交互作用和簡單效應檢驗的內容。特別是效應量方面的內容,遠比早期版本豐富。
第19章介紹χ2檢驗。不過,如果需要提前了解這部分內容,其閱讀難度也不大。
第20章介紹了最重要的自由分布檢驗,包括重抽樣統計學。
在上一版中,第21章是全新的內容,介紹的是元分析技術。隨著人們日益重視單個研究的效應量,元分析讓人們得以運用效應量指標來綜合許多相似的研究。該領域現在變得特別重要,正沿著所謂“循證醫學”研究者開辟的道路前進。假定你需要接受癌癥治療,你一定希望醫生的治療基于對你所患癌癥的所有文獻的堅實可靠的分析。我們研究行為科學時,也有同樣的希望。
并非每一門課程都要講完所有這些章節,有些內容(最明顯的是多元回歸、統計功效和自由分布統計方法)即使略去或調整順序,也不會破壞材料的流暢性。(我在自己的課程中很早就會講到χ2檢驗,但是考慮到評論者的建議,本書將其挪到很后面的位置。)
對應本書的數字教育平臺——MindTap
MindTap是一種個性化的教學體驗,其中有可以引導學生進行分析、應用和改進思維的相關作業,可以便捷地衡量學生的技能和學習成果。
個性化教學:基于學習目標建立學習路徑成為了教師的個性化教學方式。教師可以控制學生學習的內容和進度,可以直接使用原有內容,也可以將其與教學大綱精準匹配——你可以省略和重新排列原有內容,還可以添加和創建自己的內容。
學習指導:提供獨一無二的學習路徑,將重要的閱讀內容、多媒體內容和活動組織起來,促使學生從初級學習(對基礎知識的記憶和理解)上升到高級學習(分析和應用)。
促成更好的結果:作為對師生的激勵,平臺的分析和報表功能可以向師生提供課程進度、課程用時、參與率和完成率的快照記錄。
補充材料
附有題庫和電子講義的在線教師手冊包括練習的完整答案,還介紹了呈現材料和吸引學生注意的多種方法;其中可以找到適合各種教學目標的額外例子作為教?的補充,可以通過鏈接訪問互聯網上的其他資源,還可以看到本書作者選用的補充材料。補充材料中還包括可用作講義或工作表的電子文件。
致謝
在本書的編寫過程中,許多人發揮了重要作用。我的產品團隊支持此次修訂,團隊中有產品經理Tim Matray、產品助理Adrienne McCrory、內容開發人員Tangelique Williams- Grayer和Lumina項目集經理Kailash Rawat。Diane Giombetti Clue是一位非常出色的編輯——當我偶爾不顧樣式手冊的要求,堅持古怪的拼寫或將介詞放在自認為更合適的位置時,她總是給予支持。我的女兒Lynda也做了大量工作,調整教師和學生手冊的格式,以及檢查偶然錯誤。
許多評論者對本書的早期版本提出了有益的建議,特別是Kevin J. Apple博士(俄亥俄大學)、Eryl Bassett(坎特伯雷肯特大學)、Drake Bradley(貝茨學院)、Deborah M. Clauson(美國天主教大學)、Jose M. Cortina(密歇根州立大學)、Gary B. Forbach(沃什伯恩大學)、Edward Johnson(北卡羅來納大學)、Dennis Jowaisas(俄克拉何馬城市大學)、David J. Mostofsky(波士頓大學)、Maureen Powers(范德比爾特大學)、David R. Owen(紐約城市大學布魯克林學院)、Dennis Roberts(賓夕法尼亞州立大學)、Steven Rogelberg(鮑靈格林州立大學)、Deborah J. Runsey(堪薩斯州立大學)、Robert Schutz(不列顛哥倫比亞大學)、N. Clayton Silver(內華達大學)、Patrick A. Vitale(南達科他大學)、Bruce H. Wade(斯佩爾曼學院)、Robert Williams(加勞德特大學)、Eleanor Willemsen(圣克拉拉大學)、Pamela Zappardino(羅得島大學)、Dominic Zerbolio(密蘇里大學圣路易斯分校)。多年來,Karl Wuensch博士(東卡羅來納大學)提出了許多建議、商榷意見和寶貴的忠告,他更應得到特別的感謝,Kathleen Bloom博士(滑鐵盧大學)和Joan Foster(西蒙弗雷澤大學)也是如此。科羅拉多大學的Gary McClelland慷慨地準許我使用他的一些Java程序,并且愿意在必要時按照我的需求加以修改。
我要感謝所有提出建議或指出錯誤的讀者(教師和學生)。我沒有足夠的篇幅來一一感謝他們,但是在標有“勘誤表”的網頁上,許多人的名字被列在了他們發現的錯誤的旁邊。
我要感謝佛蒙特大學的老同事。我雖然于2002年5月退休,但是仍然認為佛蒙特大學是我的智力故鄉。我更要感謝英國布里斯托爾大學的同事們,他們將學術假期的一部分用于完成本書的第一版。然而,最重要的是,我還要感謝所有學生——他們多年來幫助我了解問題所在,以及如何更好地接近他們。他們的鼓勵更是無比珍貴。這其中包括從未謀面但通過互聯網提出問題或評論的學生。(是的,我真的閱讀了所有這些信息,希望能回應所有這些信息。)
David C. Howell
于美國猶他州圣喬治市
2015年12月