第二語言口語測試新探
鄭新民
(福州大學(xué)外語學(xué)院,福州 350002)
摘要:《第二語言口語測試》一書吸收了第二語言教學(xué)方法,第二語言習(xí)得以及第二語言測試等最新科研成果,對以往口語測試評價標準的各種研究作了系統(tǒng)的和全面的整合。在批判和借鑒的基礎(chǔ)上,該書創(chuàng)造性地發(fā)展了測試標準的新模式,從而拓寬了該領(lǐng)域的涵蓋面。該書還從哲學(xué)的認識論角度出發(fā),闡釋了在第二語言口語測試中科學(xué)合理地使用定量和定性研究的重要性和必要性。此外,作者在處理篇章結(jié)構(gòu),定義詮釋,實例列舉,內(nèi)容安排,重點把握等方面也都極具特色,十分成功。
關(guān)鍵詞:第二語言;口語測試;評價標準
1.引言
作者簡介:鄭新民(1957-)男,博士,教授。研究方向:英語應(yīng)用語言學(xué)、課程設(shè)置、教師認知、英語教學(xué)等。 |
2.內(nèi)容介紹
2.1歷史回顧
第一章回顧了自第一次世界大戰(zhàn)(1914-1918)以來口語測試在美國發(fā)展的歷史。作者指出,第二語言口語測試作為一種語言特殊能力的測試是在特殊的歷史背景下(第一、第二次世界大戰(zhàn)期間以及冷戰(zhàn)時期),為了特殊的目的(確保軍人和特工的生命安全)應(yīng)用而生和逐步發(fā)展完善起來的。作者認為,盡管口語測試一向備受關(guān)注,但一直沒有一套符合美國流行的定量心理測量學(xué)的測試標準可供參考使用,造成了其地位無法跟筆試的地位平起平坐的客觀事實。最后,作者在本章末尾還就主考教師(rater)評分的信度,可能出現(xiàn)的偏見,可能影響考生表現(xiàn)的幾種因素,口語測試的反撥效應(yīng),語言能力和交際能力之間存在的張力(tension)等問題作了深入淺出的分析。
2.2口試構(gòu)念的定義
給第二語言口語測試構(gòu)念(construct)下定義不是一件簡單的事情,既可以從語音語調(diào),準確性和流利性的角度看問題,也可以從陳述策略的角度看問題,亦可以從互動關(guān)系的角度看問題,甚至還可以從語用分析或話語分析的角度看問題。作者指出,科學(xué)嚴謹?shù)亟o第二語言口語測試構(gòu)念下定義,對于測試評價的客觀性和可信度具有不可低估的意義。本章對口語測試構(gòu)念中一系列重大的問題進行了權(quán)威性的詮釋,其中包括理論與研究之間的關(guān)系,能力與表現(xiàn)之間存在的差異,以及測試目標確定等。
2.3口試任務(wù)的種類
考試任務(wù)難度的設(shè)定一向是口語測試標準中的難點,也是眾多研究者感興趣的研究熱點。在第三章中,作者吸收了第二語言教學(xué)方法,語言習(xí)得以及語言測試等科研成果,提出關(guān)于口語測試描述任務(wù)的新框架(aframework for describingtasks),其中包括:(1)任務(wù)的定位,(2)相互作用的關(guān)系,(3)目標的定位,(4)提問者與熟悉程度,(5)話題,(6)環(huán)境等。這一框架的提出為研究任務(wù)難度與其他因素之間的關(guān)系提供了新視角。作者還以一些考試題型為實例,探究不同的考試是如何采取不同的方法來激發(fā)考生在考場中發(fā)揮各自的表現(xiàn)能力,并對這些方法的優(yōu)缺點作了頗具獨到見地的點評。
2.4評價等級
盡管作者反復(fù)地強調(diào)口語測試任務(wù)的重要性,但他意識到單從任務(wù)種類的角度看問題是片面的和不客觀的表現(xiàn),他建議應(yīng)該細致地研究任務(wù)種類,環(huán)境因素和主考教師行為之間的互動關(guān)系。作者在第四章中劃分了測試中不同的評價等級,探討了如何使用直觀法(intuitivemethod)和另外其他三種不同的實證方法(empiricalmethods)來設(shè)計第二語言口語測試的評價等級等,這些內(nèi)容都具有很強的實用性。
2.5測試規(guī)范
第五章提出設(shè)定考試內(nèi)容規(guī)范的模板。綜合第二至第四章所討論的內(nèi)容,作者在本章中闡釋了效度(validity)的概念,作者指出,測試規(guī)范制定的過程不是一個線性的過程,而是一個“凌亂”的過程,因此保持口語測試構(gòu)念,測試任務(wù)和測試評價之間的效度的穩(wěn)定性是十分的重要。作者通過分析四個案例中的測試規(guī)范存在的問題,修正了Davidson&Lynch(2002)的測試標準模型,并將其發(fā)展成一種更為系統(tǒng),更為合理的口語測試標準的通用模板(generictemplate)。
2.6主考教師,培訓(xùn)以及管理問題
在第六章中,作者指出,從某種意義上說,任何一種語言的口語測試的信度(reliability)在很大的程度上取決于主考教師的行為,有足夠的證據(jù)表明主考教師之間評分的信度相對較低。為了改變這種狀況,國際上各主要考試中心除了要制定完善的測試標準之外,還要十分重視對主考教師實施嚴格的培訓(xùn)和考核制度,這是一種耗資巨大的投入。作者建議使用培訓(xùn)制度來選拔淘汰主考教師,同時注意保持主考教師隊伍的構(gòu)成應(yīng)具有一定的廣泛性和多樣性。最后,作者對考試的組織和實施等管理問題作了探討,其中包括考試環(huán)境可能對考生得分所造成的影響,殘疾人士所需要的幫助,成績的派送,和考試經(jīng)費使用等。
2.7口語測試的評估
第七章進一步探討了口語測試中有關(guān)效度評估的問題。作者對直接口試法(OPI),小組討論測試法(inpairs or groups),和間接口試法(computer ortape-mediated)等三種不同的測試形式的效度問題提出了獨特的看法和積極的對策,接著作者總結(jié)了Messick(1989:13-103,1992:13-23)有關(guān)效度的研究模式,對獨立性,結(jié)構(gòu)性,內(nèi)容,概化(generalizability)和結(jié)果等因素作出嶄新的詮釋。
2.8口語測試研究的方法論
在口語測試研究中廣泛地采用定量和定性的研究方法已成為一種趨勢,在以往出版的口語測試專著中對此亦有論述,只不過側(cè)重點各有不同。作者在第八章中除了討論定量研究中的相關(guān)分析、因子分析和Rasch模型分析之外,還著重討論了概化研究(generalizabilitystudies)――一種借助ANOVA或MANOVA方差或協(xié)方差分量分解的方法對測量情景中的誤差進行分解的方法,這一方法對分析口語測試中各種相關(guān)因素間的關(guān)系切實有效。作者還就定性研究中的專家判斷(expertjudgment),訪談,問卷,話語分析和言語報告分析(verbal reportanalysis)等研究手段加以探討。此外,作者還特別就如何科學(xué)、合理、正確、綜合地使用這些方法提出了獨到的見解,這在其他有關(guān)口語測試著作中是不多見的。
3. 簡評
通讀《第二語言口語測試》一書,我們不難發(fā)現(xiàn),作者在梳理各家有關(guān)第二語言口語測試的原理時,采取“詳人之所略,略人之所詳”的研究方法,注重吸收他人的新思想,新理念,新觀點,新視野,新成果,對以往口語測試評價標準的各種研究作了科學(xué)的、深入的、全面的整合。作者還勇于對一些高端的理論和模式提出質(zhì)疑和修正,有批判、有借鑒、有創(chuàng)造性地發(fā)展了測試標準的新模式,從而拓寬了該領(lǐng)域的涵蓋面。作者對如何選拔和培訓(xùn)主考教師的見解也頗具匠心,提出富有積極的建設(shè)性意見,同時,作者關(guān)心考生,尤其是關(guān)心殘疾考生的提法充分體現(xiàn)了現(xiàn)代文明社會以人為本的教育理念。作者深厚扎實的理論功底,高度嚴謹?shù)木C合分析能力,清晰開闊的創(chuàng)新視野幫助我們深刻地解讀科學(xué)哲學(xué)的認識論和方法論,使我們清楚地認識到在包括口語測試在內(nèi)的應(yīng)用語言學(xué)領(lǐng)域中,科學(xué)合理地使用定量和定性研究的重要性和必要性。此外,作者在處理篇章結(jié)構(gòu),定義詮釋,實例列舉,內(nèi)容安排,重點把握等方面也都極具特色,十分成功,使讀者能在較短的時間內(nèi)最大限度地吸收和借鑒第二語言口語測試的理論精華和最新的科研成果。
當然,該書還存在著些許不足和尚待完善和深化之處。例如作者在論述定性研究時所用的數(shù)據(jù)過于貧乏單一,缺乏啟迪性,作者對課堂和測試中使用的一種重要方法――傳播人種學(xué)方法(theethnography of communication)(Mercer,1995;van Lier,1996:157-182,1998)――也只是蜻蜓點水,一帶而過,有待于進一步的深化研究。盡管如此,瑕不掩瑜,《第二語言口語測試》一書無疑對我國在二語口語教學(xué)和口語測試研究中將起著具有積極的、現(xiàn)實意義的理論指導(dǎo)作用。
* Glenn Fulcher. 2003. Testing Second LanguageSpeaking. Harlow: Pearson Longman. xxi + 288pp.
參考文獻
[1] Bachman, L.F.Fundamental Consideration in Language Testing [M].Oxford: Oxford University Press, 1990.
[2] Davidson, F. & B. Lynch. Testcraft: A Teacher's Guideto Writing and Using Language Test Specifications [M].London: Yale University Press, 2002.
[3] Graddol, D. The Future of English? : A Guide toForecasting the Popularity of the English Language in the21st Century [C]. London: BritishCouncil, 1997.
[4] Hughes, A. Testing for Language Teachers[M].Cambridge: Cambridge University Press, 2003.
[5] Hymes, D. Oncommunicative competence [A]. In Pride, J. & J. Holmes (eds.)Sociolinguistics [C]. Harmondsworth: Penguin, 1972.
[6] McNamara, T.Measuring Second Language Performance: A New Era inLanguage Testing[M]. New York: Longman, 1996.
[7] Mercer, N. The GuidedConstruction of Knowledge: Talk amongst Teachers andLearners[M]. Clevedon: Multilingual Matters, 1995.
[8] Messick, S.A. Validity[A]. In Linn, R.L.(ed.) Educational Measurement [C].New York: Macmillan, 1989.
[9] Messick,S.A. The interplay of evidence and consequencesin the validation of Educational Researcher performanceassessment [J], 1992 (23).
[10] Skehan, P. A. Cognitive Approach to LanguageLearning [M]. Oxford: Oxford University Press, 1998.
[11] Stansfield, C. & D. Kenyon. Research on thecomparability of the Oral Proficiency Interview and the SimulatedOral Proficiency Interview [J]. System, 1992(20).
[12] van Lier, L. Interaction in the language curriculum:Awareness, Autonomy, and Authenticity [M]. London:Longman,1996.
[13] van Lier, L. Constraints and resources in classroom talk:Issues of equality and symmetry[A]. In Byrnes, H. (ed.) LearningForeign and Second Languages: Perspectives in Research andScholarship [C]. New York: The Modern Language Association,1998.
[14] Wire, C.J. Communicative Language Testing[M]. New York: Prentice Hall International,1990.

Review on Testing Second Language Speaking*.
ZHENG Xin-min
(College of Foreign Languages, Fuzhou University, Fuzhou,Fujian, 350002, China)
Abstract: The book offers the first systematic, comprehensiveand up-to-date treatment of the evaluation of specifications oftesting second language speaking,based on the latest researchoutput in second language pedagogy, second language acquisitionresearch, and second language speaking tests. This book criticallyand creatively develops the new theoretical framework and modelsfor explanations of the process of test design, evaluation ofspeaking tests, and task types for testing speaking. Fromphilosophical perspective, this book successfully demystifies theprocess of testing speaking and provides a thorough treatment ofthe key ethical and technical issues in speaking evaluation,including approaches to researching speaking tests and specificmethodologies
Key words: second language; testing speaking; evaluation ofspecifications
愛華網(wǎng)



