本站小編為你精心準備了英語語音量具質量研究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
語音是英語交際能力的一個基本組成部分[1]。上世紀80年代,語言學者們達成共識,即使學習者語法全面,詞匯豐富,如果語音不能達到基本可理解的水平,交際同樣會失敗[2]。語音能力的考察離不開科學的語音測量工具,然而目前我國高校的英語語音測試仍以單一的朗讀口試為主,教師評分主要依賴綜合印象,不依據必要的評分細則,因此測試的可信度和有效性較差,無法體現學習者真實的語音能力,并對語音教學產生有益的反撥效應。鑒于此,本文將以筆者編制完成的一套英語語音測量工具為例,具體闡述量具的設計方法、內容、施測、評分與質量分析過程。
一、語音量具的設計
(一)設計方法
二語語音測試有兩種基本的設計方法:整體法(holisticapproach)和元素法(atomisticap-proach)。整體法長于考察學習者語音的綜合水平,便于操作,但測驗結果易受評判者主觀因素的影響,也不利于了解受試語音的具體特點。元素法比較費時,但此法將語音系統分解為若干獨立的項目予以考察,從而提供一系列關于受試語音的定量指標,有助于減少評判者主觀因素的干擾,對受試語音的具體特點做出診斷。相比較而言,元素法為研究語音狀況提供了一個定量檢測手段,更能客觀真實地反映出受試的語音能力[3-4]。本文中量具的設計就基于元素法。
(二)量具構成
量具構成取決于對所測量的語音能力的界定。英語語音學可分成音段語音學和超音段語音學。音段又叫音段音位(segmentalphonemes),指從話語序列中分離出來的、可識別的離散語音單位,即元、輔音;超音段(suprasegmentals)指話語中大于單個音段的發聲單位。Dalton&Seidlhofer[5]等研究表明,重音、節奏和語調決定話語的可理解性,是最重要的超音段特征。英語語音能力的發展存在“接受性”和“產出性”,“音段”和“超音段”能力發展不均衡的現象。譬如,學習者能辨認出語調模式的異同,但未必能正確地將其讀出;學習者的音位聽辨能力很強,但未必能準確聽辨出重音位置。因此語音能力的界定應包括接受性、產出性、音段和超音段這四個層面。以該定義作為命題的基礎,量具由接受性英語語音測試和產出性英語語音測試構成,較全面地考察受試者的接受性英語音段、超音段能力及產出性英語音段、超音段能力。
(三)測試內容每份測試都涵蓋音位、重音、節奏和語調四項分測試,由筆者參照相關英語語音的理論闡述及實證研究設計而成。
1.接受性英語語音測試音位分測試考察英國標準發音(ReceivedPro-nunciation,簡稱RP)中的輔音、元音和2個RP系統外的音位。測試詞選自孟憲忠[6]和王桂珍[7],不寫在答題紙上,以免給出音位-字位上的提示。題項由對應于編號“A、B、X”的三個單詞構成,“A”、“B”為音位最小對,受試者需判斷“X”的音位類型與“A”還是與“B”相同。單詞包含的音位數量相等,區別性音位的位置相同。重音分測試考察受試者能否聽辨出單詞中主重音以及單調群句中主重音的位置。題項由一對拼寫一致,但主重音位置不同的單詞或短句構成(如''''applicant/a''''pplicant;Ilike''''blueties/Ilikeblue''''ties)。測試詞的選擇參考Cruttenden[8]和Roach[9]提出的詞匯分類表及例詞,并考慮單詞的詞性、后綴類型、音節數、主重音位置等因素。測試句的選擇參考Speer等[10]。節奏分測試考察受試者對節奏模式和停頓位置的聽辨能力。在連貫語流中,重讀和非重讀音節的交替形成了固定的節奏模式,該測試涉及九種典型的節奏模式。題項由一對短陳述句構成,由受試者聽辨其節奏模式的異同。測試句選自孟憲忠[6]和王桂珍[7],包含同等數量的單音節詞。考察停頓位置的題項由一對停頓位置不同的短句構成,一個短句包含呼語,另一個包含同位語(如Henry,thelittleoneeatsalot/Henry,thelittleone,eatsalot),測試句選自Patel等[11]。語調分測試考察受試者對調核音調類型及語調模式的聽辨能力。英式傳統將一個完整的調群切分為調冠、調頭、調核和調尾,調核是唯一不可或缺的部分。調群的語調模式包括調核前調(調冠+調頭)和調核音調(調核+調尾),調核音調傳達調群的核心意思。該測試中針對調核音調的題項選自Dankovicov觃等[12],測試高降、低降、高升、低升、降升、升降、升降升等七種類型。受試者需判斷三個單音節詞和三個短語中調核音調的類型。短語包含四個單音節詞,調核位于第一個音節。每個單詞或短語分別以四種調核音調讀出。針對語調模式的題項由一對拼寫相同,包括調頭、調核和/或調尾的單調群句構成,但以相同或不同的語調模式讀出供聽辨。句子選自卜友紅[13],測試四種語調模式,涉及高平/低平、遞降、遞升三種調頭和上述七種調核音調類型。接受性語音測試的語料由筆者和一名英語本族語者通過CoolEditPro2.0錄制而成,錄音采樣率為16000(16kHz,16bitmonoPCM)。本族語者朗讀除語調分測試外的其他語料。語調部分的測試詞句朗讀完畢后,立即輸入Praat4.4.20檢驗,確保獲得理想的調核音調類型和語調模式。
2.產出性英語語音測試音位分測試的設計參考Knickerbocker[14],內容為選自外語學習軟件“TellMeMore”的10個句子。句子由簡易的單詞構成,考察受試者對輔音、元音以及其他3個RP系統外的音位的朗讀能力。重音分測試考察受試者能否準確地按標注讀出詞、句重音。測試內容選自Cruttenden[8]、孟憲忠[6]和Roach[9],為18個單詞和一個置于5種語境下的陳述句,句前附有中文提示。節奏分測試的測試內容是一首韻律詩,選自王桂珍[7],考察受試者能否在篇章層面上運用弱讀、連讀等手段讀出英語重音-節拍型的節奏特點。語調分測試考察受試者對句子語調的模仿能力。6個測試句選自用于產出性音位分測試的句子,時長最多持續2.5秒,在Fraisse[15]建議的短時記憶廣度上限5秒以內。句子語調變化豐富,涉及陳述句、感嘆句、一般疑問句和特殊疑問句四種類型。
二、預測試與題項分析
(一)受試和施測
筆者在南京農業大學非英語專業一年級抽取45名學生作為受試對象進行了預測試。施測分兩步進行。第一步,在語音室隨堂進行了約50分鐘的接受性語音測試。測試前向受試者介紹音位、節奏模式等語音概念,并播放范例試做。測試時題項播放一遍,受試者在答題紙上作答。第二步,在課后進行一對一的產出性語音測試,人均5分鐘。受試者測試前可出聲練習,測試時按照書面指示朗讀,注意發音的清晰度、重音標注和節奏感。語音產出由CoolEditPro2.0錄制保存。語調模仿基于“TellMeMore”句子發音的界面完成,每個句子聽兩遍,聽完一遍立即模仿一次,共模仿兩遍。
(二)測試評分
評分采用綜合法和分析法相結合的形式。接受性語音測試為客觀題,由筆者根據答案評判。產出性語音測試中的語調分測試由“TellMeMore”的內置系統自動評分。每模仿一次,系統就比對受試者與目標語朗讀者語調模式的相似度在7個等級內打分,受試者最終得分為模仿總分的均值乘3。其余分測試由兩名語音教師根據評分細則和參考錄音獨立評定。評定音位產出時,首先判斷單詞發音是否準確,如不準確,需進一步聽辨出讀錯的音位。音位讀錯一個扣除0.5分,最終得分取兩名評分員給分的均值。評定重音產出時,只有當兩名評分員一致判定該讀的音節或單詞予以了重讀才能得1分。節奏產出用綜合法評定,根據受試者朗讀的節奏感與本族語者的接近程度在5個等級內打分,最終得分為評分員給分的均值乘3。
(三)題項分析
評分結束后,筆者將每名受試者的題項得分逐一輸入電腦,運用SPSS16.0對兩份語音測試試卷做題項分析,以便客觀地檢驗每道試題的質量,為改進量具提供必要的依據。接受性語音測試由163道客觀題組成,針對調核音調的24個題項是四選一的多項選擇題,其余題項均為二選一的是非選擇題,筆者計算了每個題項的難易度和區分度。難易度用易度值(FV)表示,計算公式為(corrrectU+correctL)÷2n,n表示每個組別的人數,CorrectU和CorrectL分別表示高分組和低分組中答對題項的人數;區分度用區分指數(D)表示,計算公式為(:correctU-correctL)÷n。實際計算時,將受試者按總分高低依次排列,選取最前面和最后面27%的試卷歸入高分和低分兩個組別[16]180[17]255-257。易度值越高,題項就越容易。選擇題的作答可能存在猜測因素,導致難度降低,因此Nitko提出易度值在0.75~0.85之間的是非選擇題就可以接受[18]72-74。在題項難易度的基礎上,還應進一步考察其區分指數,因為一道非常容易的試題盡管無法區分優秀與良好的考生,卻有可能將較差與特別差的考生區別開來。一般來說,區分指數越高,說明題項區分考生之優劣的能力就越強,區分指數低于0.3的題項須經改進后使用或棄而不用[17]256-257。題項分析后,接受性語音測試符合要求的題數降至76(見表1)。整份試卷的平均難度和區分度為0.599和0.478,比較理想。表1接受性語音測試的題項篩選情況產出性語音測試共有40個題項,屬于主觀測試。筆者以獨立樣本t檢驗分析了針對重音、節奏和語調的題項區分度,發現98%的題項區分度高,近80%的題項能在0.001的水平上顯著地區別英語語音能力強和弱的受試者,因此所有的題項得以保留。
三、正式測試與信度、效度分析
(一)受試
參加正式測試的有效受試者為南京農業大學216名學生,其中61名為英語專業二年級學生,另外155名為非英語專業一年級學生,來自不同的文、理專業。受試者平均年齡20歲,男生81人,女生135人。語音量具是經過題項分析和篩選的接受性與產出性英語語音測試,施測和評分過程與預測試相同,最后使用SPSS16.0進行信度和效度分析。
(二)信度分析
信度指測試結果的可靠性或一致性,在很大程度上取決于測試和評分的客觀性[20]45-46。測試信度可用不同的方法驗證。筆者采用內部一致性信度檢驗來評價和衡量測試各部分之間的一致程度。接受性語音測試的信度檢驗法為折半法,即將試卷按題項編號的奇、偶數分成幾乎等值的兩半,計算出這兩半試卷測試結果之間的相關系數,然后通過Spearman-Brownprophecy公式進行調整,計算得出折半信度系數為0.823;產出性語音測試的信度計算公式為N÷(N-1)×[1-m×(N-m)÷Nσ2],其中N為測試的題項數,m為測試均分,σ為測試分的標準差[16]164,結果得出信度系數為0.897,說明語音量具的信度較高,質量可靠。主觀性測試的評分不可避免地受到評分員主觀因素的影響而導致誤差。評分員信度研究就是針對評分員所評的分數進行探討。評分員信度主要分成兩類:評分員之間的信度和評分員自身信度。本文主要涉及前者,考察在評價產出性音位、重音和節奏的過程中評分員之間評分的一致性。結果發現重音分測試的評分一致率達85.1%(評判一致的題數÷受試朗讀的總題數),音位和節奏分測試的評分員組間相關系數分別為0.889和0.845(p=0.000),評分的一致性較高。
(三)效度分析
效度指測試所能測出預定要測量的事物的程度。效度與測試目的密切相關,所以有的學者明確將效度定義為成功地實現測試目的的程度。如果旨在考察口頭交際能力的英語口試中出現了要求考生“談談普通列車和懸浮列車異同”的試題,這種測試的效度就應受到質疑,因為所測試的主要不是語言而是相關的背景知識[17]41-42。效度具體可細分為內容效度、結構效度、同期效度、預測效度和反撥效度。結構效度是各種效度之本,指測試所能反映作為其基礎的相關理論假設的程度[17]43[19]。結構效度的驗證通常通過相關矩陣和因素分析來考查測試試卷各大項之間的關系。語音量具服務于測試語音能力這一目的,對語音能力的理論闡述和界定構成了筆者所設計的語音測試試卷結構效度的理論基礎。接受性和產出性英語語音測試各涵蓋四項分測試,分測試的內部相關系數及其與總分之間的相關系數見表2。一般來說,如果兩部分間的相關系數太高,說明兩者考的是相同的能力,是一種不必要的重復,只要保留其中一個部分即可;如果兩部分間的相關系數太低,則又說明考的是完全不同的能力,可能是語言之外的其他因素在起作用。楊惠中、Weir[20]認為各部分間的相關系數應該在0.3~0.7之間才合適。從表2可見,兩份測試試卷各分測試之間以及各分測試和總分之間均在0.01的水平上顯著相關,超音段(重音、節奏、語調)測試與總分之間的相關性更高,說明和音段能力相比,超音段能力更能體現學生的語音水平。為進一步探討各分測試之間的關系,需進行探索性因素分析,因素的提取采取主成分分析法。接受性和產出性英語語音測試的KMO(測度值分別為0.612和0.797,>0.5)和Bartlett球型鑒定(顯著值均為0.000)結果表明,測試的數據特征符合因素分析的要求。由表3可知,對兩份測試而言,按特征值大小可依次找出四個因素,其中“因素1”的特征值遠大于1,其貢獻分別達到62.2%和69.6%。表4顯示,在四項分測試的考試內容中,“因素1”的負荷系數最大,接受性語音的各分測試分別在0.471~0.645之間“,因素1”可以看作是“接受性英語語音能力”;產出性語音的各分測試分別在0.554~0.781之間,“因素1”可以看作是“產出性英語語音能力”。上述數據說明,語音量具的效度較高。語音能力可以分解,又相互有關,各部分的綜合能較好地反映出學生總體的語音能力。
四、結語
經過對英語語音能力的界定、命題、構卷、預測、題項分析、題項篩選、正式測試、信度和效度分析等諸多環節的操作后,筆者編制的英語語音量具的質量已經有了相當的保證。但是,有效、準確地測量大學英語學習者的語音能力是一個十分值得研究的課題,本文未涉及的問題還很多,例如:如何考核學生在真實語境中語音產出的應用能力?如何開展主考和評分員的業務培訓?如何解決施測過程中學生人數多、語音設備不足、測試成本高等實際困難?如何建立學生的語音檔案,以便進行針對性教學?等等。希望更多的同行專家能對該課題進行深入的探究,共同構建和完善我國大學英語語音測試體系。