本站小編為你精心準備了大學英語四級試題語料庫的思考參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
一、語料庫平臺搭建實踐的注意事項
目前搭建語料庫所使用的軟件較為豐富。由于所搭建的是一個微型語料庫,所以在軟件使用上就比較靈活,我們使用的是北外的免費軟件。另外,因為四級試題語料庫需要用最新的語料,才能獲得最具說服力的核心詞匯和例句,所以我們在制作四級試題語料庫的時候,使用的是近五年的試題。
(-)掃描版本盡量清晰大學英語四級的試題相對比較容易搜集,網絡有很多的資源,因此有很多現成的電子版文檔可以進行校對使用。但是依然是有一些試題不好搜尋,尤其是聽力原文,因此還是需要我們用紙質資料進行掃描。需要格外注意的是,掃描的版本越清晰,轉化為word文檔的錯誤就會相對越少,因此在可操作的范圍內盡可能的讓掃描版本清晰,這樣可以減少后期校對的時間。
(二)word文檔校對在轉化為word文檔之后的校對工作是非常費時費力的,需要特別細致認真的進行這項工作。在校對時,要格外注意空格、標點、全角半角、原有網絡格式、段落劃分等因素。這些因素會影響之后轉化為txt文檔的質量,如果校對不細致就很有可能在下一步出現問題,進而出現返工的情況。需要格外說明一點,尤其是段落劃分這個因素,在校對時要注意中英文兩個版本是否閃配,以免在對齊環節出現問題。
(三)做好標注標注是語料庫生成之后進行檢索的重要信息,詳細的標注可以幫助語料庫使用者獲得盡可能多的關于語料的詳細信息。為了方便語言研究和語言教學,標注應當盡可能的詳細。對于大學英語四級試題來說,詳細的信息包括考題的年份;月份,試題的題型,最后生成txt文本的語言類型。因此在做標注的時候要注意把以上信息都包括進去,方便后期進行語料的收集和有可能進行的語料比較。
(四)對齊時注意亂碼之前提到了,由于有些文件是從網絡上找到的,因此有些網絡格式在校對時很難發現。等放到txt文件中再進行標注對齊的時候,這些網絡格式所產生的亂碼就出現了。但是如果不逐行仔細觀察,這些亂碼有可能就不會被發現,就會影響語料的搜索和使用。所以在對齊的時候,注意亂碼很重要。另外,在這個步驟中還要注意檢查是否每一段都對齊的很工整,段落數量是否匹配,斷句是否中英文對應等等。
(五)保存中英文txt文檔在對齊工作完成以后就可以保存為兩個最終的干凈文本。在保存的時候要按照語言類型分別保存為兩個文檔,即中英文分別保存。
二、預期效果
在語料庫生成之后,會根據在近五年的試題中出現單詞的頻率高低做出一個詞匯表。當然這個詞匯表并不是最終的版本,.因為會產生很多沒有價值的單詞,而且出現頻次非常高,比如“I”,"is"等等,所以需要教師手動篩選四級詞匯。
篩選完成后就可以制作詞匯冊,把四級的高頻詞列出來,附上在考試題中出現的相應例句方便學生學習記憶。這樣學生得到的詞匯積累是比較系統和科學的,既可以清楚地知道哪些單詞是高頻核心,又可以對于這些詞的用法和搭配一目了然,能夠大大幫助學生們的學習。在小范圍的課堂試點中,學生對于這種單詞冊的興趣遠遠大于課本單詞,他們認為這樣的做法比較符合他們的需要,背起來會更有動力,而且結合例句的學習,能夠更強化對單詞的記憶,還能夠了解詞和句的搭配。另外,通過這個語料庫平臺的搭建,學生還可以實現檢索的目的。如果學生遇到了比較陌生的單詞,不清楚這個詞的用法,可以用語料庫進行檢索,便可以清晰的看到四級題庫中這個單詞出現的例句,一目了然。這個功能還可以實現漢譯英的功能,遇到翻譯中不會表達的漢語詞匯,也可以通過檢索的功能進行查閱,學生只要根據例句的表達,就可以選出自己滿意的詞匯。
因此,大學英語四級試題語料庫的搭建,可以在多方面提高學生的英語能力。如果運用得當,聽力、閱讀、翻譯、寫作等能力都能夠得到很大程度的提高。而且,使用這個平臺會在很大程度上減少老師的負擔,本來都需要老師去輔導的內容,學生自己進行搜索就可以得到,把老師從繁重的語法教學和搭配教學中解放出來。再者,這個平臺對于學生自學能力的培養也是非常有幫助的,老師反復講解的用法和搭配,學生只需要搜索就能看到,增加學習興趣的同時,也能夠做到自學。
三、結語
大學英語四六級考試只是學生們大學階段的一個基礎性的考試,在很大程度上依賴于學生詞匯量的累積和使用,而雙語語料庫最擅長的就是檢索詞匯。因此,這兩者的結合將會對學生詞匯的學習和使用產生很大的推動力,大大提升學生在四六級考試中的分數。如果運用得當,還可以語料庫作為上課的一個非常好的輔助工具,優化大學英語教學的效果。
作者:朱曉慧單位:北方工業大學文法學院