本站小編為你精心準備了教師工作坊中學員話題挖掘方法參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
摘要:教師工作坊為校際間教師的協(xié)同研修提供了良好的平臺,是促進教師專業(yè)發(fā)展的主要方式之一。該文針對教師工作坊研修過程中難以進行有效監(jiān)測和及時指導的問題,利用學員研討產(chǎn)生的交互式文本數(shù)據(jù),提出了一種教師工作坊中學員話題挖掘方法。該方法利用內(nèi)容語義分析法對學員評論反思內(nèi)容進行整體分析;運用LDA模型自動挖掘不同類型學員發(fā)表的評論中的隱含話題和跟蹤學員熱點話題演化趨勢。論文以典型的教師工作坊為例進行實驗,實驗結(jié)果表明:學員們能圍繞研修主題進行討論;相比普通學員,成績優(yōu)秀學員在學習態(tài)度上更顯主動;如在多媒體、微課的技術應用等方面有著更深的認識和理解;而有關“技術支持的總結(jié)與復習”和“技術支持的教學評價”的話題并沒有出現(xiàn)。話題演化趨勢的實時反饋可視化分析,為引導研修活動深化發(fā)展提供了重要支持;也為教師工作坊的學習分析提供了一些可借鑒的思路。
關鍵詞:教師工作坊;話題挖掘;LDA模型
百年大計,教育為本;教育大計,教師為本。促進教育質(zhì)量提升,教師隊伍建設是關鍵[1]。而優(yōu)化教師隊伍結(jié)構,提升教師專業(yè)水平,需完善教師培養(yǎng)培訓體系,做好培養(yǎng)培訓規(guī)劃[2]。教育信息化的發(fā)展使得教師培訓方式發(fā)生了轉(zhuǎn)變,線上線下相結(jié)合的混合式研修成為促進教師專業(yè)發(fā)展的主要手段。在網(wǎng)絡學習空間中,支持創(chuàng)建、參與、關注教師研修工作坊[3],開展跨校教師協(xié)同研修。教師工作坊是一種體驗式、參與式、互動式的學習模式,一般以富有經(jīng)驗的教師為中心,形成30-50人的學習研究共同體,主要通過討論、活動等多種形式,共同探討和嘗試解決課堂教學中存在的問題。助學者(坊主)在教師工作坊中扮演協(xié)助、觀測、支持、引導等作用,需要了解研修過程中學員認知水平、學習狀態(tài)等,及時發(fā)現(xiàn)存在的問題,并提供學習支持服務。學員們在進行網(wǎng)絡研修主題研討過程中產(chǎn)生了大量的交互式文本,能客觀地反映出學員的興趣話題、學習體驗和研修狀態(tài)等特征,這為優(yōu)化研修過程、提升培訓質(zhì)量等提供了大量線索。然而,傳統(tǒng)的內(nèi)容分析方法通過文本分析、內(nèi)容編碼、統(tǒng)計闡釋等過程,不僅費時費力而且還存在評價的主觀性和反饋的滯后性等問題[4];并且隨著培訓規(guī)模的擴大、研修數(shù)據(jù)的急劇增加,使得指導者難以及時洞察研修活動的過程和狀態(tài),并進行針對性的指導。論文聚焦教師工作坊研修過程中難以進行有效監(jiān)測和及時指導的問題,對教師工作坊的研修特征及當前話題挖掘的研究情況進行了分析,針對性的構建了教師工作坊學員話題挖掘框架。利用教師工作坊中學員研討產(chǎn)生的交互式文本數(shù)據(jù),并結(jié)合教師信息化教學TPACK能力模型,分析了研修過程中的高頻詞匯特征;采用LDA(LatentDirichletAllocation)模型重點分析了研修內(nèi)容的話題結(jié)構、分布情況以及研修過程的話題演化等。
一、相關研究
(一)教師工作坊及特征教師工作坊是由若干成員組成(包括坊主、研修學員等),他們聚焦于特定教學主題,開展觀摩、體驗、討論、反思等活動,旨在通過相互交流、經(jīng)驗分享、協(xié)同研討來解決教學實際問題,促進教師實踐性知識的發(fā)展[5][6]。教師工作坊是具有共同愿景、互惠互助性質(zhì)的學習型組織[7]。相關理論基礎主要包括建構主義理論、認知學徒制、活動理論、情境學習理論、知識轉(zhuǎn)移及知識共享理論等。王陸[8]基于活動理論將教師在線實踐社區(qū)視為一種活動系統(tǒng)。劉清堂等[9]認為教師混合式培訓是一個研修活動序列,序列的展開構成了多層次教師混合式培訓活動流,活動流中的活動亦可依次序展開。張思等[10]認為在教師工作坊的活動序列設計上,通過搭建腳手架實現(xiàn)學員學習的漸進有序,知識與技能的逐步遞增,使得學員能夠順利跨越“最近發(fā)展區(qū)”,達到學習目標。楊卉等[11]提出在遠程職業(yè)教育中,應為教師提供監(jiān)測工具支持教師對學生(團體)活動過程進行觀察,以便推送學習支架,幫助學生順利完成任務。王陸[12]基于情境學習理論,并根據(jù)培訓項目的實施階段,采用內(nèi)容分析法對教師在線實踐社區(qū)中學習共同體的實踐性知識發(fā)展過程進行評估。欒學東[13]認為,促進教師在線實踐社區(qū)中知識的轉(zhuǎn)移,應對非結(jié)構化和半結(jié)構化數(shù)據(jù)進行挖掘和分析,尋找知識轉(zhuǎn)移服務對象,并提供支持策略促進知識擁有方與知識需求方之間的知識轉(zhuǎn)移。已有的研究為教師工作坊研修過程的分析提供了啟示和參考。但相關研究大多聚焦于活動過程的實施和實踐性知識的遷移等方面,而對于研修過程中的話題內(nèi)容特征與教師信息化教學能力的關聯(lián)性及能力水平的監(jiān)測與評價等尚缺乏深度思考。
(二)話題挖掘及相關研究話題挖掘(TopicMining)較早出現(xiàn)在TDT領域,TDT技術(TopicDetectionandTracking,話題識別與跟蹤)是一項信息處理技術[14],主要應用于輿情監(jiān)測。話題識別(TopicDetection)是指自動識別信息片斷集合中的各個未知話題,并能在線檢測出新話題。話題跟蹤(TopicTracking)是指在各種信息來源中追蹤那些討論目標話題的相關信息片段[15]。目前,話題挖掘已普遍應用于產(chǎn)品推薦服務、新聞熱點追蹤和社交網(wǎng)絡交互等多個方面。常用的話題挖掘算法有VSM(VectorSpaceModel)、LSA(LatentSemanticAnalysis)、PLSA(ProbabilisticLatentSemanticAnalysis)及LDA(LatentDirichletAllocation)等[16],其中比較有代表性是LDA模型。LDA是機器學習領域的一種非監(jiān)督話題建模方法,用于發(fā)現(xiàn)數(shù)據(jù)集中隱藏的話題結(jié)構和內(nèi)容[17],如今應用也較為廣泛。如Mao等[18]通過挖掘用戶評論數(shù)據(jù)構建用戶興趣話題模型,實現(xiàn)電影的個性化推薦。Mahajan等[19]通過對財經(jīng)新聞主題的挖掘預測股市漲跌。Zhang等[20]通過對微博話題的挖掘發(fā)現(xiàn)熱點主題。在教育領域,Ramesh等[21]基于MOOC論壇內(nèi)容進行話題挖掘,以及時發(fā)現(xiàn)學生學習過程中的相關問題,進而針對性實施早期干預,提高課程留存率。劉三等[22]應用LDA模型自動挖掘和解析MOOC文本評論信息的特征結(jié)構和語義內(nèi)容,并分別對已完成和未完成兩種類型的學習者展開定性的學習分析研究,探究和追蹤學習者關注的熱點話題演化趨勢,以進行適應性反饋與干預。在教師工作坊中,學員們在進行網(wǎng)絡研討活動時產(chǎn)生了大量的交互式文本數(shù)據(jù),這些數(shù)據(jù)作為活動過程的重要信息載體,可真實地反映學員關注的焦點、知識和能力的變化等情況,通過對這些數(shù)據(jù)的挖掘,有助于及時發(fā)現(xiàn)學員在研修過程中隱藏的內(nèi)在信息,從而實現(xiàn)對學員研修狀態(tài)的實時跟蹤、評估和干預。LDA為數(shù)據(jù)驅(qū)動的網(wǎng)絡研修培訓分析提供了一種新的論證方法,該方法突破了教學過程互動話語分析中過度人為干預和經(jīng)驗式判斷的局限[23],能為教師工作坊的研修過程分析提供一種新思路,為教師的研修實踐提供數(shù)據(jù)支撐服務。
二、教師工作坊學員話題挖掘方法
教師工作坊的實施流程是由若干個活動組成的活動流。本研究以組成活動流的各個活動為單位劃分時間窗口,對每個時間窗口(活動階段)中生成的討論文本分別進行話題挖掘,追蹤各活動階段學員關注話題的熱度情況,并進行話題演化分析,以觀測教師工作坊研修活動進程,及時發(fā)現(xiàn)問題和需求,并提供學習支持服務。在研修活動的最后階段,教學管理者根據(jù)學員的課程學習、活動參與及作業(yè)完成等情況給予一個最終考核成績。本研究以成績的高低劃分不同類型的學員,并挖掘不同類型學員之間話題分布的特征結(jié)構和語義內(nèi)容,探究其相似性和差異性,為研修活動的設計和知識轉(zhuǎn)移策略的實施提供支持。
(一)教師工作坊學員話題挖掘框架基于以上分析,本文設計了教師工作坊學員話題挖掘框架。如下頁圖1所示,整個分析流程可分為數(shù)據(jù)收集、信息加工和結(jié)果應用三個環(huán)節(jié)。1.數(shù)據(jù)收集。學員是模型的出發(fā)點也是最終的受益者,學員在參與網(wǎng)絡研修活動過程中形成了大量的交互式文本數(shù)據(jù),在對數(shù)據(jù)進行采集和預處理過后,形成交互式文本數(shù)據(jù)集。2.信息加工。對數(shù)據(jù)集進行挖掘、分析并予以可視化呈現(xiàn)。采用高頻詞匯分析發(fā)現(xiàn)學員可能關注的話題;面向?qū)W員類型的話題分析,是按最終考核成績將學員分為優(yōu)秀、普通兩種類型,應用LDA模型挖掘不同類型學員的話題分布并進行分析;基于研修過程的話題演化分析,是運用LDA模型對各活動階段數(shù)據(jù)集進行話題分布和話題熱度計算,追蹤研修過程中學員關注話題的熱度變化并進行分析。3.結(jié)果應用。管理者和坊主根據(jù)可視化呈現(xiàn)的結(jié)果監(jiān)控和分析學員的研修狀態(tài),改進和優(yōu)化研修計劃、研修內(nèi)容和研修策略等,從而形成對學員的干預。同時,分析結(jié)果也為學員提供可視化反饋,以便其進行自我反思,實時調(diào)節(jié)自己的研修行為。
(二)教師工作坊學員話題挖掘方法研究1.結(jié)合TPACK模型的內(nèi)容語義分析結(jié)合TPACK模型[24]對學員研討的知識進行分析,TPACK(TechnologicalPedagogicalContentKnowledge)是由科勒和米什拉于2005年提出的,該框架包含三類核心知識:技術知識(TK)、教學法知識(PK)和學科內(nèi)容知識(CK),以及四類復合知識(PCK、TCK、TPK和TPCK)。本文基于科勒和米什拉所提出的TPACK概念,并參考TPACK概念精致化的相關研究[25]和話語分析規(guī)則[26][27],對所提取的高頻詞匯進行分析。2.結(jié)合LDA模型的話題挖掘LDA模型,最早是由學者Blei等在2003年提出,它是一個三層貝葉斯概率生成模型,LDA假定文檔集中有確定的主題數(shù),每個文檔均是由多個主題混合而成,而每個主題則是多個詞匯上的概率分布[28],如圖2所示。圖2中,變量φ(z)、θ(d)和z均為不可觀察到的潛在變量,其中φ(z)代表主題—單詞概率分布、θ(d)代表文檔—主題概率分布。單詞w為可觀察變量,超參數(shù)α和β是模型的先驗參數(shù),T為設定的主題數(shù)。有向箭頭代表條件概率。方框代表重復采樣。D表示文檔集,外部方框代表文檔集中每個文檔迭代采樣的主題概率分布。Na代表文檔d的單詞數(shù),內(nèi)部方框則表示從主題分布中迭代抽取產(chǎn)生的文檔的單詞。
三、教師工作坊學員話題挖掘方法的應用
(一)實驗數(shù)據(jù)及預處理本研究采集了“國培計劃(2016)教師信息技術應用能力提升工程”某語文教師工作坊中的評論數(shù)據(jù)作為樣本來開展實驗。本次工作坊以“信息技術在語文課堂教學中應如何運用?”為主題,整個實施流程可分為4個活動階段:研修計劃、學技術、會應用和研修總結(jié)。
(二)高頻詞匯分析為了能對學員評論進行整體的觀測和認識,首先通過詞頻分析的方法列出學員評論中排名前20的高頻詞匯。
(三)不同類型學員的話題特征分析本實驗根據(jù)學員最終取得的考核成績,將學員分為兩種類型(優(yōu)秀/普通),對這兩類學員發(fā)表的評論分別進行挖掘和分析。應用LDA話題模型來挖掘?qū)W員發(fā)表的評論中所隱含的話題結(jié)構和語義內(nèi)容,對他們的話題進行觀察和對比,探究其相似性和差異性,進而了解不同類型學員的話題特征,為研修活動的設計、知識轉(zhuǎn)移及知識共享策略的實施提供支持。在設置模型參數(shù)時,依據(jù)α=50/T,β=0.01來進行設置[31],α和β是模型的兩個先驗參數(shù),T為選擇的話題數(shù),T值的確定依賴于數(shù)據(jù)集的大小[32]。本研究中實驗效果的衡量主要考慮話題間的分離度和話題內(nèi)部質(zhì)量兩個指標[33][34],結(jié)合數(shù)據(jù)集的大小并經(jīng)過反復實驗確定T值。對于成績普通學員的數(shù)據(jù)集,T值設置為5,則實驗參數(shù)設置為α=10,β=0.01,根據(jù)話題間的相似程度選出3個具有代表性的話題。如圖4所示。每個可能話題下依據(jù)詞匯出現(xiàn)的概率值大小,列出了10個詞匯表示話題語義內(nèi)容。對于成績優(yōu)秀學員的數(shù)據(jù)集,T值設置為10,實驗參數(shù)設置為α=5,β=0.01,同樣根據(jù)話題間的相似程度選出5個具有代表性的話題。
四、結(jié)束語
教師工作坊中學員進行網(wǎng)絡研討產(chǎn)生的交互式文本數(shù)據(jù),為分析學員的研修狀態(tài)提供了資源,而如何有效地對這些數(shù)據(jù)進行挖掘和分析就變得尤為重要。本文旨在探究教師工作坊中學員話題的挖掘和分析方法,并應用于“國培計劃(2016)教師信息技術應用能力提升工程”某語文教師工作坊中,對學員們的話題結(jié)構、分布及演化情況進行挖掘和分析。首先,利用對高頻詞匯的內(nèi)容語義分析實現(xiàn)對學員評論內(nèi)容的整體分析;然后,運用LDA模型自動挖掘不同類型學員發(fā)表的評論中的隱含話題;最后,呈現(xiàn)了學員熱點話題的演化趨勢。從實驗結(jié)果看,學員們都能圍繞研修主題進行討論;相比成績普通學員,成績優(yōu)秀學員在學習態(tài)度上更顯主動,在多媒體技術及應用和微課技術及應用方面有著更深的認識和理解,而有關“技術支持的總結(jié)與復習”和“技術支持的教學評價”的話題并沒有出現(xiàn)。分析結(jié)果將有助于管理者改進和優(yōu)化研修計劃、研修內(nèi)容和研修策略,提供更高契合度的學習內(nèi)容和更有針對性的學習指導,以滿足培訓標準和學員需求,從而實現(xiàn)按需施訓。通過話題演化趨勢的實時可視化反饋,為引導研修深化發(fā)展提供重要支持,管理者和坊主可據(jù)此跟蹤評價研修過程優(yōu)化教學設計;另外,還有助于學員審視自我話語的貢獻度、契合度及與其他學員的異同,從而調(diào)節(jié)自身的研修行為,提升研修效果。由此可以驗證,該方法具有一定的自動分析在線交互式文本內(nèi)容和結(jié)構的能力,可為教師工作坊的學習分析研究提供一些借鑒和參考。
作者;何皓怡1,劉清堂1,吳林靜1,鄧偉1,郝怡雪2 單位:1.華中師范大學,2.華中師范大學