本站小編為你精心準(zhǔn)備了學(xué)生一卡通消費大數(shù)據(jù)貧困生挖掘參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
摘要:貧困生的資助工作是當(dāng)前高校學(xué)生管理的重要工作之一。隨著大數(shù)據(jù)在各個領(lǐng)域廣泛而深入的應(yīng)用,善用大數(shù)據(jù)技術(shù)挖掘并認(rèn)定貧困生,真正實現(xiàn)精準(zhǔn)扶貧,是大數(shù)據(jù)在教育領(lǐng)域深度應(yīng)用的體現(xiàn)。構(gòu)建了學(xué)生主題共享數(shù)據(jù)倉庫,設(shè)計了學(xué)生主題ETL(ExtractionTransformationLoading)工作流功能架構(gòu)圖,選取學(xué)生主題應(yīng)用場景之一貧困生精準(zhǔn)資助進(jìn)行數(shù)據(jù)分析。獲得了學(xué)生就餐習(xí)慣、消費行為、在校情況及消費指數(shù)和貧困生篩選等。為學(xué)校未來大面積、規(guī)?;蛣討B(tài)實施"校園大數(shù)據(jù),精準(zhǔn)扶貧"決策支持及學(xué)情分析打下了良好的基礎(chǔ)。
關(guān)鍵詞:大數(shù)據(jù)分析;一卡通;貧困生認(rèn)定;精準(zhǔn)資助
隨著高等教育規(guī)模的迅速擴(kuò)大,各個高校的貧困生數(shù)量也在不斷攀升。教育部的一項調(diào)查顯示,目前高校中存在經(jīng)濟(jì)困難的學(xué)生占在校學(xué)生的15%-30%[1]。因此,越來越多的研究關(guān)注如何解決貧困生問題[2]。有的研究關(guān)注能否為貧困生爭取有益的條件,例如國家層面的助學(xué)貸款;學(xué)校層面的校級獎學(xué)金和提供助學(xué)崗位等[3];有的研究則借助信息技術(shù)的手段,建立貧困生信息管理系統(tǒng),實現(xiàn)信息的登記、查詢、計算和分析[4]。這些研究雖然提高了貧困生管理工作的效率,但如何通過分析這些數(shù)據(jù)得到一些知識或規(guī)律,從而幫助有關(guān)貧困生工作人員完善目前的貧困生資助體系,制定合理科學(xué)的資助政策是一項有重要意義的工作[5]。在這種驅(qū)動下,現(xiàn)在越來越多的研究把數(shù)據(jù)挖掘方法引入到高校貧困生資格認(rèn)證分析中。例如,采用改進(jìn)的K-Means聚類算法對高校學(xué)生的校園卡消費數(shù)據(jù)進(jìn)行分析,基于聚類結(jié)果計算每個學(xué)生的貧困程度,用來輔助高校資助決策工作[6];還有研究采用支持向量機(SupportVectorMachine,SVM)對學(xué)生校園一卡通的消費數(shù)據(jù)進(jìn)行分析,將學(xué)生按貧困與非貧困分類,在高校資助決策工作中給予一定輔助[7]。這些方法大多是在一個數(shù)據(jù)集上運用數(shù)據(jù)挖掘算法得出規(guī)則,挖掘的結(jié)果在一定程度上可以為貧困生認(rèn)定工作提供輔助和決策。但沒有系統(tǒng)的搭建全方位、統(tǒng)一的數(shù)據(jù)主題,以提升數(shù)據(jù)質(zhì)量和共享程度,運算出更精確的結(jié)果進(jìn)而更好地支持?jǐn)?shù)據(jù)挖掘和決策。2015年召開的黨的十八屆五中全會明確提出了實施“國家大數(shù)據(jù)戰(zhàn)略”[8]。在《2018年度國家自然科學(xué)基金項目指南》[9]專門開辟教育研究通道研究教育的難題,旨在推動以自然科學(xué)范式和手段,特別是讓傳統(tǒng)教育科學(xué)與信息科學(xué)、神經(jīng)科學(xué)、認(rèn)知科學(xué)相交叉,研究教育的基本理論和基礎(chǔ)問題,支撐新時代的教育。電子科技大學(xué)大數(shù)據(jù)研究中心-教育大數(shù)據(jù)研究所在貧困生精準(zhǔn)資助、圖書推薦、成績預(yù)測領(lǐng)域做了很多開創(chuàng)前沿性的工作[10]。文章正是在這種“數(shù)據(jù)驅(qū)動學(xué)校,分析變革教育”的大數(shù)據(jù)時代背景下[11],結(jié)合我校正在構(gòu)建的數(shù)據(jù)資產(chǎn)管理平臺,對主題數(shù)據(jù)進(jìn)行全面梳理,搭建統(tǒng)一的學(xué)生數(shù)據(jù)主題,以提高數(shù)據(jù)分析結(jié)果。具體做法是采集一卡通系統(tǒng)736名學(xué)生近三個月的255822條就餐數(shù)據(jù)和與學(xué)生主題相關(guān)的其他六大應(yīng)用系統(tǒng)中的信息經(jīng)過清洗并建模。通過對這些數(shù)據(jù)規(guī)?;姆治龊筮\算出結(jié)果以支持貧困生決策。
1學(xué)生主題數(shù)據(jù)建模
早在2010年我校就引入了數(shù)據(jù)交換平臺和共享庫,在一定程度上解決了業(yè)務(wù)系統(tǒng)之間數(shù)據(jù)互聯(lián)互通問題。但在實際建設(shè)過程中,它只是充當(dāng)了數(shù)據(jù)交換中轉(zhuǎn)站的角色。為了滿足學(xué)校對數(shù)據(jù)挖掘和決策支持需求,需要構(gòu)建校級數(shù)據(jù)倉庫(DataWare原h(huán)ouse)。通過數(shù)據(jù)倉庫的建立,職能部門可對現(xiàn)有系統(tǒng)的數(shù)據(jù)進(jìn)行有效的清洗和整合并加以重組,進(jìn)而在此基礎(chǔ)上做應(yīng)用場景的分析。如以學(xué)生主題為例,我們把與學(xué)生主題有關(guān)的業(yè)務(wù)系統(tǒng)接入數(shù)據(jù)中心。如圖1所示,通過數(shù)據(jù)整合及分層設(shè)計構(gòu)建了學(xué)生主題域的數(shù)據(jù)倉庫。其中操作型數(shù)據(jù)存儲層(OperationalDataStore)解決源系統(tǒng)快速接入的問題,避免從源系統(tǒng)做頻繁和重復(fù)數(shù)據(jù)抽??;數(shù)據(jù)倉庫層(EnterpriseDataWarehouse)按照業(yè)務(wù)驅(qū)動,面向主題整合,保留明細(xì)和歷史數(shù)據(jù)并且模型相對穩(wěn)定,但是會隨著源系統(tǒng)和數(shù)據(jù)業(yè)務(wù)標(biāo)準(zhǔn)的變化,ETL(ExtractionTransformationLoading)會隨之變化。應(yīng)用數(shù)據(jù)層是面向應(yīng)用的個性化定制。構(gòu)建好了一個主題模型框架后,需要在適當(dāng)?shù)臅r候逐步實現(xiàn)物理化。貧困生挖掘分析的ETL工作流功能結(jié)構(gòu)如圖2所示。圖中選取了與學(xué)生信息相關(guān)的六大核心業(yè)務(wù)系統(tǒng),經(jīng)過ETL處理后以學(xué)號為主關(guān)鍵字把學(xué)生的信息整合成一張表信息。以保證基于學(xué)生的消費數(shù)據(jù)模型進(jìn)行貧困生挖掘分析的有效性。
2學(xué)生消費數(shù)據(jù)建模
經(jīng)過學(xué)生主題數(shù)據(jù)倉庫建模后,采集了學(xué)生一張表信息集,我們把涉及到學(xué)生消費數(shù)據(jù)建模所需要的數(shù)據(jù)集輸入大數(shù)據(jù)分析專家軟件Datist,并對敏感信息如身份證號脫敏處理以及對學(xué)生基本信息和就餐交易數(shù)據(jù)進(jìn)行了從身份證中解析性別和籍貫信息和對交易記錄中的日期進(jìn)行數(shù)據(jù)預(yù)處理后,再添加就餐飯點信息和就餐星期信息以及設(shè)置條件“設(shè)在飯?zhí)贸燥垺钡玫綄W(xué)生消費數(shù)據(jù)模型如圖3所示。模型分析了長期不在飯?zhí)贸燥?、大額消費(即單餐消費超30元)和貧困生單月消費總額三種情況。Datist是服務(wù)于大數(shù)據(jù)時代場景式(Context)數(shù)據(jù)整合與融合的功能強大的軟件產(chǎn)品。該軟件根據(jù)用戶場景需求組織數(shù)據(jù)與編制業(yè)務(wù)流程,通過可視化的節(jié)點組合來完成數(shù)據(jù)的獲取、組織、整合、提純及有形化表達(dá)。圖3是根據(jù)學(xué)生一卡通消費數(shù)據(jù)設(shè)計的業(yè)務(wù)流程。圖中有輸入節(jié)點即數(shù)據(jù)源:學(xué)生基本信息表和學(xué)生消費交易數(shù)據(jù)表等。輸入節(jié)點后進(jìn)入數(shù)據(jù)處理階段,通過數(shù)據(jù)處理如匯總節(jié)點、過濾節(jié)點、大額消費數(shù)據(jù)即單餐消費超30元等節(jié)點處理后再經(jīng)過各種輸出節(jié)點輸出結(jié)果。如有貧困學(xué)生單月消費總額、長期不在食堂吃飯等異常結(jié)果信息。部分處理的樣例數(shù)據(jù)如表1所示。
3學(xué)生就餐消費信息分析
數(shù)據(jù)模型確立后,通過軟件運算,對736名學(xué)生2016年9月9日-12月28日(共111天)的就餐數(shù)據(jù)進(jìn)行分析,從中獲取到學(xué)生的就餐習(xí)慣信息。4.1學(xué)生消費異常分析以下分析是針對廣州大學(xué)2016年9月-12月其中736名學(xué)生的三個月中就餐數(shù)據(jù)異常情況進(jìn)行分析,由于數(shù)據(jù)量還沒有足夠大,異常分析結(jié)果可能存在一些偏差。
3.1.1連續(xù)7日無就餐消費記錄學(xué)生分析三個月份有連續(xù)7天沒有消費記錄學(xué)生共計435人,由于篇幅有限,無法列出所有學(xué)生詳細(xì)信息,表2只列出前20名學(xué)生信息,對于這一部分長期不在食堂吃飯的學(xué)生建議需要關(guān)注。
3.1.2大額就餐消費記錄對于單筆消費超過30元的消費記錄可能是校園內(nèi)部其他消費,如超市消費,網(wǎng)費繳費或者醫(yī)院繳費等,這些記錄如果判別為醫(yī)院消費,那將要對這些學(xué)生進(jìn)行重點關(guān)注。分析的結(jié)果展示30~50元之間的占大部分,50~100元次之,其他100~200元之間的建議需要多關(guān)注。
3.1.3消費指數(shù)分析通過對736名學(xué)生2016年9月-12月份,3個月份校園消費記錄255822條數(shù)據(jù)進(jìn)行綜合分析,根據(jù)就餐頻次、消費額度、每餐消費額、消費均值等給每名學(xué)生計算消費指數(shù)。消費指數(shù)具有相對意義,值越小消費水平越低。通過消費指數(shù)進(jìn)行排序可以很快了解到學(xué)生的相關(guān)信息,由于篇幅限制,表3僅展示前10名學(xué)生信息。表中貧困生貧困程度的認(rèn)定就是根據(jù)消費指數(shù)為依據(jù)的,如可以設(shè)置一個閾值,小于等于該閾值的認(rèn)定為特別貧困,大于該閾值的認(rèn)定為一般貧困。
4結(jié)論
分析的數(shù)據(jù)集只采用了2016年9月-12月份三個月的736名學(xué)生255822條就餐消費數(shù)據(jù)進(jìn)行分析,獲得了學(xué)生就餐習(xí)慣及消費指數(shù)。就餐消費數(shù)據(jù)分析可以達(dá)到兩項目的,一是對學(xué)生生活現(xiàn)狀進(jìn)行分析;二是可系統(tǒng)地實現(xiàn)校園大數(shù)據(jù),精準(zhǔn)資助,即是在貧困生中分析發(fā)現(xiàn)“潛藏”的非貧困生;在非貧困生中發(fā)現(xiàn)那些確實很貧窮,但又不愿意說的學(xué)生。從以上分析結(jié)果來看,通過“一卡通”交易數(shù)據(jù)來對貧困生的貧困程度進(jìn)行排名有比較好的區(qū)分度,可以作為發(fā)放貧困生資助的一個依據(jù)。為了準(zhǔn)確的對學(xué)生進(jìn)行畫像,下面對今后分析提幾點建議:1.本次大數(shù)據(jù)分析,只是學(xué)校做一個掀起實驗性研究。只用了736多名學(xué)生3個多月的“一卡通”的消費數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,未來用全校所有學(xué)生一個學(xué)年的數(shù)據(jù)進(jìn)行綜合分析,這樣分析出來的結(jié)果更準(zhǔn)確。2.通過獲取全校所有學(xué)生的“一卡通”交易數(shù)據(jù),這樣可以對貧困生和非貧困生的基本情況進(jìn)行對比分析,可以更好的了解貧困生的生活狀況,也可以發(fā)現(xiàn)未申報貧困生的潛在貧困生的學(xué)生名單。3.通過獲取更詳細(xì)的“一卡通”其他交易數(shù)據(jù),比如“一卡通”加款數(shù)據(jù)、“一卡通”消費刷卡終端信息,這樣就可以更好的識別交易類型,剔除那些非就餐交易。后續(xù)的分析可以利用學(xué)生的消費行為進(jìn)行改進(jìn)的RFM建模,利用貧困生名單進(jìn)行機器學(xué)習(xí)分類建模,利用學(xué)生就餐順序進(jìn)行網(wǎng)絡(luò)關(guān)系建模。4.獲取教務(wù)系統(tǒng)數(shù)據(jù),結(jié)合貧困生的學(xué)習(xí)狀況進(jìn)行綜合分析,可以用有限的資金盡可能資助貧困而學(xué)習(xí)成績優(yōu)秀的學(xué)生。5.學(xué)生心理行為分析和學(xué)情分析。如獲取學(xué)生政治面貌數(shù)據(jù),比如黨員、預(yù)備黨員、入黨積極分子等信息,可以更好了解貧困生的思想進(jìn)步情況。6.動態(tài)學(xué)情分析與貧困生篩選。貧困生的數(shù)據(jù)分析應(yīng)該每月定期進(jìn)行,動態(tài)跟蹤貧困生的生活狀況,把分析后得到的結(jié)果及時通過郵件或微信通知相關(guān)管理部門的不同崗位的相關(guān)人員,比如主管校長、學(xué)工部部長、資助中心管理人員、各學(xué)院分管學(xué)生的書記、主管班級學(xué)生的輔導(dǎo)員等。特別是對前一年資助的貧困生追蹤動態(tài)分析,對原來不是貧困生,因家庭變故和疾病等成為貧困生的遴選。
參考文獻(xiàn)
[1]嚴(yán)海波.我國高校貧困生資助政策演變及現(xiàn)狀研究[J].中國成人教育,2015(9):63—65.
[2]朱劍林,朱容波,康怡琳,等.教育大數(shù)據(jù)在高校貧困生預(yù)測中的應(yīng)用研究[J].教育教學(xué)論壇,2018(21):267—268.
[3]廉文武.數(shù)據(jù)挖掘下貧困生認(rèn)定輔助系統(tǒng)設(shè)計研究[J].當(dāng)代教育實踐與教學(xué)研究,2016(7):47—48.
[4]何秀全.校園一卡通數(shù)據(jù)分析及應(yīng)用相關(guān)研究述評[J].華中師范大學(xué)學(xué)報:自然科學(xué)版,2017(5):63—65,
[5]王萍.高校貧困生認(rèn)定工作的現(xiàn)狀及對策[J].長春教育學(xué)院學(xué)報,2015(12):134—135.
[6]周紅,鄔海濤,趙桂芳,等.基于改進(jìn)K-Means算法的高校貧困生輔助決策系統(tǒng)[J].技術(shù)與市場,2016(12):225.
[7]張璽,咼森林,孫宗良,等.基于校園一卡通消費數(shù)據(jù)對高校貧困生分類的應(yīng)用研究[J].數(shù)字技術(shù)與應(yīng)用2016(8):100.
[8]中國共產(chǎn)黨第十八屆中央委員會.中國共產(chǎn)黨第十八屆中央委員會第五次全體會議公報[OL].
[9]國家自然科學(xué)基金委員會.2018年度國家自然科學(xué)基金項目指南[OL].
[10]張瑞鴻,劉波,卞月妍.院校數(shù)據(jù)倉庫架構(gòu)與建設(shè)的過程研究[J].高校教育管理,2017(2):26—33.
[11]徐超超,陳世超,趙鑫碩,等.區(qū)域教育大數(shù)據(jù)中心平臺建設(shè)探討[J].現(xiàn)代教育技術(shù),2016(11):5—11.
作者:李愛鳳 梁碧允 李曉丹 單位:廣州大學(xué) 網(wǎng)絡(luò)與現(xiàn)代教育技術(shù)中心