美章網(wǎng) 資料文庫 數(shù)據(jù)挖掘在招生數(shù)據(jù)平臺的應(yīng)用范文

數(shù)據(jù)挖掘在招生數(shù)據(jù)平臺的應(yīng)用范文

本站小編為你精心準備了數(shù)據(jù)挖掘在招生數(shù)據(jù)平臺的應(yīng)用參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

數(shù)據(jù)挖掘在招生數(shù)據(jù)平臺的應(yīng)用

近年來,我國大力發(fā)展職業(yè)教育,并投入了大量的人力和物力,高職教育也得到了前所未有的發(fā)展。但是隨著目前各大高職院校的招生規(guī)模不斷擴大,招生方式也在不斷地改革與創(chuàng)新,各高校的生源競爭也日趨激烈,各高校都在努力地去對招生的數(shù)據(jù)進行研究,使用數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等技術(shù),將招生過程中收集到的生源信息進行提取,采用分類、聚類、關(guān)聯(lián)分析等方法,通過對大量的報考學(xué)生信息進行清洗、分析和統(tǒng)計。獲取學(xué)生學(xué)習(xí)的需求、專業(yè)需求、就業(yè)需求等信息,找出科學(xué)與規(guī)律,從而更好的制定招生政策,招生計劃,提高入學(xué)報告率和生源質(zhì)量,促進學(xué)校的發(fā)展。

1數(shù)據(jù)挖掘的定義

數(shù)據(jù)挖掘(DataMining)是指人們從大量的、模糊的、零碎的、隨機的、不完整、含有噪聲的應(yīng)用數(shù)據(jù)中,提取出一些有潛在價值的信息和知識的一系列管理與分析過程。主要的工作流程主要包括:首先對原始數(shù)據(jù)的整理,選擇數(shù)據(jù)并對數(shù)據(jù)進行預(yù)處理,然后對預(yù)數(shù)據(jù)的進行轉(zhuǎn)換,最后抽取出有用的信息并獲取知識。數(shù)據(jù)挖掘基于數(shù)據(jù)庫對模式進行發(fā)現(xiàn),可將模式劃分預(yù)測型模式與描述型模式兩種。

2數(shù)據(jù)挖掘的常用方法

2.1聚類分析方法聚類分析的方法是目前數(shù)據(jù)挖掘技術(shù)中一個很常用的方法,主要源用于統(tǒng)計學(xué)、生物學(xué)及機器學(xué)習(xí)等學(xué)科。它是使用簇的集合,通過使用一個簇內(nèi)的任意兩個對象之間的相似性,找出對象間的相異性的過程。

2.2決策樹決策樹分為分類樹和回歸樹兩種,其中分類樹是對離散型數(shù)據(jù)變量進行決策,而回歸樹主要應(yīng)用于連接的數(shù)據(jù)變量進行決策。它的主要工作過程就類似于數(shù)據(jù)流程圖中的樹型結(jié)構(gòu),把整個結(jié)構(gòu)分為根結(jié)點、中間結(jié)點和葉結(jié)點,在進行數(shù)據(jù)分析的過程就是把數(shù)據(jù)進行切分,每個問題對應(yīng)一個結(jié)點。

2.3關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則主要的思想是根據(jù)數(shù)據(jù)的出現(xiàn)的頻率找到出現(xiàn)之間的相互關(guān)系,主要的目的是根據(jù)他們的關(guān)聯(lián)信息找出其中的規(guī)律,并為之所利用。最核心的方法就是基本頻集理論的遞推方法。

2.4統(tǒng)計分析的方法常用的統(tǒng)計分析立法有回歸分析方法、判別分析方法和探索性分析方法三種,它主要是要從大量的數(shù)據(jù)中,使用科學(xué)的統(tǒng)計方法,推斷出事物之間存在可能的規(guī)律。3招生數(shù)據(jù)倉庫的建模本文在創(chuàng)建數(shù)據(jù)倉庫的過程中,主要通過數(shù)據(jù)驅(qū)動的方法,從不同的數(shù)據(jù)源中獲得的數(shù)據(jù)存儲到數(shù)據(jù)倉庫中,根據(jù)決策的主題,實現(xiàn)招生數(shù)據(jù)的更科學(xué)決策分析,本文主要選用SQLServer數(shù)據(jù)庫,從概念建模、邏輯建模及物理建模的三級模式來構(gòu)建數(shù)據(jù)倉庫。

4數(shù)據(jù)挖掘流程

我校是國家級示范性高職院校,招生類型多,招生管理工作復(fù)雜繁瑣,把數(shù)據(jù)挖掘技術(shù)應(yīng)用于招生數(shù)據(jù)的管理中,有利于對考生志愿的合理選擇,同時也讓更多的學(xué)生及家長了解當前的專業(yè)模式,以及對錄取的新生報到率的預(yù)測,為下一年的設(shè)定招生人數(shù)和專業(yè)設(shè)置提供有價值的參考資料。數(shù)據(jù)挖掘技術(shù)在本校的招生數(shù)據(jù)管理的主要工作流程如圖1所示。我們從最原始的學(xué)生填寫的高考志愿信息表中,獲取基礎(chǔ)數(shù)據(jù),從考生的高考成績、學(xué)業(yè)水平成績、高中畢業(yè)考試成績、考生類別、生源地、家族信息等信息中,通過前端處理工具,主要使用Clementin工具,設(shè)置字段選項、選擇記錄點、對數(shù)據(jù)進行抽樣,匯總等建立數(shù)據(jù)倉庫,基于數(shù)據(jù)挖掘所要實現(xiàn)的目標以及數(shù)據(jù)所具有的特點,確定合適模型,通過聚類模型實現(xiàn)挖掘分析。最后評價數(shù)據(jù)挖掘結(jié)果,確定最佳模型,將其應(yīng)用到具體實際問題中,與招生工作進行結(jié)合從而解釋數(shù)據(jù)挖掘結(jié)果。

5數(shù)據(jù)挖掘在招生平臺應(yīng)用

建設(shè)招生數(shù)據(jù)管理平臺主要是為了對所有的招生數(shù)據(jù)進行科學(xué)的分析,解決招生過程中專業(yè)的設(shè)置,冷熱門專業(yè)分析,錄取分數(shù)線分析,考生第一志愿的分析以及招生計劃的設(shè)置等。

5.1專業(yè)設(shè)置招生平臺中,可以以專業(yè)類別當成維度,采用關(guān)聯(lián)分析,對各專業(yè)進行分析,與及對某一專業(yè)和其相關(guān)聯(lián)的或相近專業(yè),使用多維數(shù)據(jù)集與EXCEL的數(shù)據(jù)透視表工具結(jié)合,能方便地進行OLAP操作及結(jié)果的報表、圖形等多種方式的可視化展現(xiàn)。

5.2冷熱門專業(yè)分析以生源所在地的考生為基礎(chǔ),運用聚類算法進行分析,以發(fā)掘考生填寫志愿的相關(guān)規(guī)律,確定哪些專業(yè)是熱門,哪些專業(yè)是冷門專業(yè),根據(jù)畢業(yè)生的就業(yè)情況以及對當前的市場變化趨勢深入了解,持續(xù)地對熱門專業(yè)進行支持與挖掘,對冷門專業(yè)進行控制。

5.3考生第一志愿分析第一志愿是志愿填報中最重要的一環(huán),目前我校在錄取規(guī)則上優(yōu)先錄取第一志愿考生,這樣可以有相應(yīng)專業(yè)人才的穩(wěn)定生源,這批生源在最大程度上有志于自己所填報的志愿,而且在錄取第一志愿考生時,學(xué)校熱門專業(yè)通過第一志愿錄取即可招滿相應(yīng)的新生。本文通過關(guān)聯(lián)分析的方法,結(jié)合統(tǒng)計分析和聚類分析,根據(jù)考生的專業(yè)興趣,高考成績,以及興趣愛好等,分析考生第一志愿的情況。

5.4招生計劃安排以考生的專業(yè)類別為基礎(chǔ)數(shù)據(jù),對某一類考生的信息進行分析,主要包括對考生的填寫志愿的行為分析,有針對性地對考生性質(zhì),考生的志愿愛好,以及考生的高考成績中的單科成績情況進行分類分析及關(guān)聯(lián)分析,采用決策樹法,合理地安排專業(yè)招生計劃。在系統(tǒng)平臺的運用中,挖掘出隱含的規(guī)則與特征,把相關(guān)數(shù)據(jù)信息傳遞到各二級學(xué)院,讓二級學(xué)院根據(jù)挖掘的結(jié)果做出合理的招生計劃安排。

5.5挖掘結(jié)果展現(xiàn)為了更好的展現(xiàn)考生的各種屬性之間的聯(lián)系,以“專業(yè)”、“成績等級”、“生源地等級”作為前項,“報到狀態(tài)”為后項,進行關(guān)聯(lián)規(guī)則挖掘。

6結(jié)束語

目前,很多高校都使用了各自的招生數(shù)據(jù)管理系統(tǒng),也深入地掌握了數(shù)據(jù)挖掘技術(shù)對招生數(shù)據(jù)進行分析與干預(yù),本文主要是使用關(guān)聯(lián)規(guī)則法、決策樹、統(tǒng)計分析等數(shù)據(jù)挖掘技術(shù)方法進行計算、分析、研究,構(gòu)建了以考生類別、考生生源地、高考成績、專業(yè)志愿等關(guān)系模型,結(jié)合MicrosoftSQLServer2005中的數(shù)據(jù)挖掘功能,通過這個模型找出了各個因素與考生專業(yè)選擇、考生報到率以及對學(xué)校招生政策等的關(guān)聯(lián)關(guān)系,提高學(xué)校的生源質(zhì)量,促進學(xué)校的發(fā)展。

作者:黃有福 單位:廣州番禺職業(yè)技術(shù)學(xué)院

主站蜘蛛池模板: 久久精品国产一区二区三区肥胖| 国产69精品久久久久999三级| A级毛片无码免费真人| 日日AV色欲香天天综合网| 亚洲jizzjizz中国少妇中文| 波多野结衣上班| 办公室开档情趣内衣做爽视频| 香蕉久久夜色精品国产| 国产精品内射久久久久欢欢| 99久久综合国产精品免费| 老师我好爽再深一点的视频 | 玩弄丰满少妇XXXXX性多毛| 国产一级淫片a免费播放口之| 欧美成人三级一区二区在线观看| 国内a级毛片免费···| kink系列视频在线播放| 成人午夜小视频| 久久久久国产精品| 日韩欧美二区在线观看| 亚洲一区二区三区无码中文字幕| 欧美精品stoya在线| 亚洲色精品vr一区二区三区| 精品伊人久久大香线蕉网站| 国产精品青草久久久久福利99| а√在线地址最新版| 放荡的欲乱合集| 亚洲国产精品成人AV在线| 狠狠色丁香九九婷婷综合五月| 午夜欧美日韩在线视频播放| 色多多免费视频观看区一区| 国产在亚洲线视频观看| 99精品欧美一区二区三区美图| 成人免费在线视频| 久久er99热精品一区二区| 日韩三级免费观看| 九九热视频在线播放| 热re99久久精品国产66热| 免费高清av一区二区三区| 黄网址在线观看| 国产成人精品久久免费动漫| 3d动漫h在线观看|