本站小編為你精心準備了Apriori算法的學位預警應用參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《電腦開發與應用雜志》2014年第六期
Apriori算法是一種典型的挖掘布爾關聯規則的頻繁項集的算法。它使用的是一種被稱作逐層搜索的迭代方法,即用k-項頻繁項集探索生成(k+1)-項頻繁項集。操作方法為先找出頻繁1-項集的集合,并將該集合記作L1。再用L1找頻繁2-項集的集合L2,用L2找L3,一直到不能再由LK-1找到頻繁k-項集為止。生成每個LK都需要掃描數據庫才能完成。Apriori算法中頻繁項集的生成由連接和剪枝兩步組成完成核心操作。為找LK,通過LK-1與自己連接產生候選k-項候選項集的集合記作Ck,完成連接操作步。掃描數據庫,確定Ck中每個候選項的支持度的計數,將所有支持度小于最小支持度的項集去掉,從而確定LK,完成剪枝操作步。經典Apriori算法的不足主要有兩點。一是在連接步產生龐大的冗余候選項集,二是在生成k-項頻繁項集LK頻繁項集時,多次掃描事務數據庫。
2改進的Apriori算法
針對經典算法的不足之處,改進的Apriori算法提出基于多關鍵字升序重排頻繁項集的項的方法進行頻繁項集重組的進行算法優化,此外在改進的算法中還加入了精減頻繁項集、壓縮數據庫事務方法,同時在算法的終止條件判斷上借助于頻繁項集個數來判斷,提高算法執行的效率。
2.1改進的Apriori算法的描述改進的Apriori()算法是基于多關鍵字排序的項集重排序的Apriori算法,利用數據庫優化技術,不斷縮小數據庫的規模,并結合精減頻繁集和連接優化策略,大大提高了挖掘的效率。由頻繁項集的個數做為算法終止條件,簡化算法終止條件判斷。具體步驟為:①生成1-候選項集C1;②L1={c∈C1|c.count>=minsup_count},并統計中項集個數coun(tL1);③FOR(k=2;coun(tLK-1)叟k;k++)DO;④FOR所有l∈LK-1DOBEGIN//統計LK-1中各單項出現的次數LK-1(x);⑤IF(xi∈l)THENxi.count++;⑥刪除所含次數小于k-1次單項的項集(k>2,xi為LK-1中的各單項);⑦ENDFOR;⑧采用多關鍵字排序策略對頻繁項集項集LK-1進行升序排序//頻繁項集的重排序;⑨CK=apriori_gen(LK-1);//生成k-候選項集;⑩FOR所有事務t∈DDOBEGIN;輥輯訛Ct=subset(CK,t)//在數據庫中刪除k-1項事務或刪除比非頻繁項集(k-1)-項集多出一項的k項事務;輥輰訛ENDFOR;輥輱訛FOR所有候選c∈CtDOBEGIN;輥輲訛c.count++;輥輳訛ENDFOR;輥輴訛LK={c∈CK|c.count>=minsup_count};輥輵訛統計LK中項集個數coun(tLK);輥輶訛ENDFOR。改進的Apriori算法是基于多關鍵字排序的頻繁項集升序重排列,減少了大量冗余候選項集的產生;精減頻繁項集的無效項、壓縮數據庫事務以及頻繁項集的個數控制算法終止條件,提高了算法的執行效率。
2.2算法驗證算法驗證在最小支持度sup_min固定為25%時,針對不同的交易事務數,比較Apriori算法和改進Apriori算法的執行效率。實驗結果如圖1所示。由圖可知兩種算法的執行時間都會隨著事務數的增加而增加,但是改進的Apriori算法比經典Apri-ori算法增長的速度明顯變緩,因此,當挖掘事務數增加時,改進的Apriori算法的優越性會表現的更加明顯。
一般來說,各高校都有各自院系專業學生的培養方案,通過培養方案可知影響學生學位的因素。總體來說,影響學生學位的主要因素有:必修課程、選修課程以及學生第二課堂等。其中必修課程分為公共必修課、學科基礎必修課和專業必修課,選修課程為公共選修課、學科選修課和專業選修課;第二課堂主要是課外擴展教育,主要分為思想政治與道德素養學分、社會實踐與志愿服務方面、科學技術與創新創業方面、文化藝術與身心發展方面、社團活動與社會工作方面、技能培訓及其他方面。系統主要針對學生學位預警進行研究應用,包括必修與選修課程,以及績點計算來達到學生學位預警的功能。本系統采用本校信管系計算機科學與技術本科專業的學生數據作為測試數據。在設計數據庫的過程中存放了學生信息及成績、課程信息以及生成挖掘規則并針對某個學生依據挖掘結果給出預警分析。首先完成數據清洗及轉換:課程類別:公共必修A、學科必修B、專業必修C、公共選修D、學科基礎選修E、專業選修F、績點G。學生成績:采用離散區進行轉換,90分以上a,80分至90分b,70分至80分c,60分至70分d,60分以下e。對于某門課程缺失的成績使用該班該門課程的所有同學的平均成績填充。生成的系統操作界面如圖2所示:依據該系統可以得到如下規則:當公共必修課程成績較低時,容易出現專業必修課程成績也較低的問題,學生應該引以為戒。當公共必修、專業必修課的成績較低時,則其學科必修課程成績也會較低,學生應該引以為戒。當學科基礎選修成績較低時,其專業選修課程的成績也會較低。故該系統可以起到如下作用:當公共必修、專業必修的得分在70分以下時,將影響學生對學位獲得,從而進行預警。當公共必修和學科必修的得分在70分以下時,提示學生可以通過專業必修課程的得分來進行調整達到順利獲得專業學位的目的。
4結束語
本文對原有的Apriori的算法提出了一種基于精減項集和基于多關鍵字排序的項集重排的改進的Apriori算法,并將改進的Apriori算法應用到學位預警系統中,結果證明,應用該算法實現的學位預警系統能夠很好地達到預期目標。
作者:曹瑩苗志剛張紅霞單位:河北金融學院信息管理與工程系