本站小編為你精心準(zhǔn)備了關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘論文參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
在早期關(guān)于數(shù)據(jù)挖掘技術(shù)的研究中,研究的重點(diǎn)放在數(shù)據(jù)挖掘模型的建立以及相關(guān)算法的研究上,但是應(yīng)用這種研究方法所得到結(jié)果研究結(jié)果是比較孤立的,難以取得理想的數(shù)據(jù)處理效果,隨著關(guān)于數(shù)據(jù)挖掘技術(shù)研究的深入,人們發(fā)現(xiàn)在開展數(shù)據(jù)挖掘技術(shù)的研究過程中,想要有效的實(shí)現(xiàn)用戶相關(guān)的挖掘目標(biāo),除了需要加大算法的研究力度之外,還需要制定出特定的實(shí)現(xiàn)機(jī)制,以便于所制定的挖掘計(jì)劃能夠轉(zhuǎn)化成為對(duì)一個(gè)系統(tǒng)工作的控制,這樣才能促使挖掘項(xiàng)目獲得一個(gè)理想的挖掘效果,對(duì)于挖掘算法的約束作用,在挖掘算法開展的任何階段都可以實(shí)現(xiàn),并且挖掘算法的基本形式就是交互式數(shù)據(jù),在實(shí)際的挖掘算法開展的過程中,嚴(yán)格按照相關(guān)的計(jì)算流程開展才能達(dá)到快速、準(zhǔn)確完成挖掘任務(wù)的目的。在開展數(shù)據(jù)挖掘計(jì)算的過程中,由于面臨著多種因素的影響,并且其中一些因素是難以把握的,這直接導(dǎo)致了挖掘算法的結(jié)算結(jié)果具有不可預(yù)測(cè)性,因此還需要為挖掘算法添加反饋機(jī)制,通過有效的反饋機(jī)制能夠?qū)τ?jì)算結(jié)果進(jìn)行驗(yàn)證,并且能夠?qū)λ惴ㄖ械臄?shù)據(jù)進(jìn)行修正,在該過程中,不僅要保證所挖掘到數(shù)據(jù)的正確性,還需要保證數(shù)據(jù)是用戶所側(cè)重的,這就需要所挖掘的數(shù)據(jù)結(jié)果不僅具有邏輯上的正確性,還要能夠滿足用戶的主觀偏好,既要能夠滿足用戶的需求,這就需要有效的約束來發(fā)現(xiàn)算法中的問題,并及時(shí)的開展算法糾正,這樣才能保證所開展的挖掘算法能夠滿足各方面的實(shí)際需求。
但是在實(shí)際的開展挖掘算法的過程中,很容易導(dǎo)致陷入到一個(gè)誤區(qū)當(dāng)中,也就是將關(guān)注的重點(diǎn)放在一個(gè)系統(tǒng)處理所出現(xiàn)的問題上,但是對(duì)系統(tǒng)規(guī)模大小的控制沒有予以足夠的重視,出現(xiàn)這樣的問題會(huì)對(duì)挖掘算法結(jié)果起到反作用,使得相關(guān)問題難以很好的解決。在進(jìn)行數(shù)據(jù)挖掘的約束時(shí),要保證實(shí)現(xiàn)系統(tǒng)增量式擴(kuò)充,在對(duì)用戶的實(shí)際需求與目標(biāo)予以明確之后,需要借助于約束參數(shù),結(jié)合約束參數(shù)的形式對(duì)一些有待解決的問題實(shí)施驗(yàn)證,一旦確定相關(guān)數(shù)值之后,就可以通過實(shí)驗(yàn)的交互式輸入實(shí)現(xiàn),最終較大較優(yōu)值,該約束機(jī)制能夠應(yīng)用于數(shù)據(jù)挖掘算法的各個(gè)不同階段,另一方面,在開展數(shù)據(jù)的預(yù)處理時(shí),要能夠保證約束個(gè)數(shù)的設(shè)置在保證數(shù)據(jù)挖掘結(jié)果正確性的同時(shí),能夠保持?jǐn)?shù)據(jù)的規(guī)模,并且可以將約束機(jī)制應(yīng)用于整個(gè)項(xiàng)目細(xì)分之后的子目標(biāo),從而實(shí)現(xiàn)快速約束。為了能夠更好的解決相關(guān)問題,可以對(duì)不同類型的問題加用不用的約束調(diào)節(jié),特別是在維度較高的數(shù)據(jù)的除了過程中,如果所選擇的約束條件合適,能夠有效簡化挖掘算法。
在選擇約束類型的過程中,時(shí)態(tài)約束下的關(guān)聯(lián)規(guī)則主要是指:一次數(shù)據(jù)庫掃描挖掘算法能夠在減少一定的I/O個(gè)數(shù)的基礎(chǔ)上,促使數(shù)據(jù)量的不斷上升,這就會(huì)導(dǎo)致計(jì)算機(jī)內(nèi)存占用量的線性增大,因此,ISS容量控制就是關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法中非常重要的內(nèi)容,并且能夠有效減少CPU的占用量,為了能夠有效的改善這一問題,可以采取對(duì)數(shù)據(jù)進(jìn)行分批處理的方式,通過對(duì)數(shù)據(jù)實(shí)時(shí)有效的組織,能夠有效的改善數(shù)據(jù)結(jié)構(gòu),降低數(shù)據(jù)內(nèi)存,并且能夠生成獨(dú)立的關(guān)聯(lián)規(guī)則,在降低計(jì)算機(jī)硬件資源占用率的同時(shí),有效改善精確度。
2結(jié)束語
數(shù)據(jù)挖掘技術(shù)是一種新型的數(shù)據(jù)處理技術(shù),不管是數(shù)據(jù)挖掘技術(shù)還是關(guān)聯(lián)規(guī)則挖掘算法,其中所包含的內(nèi)容比較多,本文就主要對(duì)其進(jìn)行了簡單分析,對(duì)于實(shí)際的數(shù)據(jù)挖掘工作具有一定的參考價(jià)值。
作者:李仕瓊單位:瀘州醫(yī)學(xué)院數(shù)學(xué)與信息技術(shù)教研室