本站小編為你精心準備了淺談可視化數據挖掘技術參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:數據挖掘是現今的熱門技術,結合了人工智能、機器學習以及統計學相關知識,具有廣闊的應用發展前景。在本文中,將就可視化數據挖掘技術僅限于一定的研究。
關鍵詞:可視化;數據挖掘技術
一、引言
近年來,我國的數據挖掘技術不斷發展,并在多個領域如金融、電信、醫療當中具有了應用。而在新的發展形勢中,如何使人對數據挖掘技術進行快速掌握,在海量數據中發現隱藏的知識、信息,則成為了該技術具體應用當中的關鍵指標。對于可視化數據挖掘技術來說,即是將數據挖掘同可視化技術進行了結合應用,以直觀圖形的方式對數據發展趨勢與關聯情況進行呈現,為具體工作的開展提供重要的數據信息。
二、技術分類
對于數據可視化挖掘技術來說,其在應用中融合可視化與數據挖掘技術,同時使用自然的交互界面,促進用戶能夠進行良好的參與。同時,以領域知識為基礎實現對挖掘過程的推進,在理解挖掘結果的同時做好反饋評估處理,以此獲得更高的挖掘時效性。
1.數據挖掘可視化對于數據挖掘過程的可視化來說,即通過可視化圖形的應用表達挖掘過程。通過對圖形的觀察,即能夠了解到數據挖掘過程、數據源與結果。對于一個好的數據挖掘算法來說,通常只在部分領域中應用,而不會在其余領域中應用。通過可視分析以及人機交互技術的應用,即能夠在挖掘當中對中間輸出信息進行展現,幫助用戶在對算法運行過程及時觀察的基礎上進行動態調整。在用戶參與中,將對單純使用設備的自動挖掘缺點進行了避免,幫助用戶更好的理解挖掘結果。
2.數據可視化在該方面,即是從不同抽象層次、通過不同類型的可視形態將數據庫當中的多維數據實現對用戶的展示,幫助用戶能夠對數據進行近距離瀏覽,并在抽象層次上對不同數據間隱藏的趨勢與關聯進行分析。
3.結果模型可視化在該內容中,以可視化方式呈現挖掘結果,包括有散點圖、雷達圖、折線圖等實現對決策樹、樹以及孤立點的標示。可視化結果的存在,能夠幫助用戶對數據挖掘當中的知識進行更好的理解,發現其中隱藏的走勢、關系與模式。同時,也可以根據可視形態展示效果對特征參數動態調整,以此對新的規律與模式進行發現。
三、數據可視化技術
1.可視化要素在數據可視化當中,其組成部分有人機交互技術與可視化方式等。其中,可視化數據的類型有很多,如一維、二維與多維數據等,在數據類型上也具有復雜的特點,包括有網狀數據與層次數據等。其中,層次數據具有可視化特點,能夠以網絡圖的方式實現對網狀數據的展示。軟件方面,在算法理解上也具有積極的意義,能夠為具體的軟件開發活動打下良好的基礎。
2.可視化內容根據數據類型的不同,可以對不同的數據可視化技術進行應用:第一,圖表可視化。該技術為傳統二維、三維可視化技術,如通過折線圖對連續字段上離散值進行表示,應用圓餅圖對總體中不同數據項具體份額進行展示;第二,幾何投影技術。在該技術中,能夠將多為數據通過投影形成低維數據,包括有平行坐標圖、格架圖以及散點矩陣技術等;第三,圖標技術。該技術在應用中能夠將多為數據實現對一個圖標的映射,由不同圖標對不同維度的數據側面進行表示,包括有形狀編碼圖以及枝形圖等;第四,像素可視化技術。在該技術中,能夠將不同數據實現對屏幕像素點的映射,同時在分離視圖中對不同屬性值進行顯示。在技術在實際應用中具有較大的數據信息量,能夠在對信息進行有效查看的情況下做好全局狀況的把握;第五,層疊技術。在該技術中,能夠以樹形的方式表示多維數據空間,如錐形圖、樹圖以及嵌套圓等。
四、可視化數據挖掘技術應用
1.預處理階段在數據挖掘工作開展中,數據預處理是重要的環節,其主要流程有:第一,數據抽取。在該階段中,將根據挖掘工作的具體質量要求與挖掘目標,選取數據集、連接數據源,其中包括有字段、表以及記錄選擇等;第二,集成。將多個數據源數據集存儲在一處;第三,數據清洗。在該過程中,包括有缺省值處理、噪聲點發現刪除,同時對存在的數據沖突問題進行解決;第四,數據轉換。包括有匯總計算、數據拼接以及格式轉換等;第五,數據歸約。在保證挖掘目標與質量的基礎上,通過對數據集的壓縮實現對挖掘效率的提升。
2.數據挖掘算法在該環節的可視化設計當中,其主要內容包括有:第一,由用戶對初始條件進行挖掘,包括有設置參數以及數據及選擇等。在該過程中,用戶可以動態的挖掘采納數值以及進行數據值調整;第二,中間結果顯示部件。傳遞算法執行中操作步驟、輸出數據給界面。根據算法的不同,將具有不同的結果輸出,同時通過公共接口做好可視化處理。在最終的用戶界面中,將對輔助信息以及中間過程數據進行展示;第三,算法界面映射。在該內容中,可以通過擴展語言DMX的應用封裝數據挖掘算法。
3.挖掘結果模型描述方面,使用PMML對數據挖掘結果模型進行預測,該模型的應用思想,即通過XML數據項分離特征對數據挖掘模型的可移植性、描述以及標準化目標進行實現。結構方面,其包括有數據字典、轉換字典、頭文件以及數據挖掘模式等。同時還具有輸出值、統計信息以及目標值等,根據具體挖掘算法的不同存在差異。可視化設計方面,挖掘結果模型可視化的實現,即是幫助用戶對最終挖掘結果進行更為有效的理解,以此為基礎給出恰當的反饋與評估。在該過程的可視化當中,即根據不同挖掘模型,以不同的方式進行呈現。從該角度而言,即需要能夠對基于模型的用戶界面進行設計,使用戶能夠對挖掘模型進行直接的分析。挖掘結果模型部件方面,主要包括有縮放部件、多視圖顯示部件以及可視化圖形庫這幾部分。
五、結語
可視化數據挖掘技術的出現,為數據信息的挖掘收集提供了新的可能。在上文中,我們對可視化數據挖掘技術進行了一定的研究。在未來工作當中,還需要能夠進一步做好該技術的研究優化,在不斷提升技術應用范圍、應用優勢的基礎上使其能夠在數據工作當中發揮出更大的作用。
參考文獻:
[1]張俊.可視化數據挖掘技術的研究與實現[J].重慶工商大學學報:自然科學版,2013(3).
[2]黃鳳.可視化數據挖掘技術[J].電子技術與軟件工程,2016(24).
[3]李華,張井玲,劉婷婷.大數據時代下數據挖掘技術的應用研究[J].現代信息科技,2019(13).
作者:孫健 單位:揚州高等職業技術學校