美章網 資料文庫 數據挖掘應用范文

數據挖掘應用范文

本站小編為你精心準備了數據挖掘應用參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

數據挖掘應用

隨著社會信息化不斷進步發展,大量的信息充斥在我們的社會中,這就要求我們能從中及時發現有用的知識,做出正確的分析,從而提高決策的正確性。就是在這樣的背景下深入地分析數據挖掘的基本概念、挖掘流程及挖掘技術,討論數據挖掘的一些具體應用

隨著數據庫技術的不斷發展,數據庫和數據倉庫已經被廣泛地應用于企業管理、產品銷售、科學計算和信息服務等領域,數據量的不斷增長對數據的存儲、管理和分析提出了更高的要求,急需新一代的技術,能夠智能化的從大量的數據中提取出有用的信息和知識,于是數據挖掘技術應運而生,且在各行業得到了廣泛的應用。如何從海量的數據中找到內在的規律,如何更快更方便地傳遞、交流、獲取有用的信息,挖掘這些激增數據背后隱藏的重要信息并及時進行信息的重組已成為當前我們所探究的熱點。

一、數據挖掘概述及分類

數據挖掘是近年來隨著數據庫技術和人工智能技術的發展而出現的一種多學科交叉的全新信息技術,是指從海量的數據中出潛在的、有價值的知識(模型或規則)的過程,反復使用多種數據挖掘算法從觀測數據中確定模式或合理模型。也就是根據預定義的目標,對大量的數據進行探索和分析,揭示其中隱含的規律,并進一步將其模型化的先進有效的技術過程。隨著計算機網絡的發展和普遍使用,數據挖掘成為迫切需要探究的重要課題。

數據挖掘涉及多個學科方向,主要包括摘要:數據庫、統計學和人工智能等。數據挖掘可按數據庫類型、挖掘對象、挖掘任務、挖掘方法和技術以及應用等幾方面進行分類。按數據庫類型分類摘要:關系數據挖掘、模糊數據挖掘、歷史數據挖掘、空間數據挖掘等多種不同數據庫的數據挖掘類型。按數據挖掘對象分類摘要:文本數據挖掘、多媒體數據挖掘、Web數據挖掘。按數據挖掘的任務有摘要:關聯分析、時序模式、聚類、分類、偏差檢測、猜測等。按數據挖掘方法和技術分類摘要:歸納學習類、仿生物技術類、公式發現類、統計分析類、模糊數學類、可視化技術類。

二、數據挖掘的基本過程

(1)定義新問題。對目標有一個可行、清楚和明確的定義,同時還包含對一個結果進行衡量的標準。(2)建立數據挖掘庫。它主要是指收集數據、維護數據等工作。(3)分析數據。找到對新問題解決影響大的數據字段集和決定是否需要定義導出字段。(4)預備建摸數據。根據新問題的定義,對數據庫中的字段變量、記錄進行篩選,并根據現有的變量進行轉換,生成新的變量和字段。它主要是指為建立模型預備部分數據的過程。(5)建立模型。選擇一定的挖掘算法來處理數據,它需考察不同的模型用以判定和選擇解決新問題最有效、精確度較好的一種數據挖掘模式。(6)模型的評價和解釋。模型建立后,必須有一個對它的結果進行評價、對它的價值進行解釋的過程。(7)實施。模型建立并驗證之后通常有兩種使用方法。一種是提供給分析人員作參考和分析這個模型之后的行動方案及建議。另一種是在應用了模型之后,還需不斷地監控其效果,因為事物在不斷地發展變化,有可能一段時間后,模型就不再起功能川。在以上數據挖掘的基本過程中,其中數據預備、數據選擇、預處理、數據縮減的階段主要以完成數據倉庫為主;目標確定、算法確定、數據挖掘、模式識別和知識評價這幾個階段,主要以挖掘有用的知識為主,為知識發現做預備。

三、數據挖據的應用

數據挖掘技術源于商業的直接需求,因此它在各種商業領域都存在廣泛的使用價值。現在已經應用數據挖掘技術的領域都是信息量大、環境復雜、需要知識幫助進行管理和決策的領域。下面介紹一些目前比較活躍的應用方向摘要:

(一)在金融數據分析中的應用。多數銀行和金融機構都提供了豐富多樣的儲蓄,信用,投資,保險等服務。他們產生的金融數據通常比較完整、可靠,這對系統化的數據分析和數據挖掘相當有利。在具體的應用中,采用多維數據分析來分析這些數據的一般特性,觀察金融市場的變化趨向;通過特征選擇和屬性相關性計算,識別關鍵因素,進行貸款償付猜測和客戶信用分析;利用分類和聚集的方法對用戶群體進行識別和目標市場分析;使用數據可視化、鏈接分析、分類、聚類分析、孤立點分析、序列模式分析等工具偵破洗黑錢和其他金融犯罪行為。

(二)在電力業的應用。在電力行業中,數據挖掘技術主要用于指導設備更新、業績評估、指導電力企業的建設規劃、指導電力的生產和購買、指導電力的調度等。數據挖掘在電力企業的其它方面也有巨大的用處,比如說指導項目管理、平安管理、資源管理、投資組合管理、活動分析、銷售猜測、收入猜測、需求猜測、理賠分析等。而且當使用數據挖掘系統時,用戶會對模型進行調優和定制。這將會逐步積累符合企業自身需要的模型庫,成為企業知識庫的重要組成部分。

(三)在零售業中的應用。零售業是數據挖掘的主要應用領域,這是因為零售業積累了大量的銷售數據,如顧客購買史記錄、貨物進出、消費和服務記錄以及流行的電子商務等等都為數據挖掘提供了豐富的數據資源。零售數據挖掘有助于劃分顧客群體,使用交互式詢問技術、分類技術和猜測技術,更精確地挑選潛在的顧客;識別顧客購買行為,發現顧客購買模式和趨向,進行關聯分析,以便更好地進行貨架擺設;改進服務質量,獲得更好的顧客忠誠度和滿足程度;提高貨品的銷量比率,設計更好的貨品運輸和分銷策略,減少商業成本;尋找描述性的模式,以便更好地進行市場分析等等。

(四)在醫學上的應用。近年來,生物醫學探究有了迅猛地發展,從新藥的開發到癌癥治療的突破,到通過大規模序列模式和基因功能的發現,進行人類基因的識別和探究。在人類基因探究領域具有挑戰性的新問題是從中找出導致各種疾病的特定基因序列模式。由于數據挖掘中已經有許多有意義的序列模式分析和相似檢索技術,因此數據挖掘成為DNA分析中的強有力工具。利用數據挖掘技術在DNA數據的分析探究中可以進行DNA序列間的相似搜索和比較,對同時出現的基因序列的相關分析,遺傳探究中的路徑分析等。近期DNA分析的探究成果已經促成了對許多疾病和殘疾基因成因的發現,以及對疾病診斷、預防和治療的新藥物、新方法的發現。

(五)在高校和科研單位以及其他領域的應用。主要是用于海量信息數據的抽取,提供給教研和科研人員有價值的數據。比如在數字圖書館方面可以引入數據挖掘技術。同時還可以應用的電子商務等等眾多領域。

四、結束語

本文討論了數據挖掘的概念、數據挖掘的分類、數據挖掘的基本過程等內容,并對數據挖掘的一些具體的應用進行了闡述。伴隨著社會信息化的到來以及數據信息不斷地增長,數據挖掘將會被廣泛而深入地應用于人類生活的各個領域。

主站蜘蛛池模板: 韩国理伦大片三女教师| yellow中文字幕在线高清| 欧美日韩国产高清视频| 免费网站无遮挡| 补课老师让我cao出水| 国产欧美日韩三级| 91一区二区三区| 天天躁夜夜躁很很躁| 中文字幕在线观看91| 日韩免费在线看| 亚洲va韩国va欧美va天堂| 污污内射在线观看一区二区少妇| 全彩福利本子h全彩在线观看 | h片在线免费观看| 国内精品视频一区二区三区八戒| 一边摸一边叫床一边爽| 无码喷水一区二区浪潮AV| 久久精品视频网站| 欧美free激情野战hd| 亚洲欧美不卡视频| 爱我久久国产精品| 免费看黄视频app| 美女的尿口免费| 国产一级淫片a视频免费观看| 国产精品制服丝袜一区| 国产精品国产三级国产av剧情| 99久久精品美女高潮喷水| 女人毛片a级大学毛片免费| 中文字幕亚洲欧美在线不卡| 日本特黄特黄刺激大片| 二十四小时日本高清在线www| 欧美午夜春性猛交xxxx| 亚洲欧美一区二区久久| 烈血黄昏中视频| 伊人热人久久中文字幕| 精品国产乱码久久久久软件| 四虎影视成人精品| 老湿机一区午夜精品免费福利| 国产亚洲人成网站在线观看| 韩国特黄特色a大片免费| 国产在线精品香蕉麻豆|