本站小編為你精心準備了數據挖掘技術銀行業務參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
一、數據挖掘概述
1、相關定義。數據倉庫是支持管理決策過程的一個數據集合。這個數據集合是由企業內的歷史詳細數據和當前詳細數據、操作數據和外部數據按照一定的主題標準歸類,進行加工和集成而建立的,是為企業決策服務的。數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
2、數據挖掘的流程
(1)數據取樣。當進行數據挖掘時,首先要從企業大量數據中取出一個與要搜索的問題相關的樣板數據子集,而不是動用全部企業數據。通過對數據樣本的精選,不僅能減少數據處理量,節省系統資源,而且能通過對數據的篩選,使數據更加具有規律性。
(2)數據探索。數據探索就是通常所進行的對數據深入調查的過程,從樣本數據集中找出規律和趨勢,用聚類分析區分類別,最終要達到的目的就是搞清楚多因素相互影響的、十分復雜的關系,發現因素之間的相關性。
(3)數據調整。通過上述兩個步驟的操作,對數據的狀態和趨勢有了進一步了解,這時要盡可能對問題解決的要求進一步明確化和量化。針對問題的需求,對數據進行增刪,按照對整個數據挖掘過程的新認識組合或生成一個新的變量,以體現對狀態的有效描述。
(4)模型化。在問題進一步明確,數據結構和內容進一步調整的基礎上,就可以建立模型。這一步使數據挖掘的核心環節,可以運用神經網絡、決策樹、數理統計、時間序列分析等方法來建立模型。
(5)評價。從上述過程中將會得出一系列的分析結果、模式和模型,多數情況會得出對目標問題多側面的描述,這時就要綜合它們的規律性,提供合理的決策支持信息。評價的一種辦法,是直接使用原先建立模型樣本和樣本數據來進行檢驗;另一種辦法,是另找一批數據并對其進行檢驗,已知這些數據能反映客觀實踐的規律性;再一種辦法,是在實際運行的環境中取出新鮮數據進行檢驗。
以上五個過程要反復進行,在反復過程中,不斷地趨近事物的本質,不斷地優化問題的解決方案。
3、數據挖掘功能。數據挖掘通過預測未來趨勢及行為,做出前攝的、基于知識的決策。數據挖掘的目標是從數據庫中發現隱含的、有意義的知識,主要有以下五類功能。
(1)自動預測趨勢和行為。數據挖掘自動在大型數據庫或數據倉庫中尋找預測性信息,以往需要進行大量手工分析的問題如今可以迅速直接由數據本身得出結論。一個典型的例子是市場預測問題,數據挖掘使用過去有關促銷的數據來尋找未來投資中回報最大的用戶。
(2)關聯分析。數據關聯是數據庫或數據倉庫中存在的一類重要的可被發現的知識。若兩個或多個變量的取值之間存在某種規律性,就稱為關聯。關聯可分為簡單關聯、時序關聯、因果關聯。關聯分析的目的是找出數據庫中隱藏的關聯網。有時并不知道數據庫中數據的關聯函數,即使知道也是不確定的,因此關聯分析生成的規則帶有可信度。
(3)聚類。數據庫中的記錄可被化分為一系列有意義的子集,即聚類。聚類增強了人們對客觀現實的認識,是概念描述和偏差分析的先決條件。聚類技術主要包括傳統的模式識別方法和數學分類學,其要點是在劃分對象時不僅考慮對象之間的距離,還要求劃分出的對象之間具有某種內涵描述,從而避免了傳統技術的某些片面性。
(4)概念描述。概念描述就是對某類對象的內涵進行描述,并概括這類對象的有關特征。概念描述分為特征性描述和區別性描述,前者描述某類對象的共同特征,后者描述不同類對象之間的區別。生成一個類的特征性描述只涉及該類對象中所有對象的共性。生成區別性描述的方法很多,如決策樹方法、遺傳算法等。
(5)偏差檢測。數據庫或數據倉庫中的數據常有一些異常記錄,從數據庫或數據倉庫中檢測這些偏差很有意義。偏差包括很多潛在的知識,如分類中的反常實例、不滿足規則的特例、觀測結果與模型預測值的偏差、量值隨時間的變化等。偏差檢測的基本方法是尋找觀測結果與參照值之間有意義的差別。
二、我國銀行業業務現狀
目前我國銀行業所做的各種信息系統,一般都是用于完成各種各樣的柜面業務,如儲蓄系統、會計系統、信用卡系統等。有些銀行正在開發集各種柜面業務為一體的綜合柜面業務系統,重在提高業務運行管理效率。只要對各家銀行的系統進行分析觀察,就會發現各系統的內容、模式及所提供的功能基本都是相同的,最多只是所選軟硬件平臺的不同,這樣看來各家銀行耗費巨資進行的都是重復的開發,沒有把事務處理系統外包出去,從事務處理中擺脫出來,不注重或從沒有查詢和分析已有的各種客戶信息資料,從中找出潛在有用的信息。各銀行比較長的一段時間來,處在依靠擴大規模、搶占地盤來提高效益的規模效益階段。經過盲目的機構設置、地盤搶占、人員投入之后,才發現實際產出的效益并沒有達到期望的效果。目前國內金融機構日益增多,一些外資銀行也已搶灘,競爭日趨激烈,擴大規模已不再是行之有效的經營手段。各大銀行將不得不把注意力轉向追求深度效益,在信息挖掘和再利用上做文章。銀行必然從盲目的硬件投資轉向有目的的軟件投資;從注重交易的數量轉向注重客戶關系和客戶價值,同重要客戶保持長期關系,吸引、鎖定特定客戶群;從撒大網式的業務推廣方式轉向注重客戶導向與客戶信息分析,由分析工具和經驗準確地選擇單獨的客戶群,有目的的向不同客戶銷售不同的銀行產品和服務,從而創造競爭優勢。而這一切自然離不開信息與信息技術,離不開提供信息的大型數據庫或數據倉庫,離不開發揮信息潛能的數據挖掘技術。
三、數據挖掘技術在銀行業務的應用
隨著競爭的日益深入,美國銀行中的“深度效益”觀念必將融入我國銀行的管理策略之中。所謂“深度效益”,從字面上來說是預期1美元能夠帶來10美元的回報。實質上是把客戶細化為不同的個體,細化客戶信息的組織和分析,由分析工具和經驗選擇特定的客戶群來劃定戰場,跟蹤每位消費者個體以及個性化的需求,在營銷方面實施關系營銷,由傳統的注重交易轉變為注重客戶關系和客戶價值,從而產生了“關系銀行”這個概念。
美國BankOne銀行對自己的客戶進行調查發現,百分之二十的客戶創造銀行利潤,其它百分之八十的客戶并沒有給銀行創造利潤。如果我國的銀行對自己的客戶進行調查,也會發現同樣的結果,只是百分比不同而已。這需要我們把零散的、無序的、歷史的、當前的各種數據集中起來建立數據倉庫。可喜的是中國各銀行已經完成了各種業務數據庫的建立,完全可以在此基礎上建立自己的大型數據庫。一方面可以從所建立的數據倉庫中挖掘出為銀行創造利潤的這部分客戶,從復雜的客戶信息中建立模型,對客戶記錄信息進行動態跟蹤和監測,計算客戶價值,鎖定特定客戶群,分析潛在客戶群,制定不同市場需求、不同客戶群的市場戰略,根據客戶的價值選定服務產品配置,從而與創造利潤的優良客戶建立長期關系。一方面又可以應用數據挖掘技術,分析隱含在數據庫中的客戶信息,通過描述客戶以往的趨勢來預測未來的趨勢。這樣,不僅可以達到降低成本、改善客戶關系的目的,而且可以集中精力于重要的和潛在的客戶,制定更好的市場戰略,增強競爭優勢。
建立數據倉庫,進行數據挖掘是金融監管的需要,也是銀行生存發展、提高競爭力的需要。為了提高投資的有效性,降低風險,就要廣泛收集各方面信息,充分利用已有的各種數據,來爭取更多的優良客戶,支持決策的科學性、可靠性。我國銀行要健康發展,就要不斷地捕捉新的商業信息與商業機會,不斷地改變競爭策略,迎合甚至導向市場需求,充分利用數據挖掘技術,預測用戶的消費趨勢和行為,發現以前未知的模式,指導銀行銷售,策劃銀行產品與服務。如使用過去有關信用卡促銷的數據來尋找未來投資中回報最大的用戶群體,有目的的郵寄宣傳品;對零售銀行數據的分析,可能找出表面上不相關而實際上卻被一起購買的商品,從而引導客戶消費。總之,中國銀行要發展,就要不斷地采用新技術,善于利用金融創新工具,尋找新的效益增長點,不能將思想禁錮在傳統的單一思維模式上面。