本站小編為你精心準備了數據倉庫模型下的水文數據挖掘參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:以水文決策和服務社會需求為導向,運用數據倉庫技術,構建面向主題的水文數據倉庫結構模型,并對其結構、功能、邏輯模型和數據分析等進行設計,挖掘水文數據在經濟社會中運用的價值和實現。
關鍵詞:數據倉庫;水文數據;邏輯模型;價值挖掘
水文數據在水利行業數據中占有重要位置,它通過水文測驗收集各種水文要素的原始記錄,經過統一的標準和規格,整理成簡明、系統的水文數據及數據庫。新世紀以來,水文遙感、水文示蹤、地理信息系統和云計算等新技術的快速發展,為深入挖掘水文時間、空間變化規律提供了技術可能。借助于神經網絡、決策樹方法、統計分析方法等,再配合前端數據可視化技術,讓我們可以有目的、有組織地去發現水文數據內在的規律和價值,提供面向主題的快速數據分析、預測預報等功能,實現支持決策和服務社會的目標。
1需求分析
水文數據按決策、服務對象和適用范圍可分為通用數據庫和專用數據庫,原始實測數據是基礎。通用數據庫主要存儲歷年基本水文數據,如簡單加工數據、資料整編后的數據等,為社會各行業和其他用戶提供基礎服務。專用數據庫主要存儲實時數據、二次加工處理和分析計算數據,為政府、水利專業和特定用戶提供服務,如水文情報預報專用庫、工程水文計算專用庫等。水文原始實測數據本身難以滿足復雜多樣的水文決策和服務需求,需要充分利用數據挖掘技術對水文數據進行分析和發現,提取出在水資源管理、防災減災等經濟社會科學發展方面有用的信息。
1.1洪水周期性
洪水由自然和人為因素共同作用形成,洪災是我國發生頻率高、危害范圍廣、對國民經濟影響最為嚴重的自然災害,亦是威脅人類生存的十大自然災害之一。以貴州省遵義市為例:2015年汛期共出現暴雨過程18次,造成12個縣(市、區)77個鄉(鎮)遭受不同程度的洪澇災害,受災人口12.6656萬人,損壞房屋226間,農作物受災面積8.471萬畝,直接經濟損失12888.305萬元。面對洪災造成的巨大損失,只有了解洪水、掌握洪水、利用洪水,才能把損失降到最低。通過對洪水周期性的研究,從水文序列數據中找出洪水重復出現的概率和路徑,進而對洪水進行預測預報預防。
1.2水文相似性
水文相似性是指找出與給定序列最接近的其它水文序列。找出與給定序列相似的所有數據序列稱為子序列匹配,找出彼此間相似的序列稱為整體序列匹配。查找水文序列相似性就是要在水文序列中,找出各類相似的子序列。可用于洪水過程預測、環境演變分析、水文過程規律分析等方面,最為直接的支持決策應用,如:防汛指揮中“當前洪水相當于歷史上哪一次洪水?”。
2水文數據倉庫模型設計
2.1總體結構
水文數據主要表現為水文時間序列,水文數據倉庫由水文時間序列元數據集合而成,按對象的主題要求形成水文基本數據層,隨時間變化轉為歷史數據,通過對歷史水文數據集合進行分析,建立單一或者一組模型,由所建立的模型對新數據集合的可能行為做出預測預報。水文數據倉庫模型設計采用三層結構體系,由倉庫數據庫服務器、OLAP服務器和前端客戶層組成。
2.2邏輯模型
基于星形模式組織的多維數據模型適用于面向預測預報的水文數據模型,水文數據倉庫包含1個事實表(即一個大的中心表)和5個維表(即附屬表)。事實表中包含時間、行政區劃、流域、河流、地理信息5個維表和降雨量、水位、流量、水溫、含沙量等屬性。其中,每個維表包含1組由底層映射到一般高層的屬性概念,如行政區劃維表由屬性省、市、縣形成一種層次,即:省-市-縣;地理信息維表由屬性地形、地貌、地質形成一種層次,即:地形—地貌—地質。水文數據倉庫星形邏輯模型如圖2所示。建立邏輯模型后,其中的水文數據是隨著時間變量動態變化的,降水量、水位、流量、水溫等會有不同的變化,實際操作中,可根據不同預測預報模型的應用需求,采取不同的數據分析方式。若對河道來水量進行預報,就要重點考慮水位、流量等屬性在空間維度上的變化情況,以及河流上游、下游一定距離間的水位、流量相關關系,建立對應函數關系。若做中長期水文預報,就要對各水文測站的歷史數據在多層次的時間維度上,根據所建立的回歸分析函數,選擇合適的預報因子進行分析。若對降雨徑流過程進行預報,就需要對流域的全面屬性,如降雨、徑流量、地理信息等在時間維度和屬性維度上進行多維立體分析,得到模型對應函數關系,確定計算參數,進行計算和驗證。
2.3創建數據倉庫
2.3.1元數據庫
在水文數據倉庫中,定義倉庫對象的水文監測數據就是元數據。在水文時間、空間信息中用于描述水文數據集的內容、質量、表示方式、空間參考、管理方式以及數據集的其他特征。由目錄信息和詳細信息兩個層組成。
2.3.2創建水文數據倉庫
數據庫水文數據倉庫數據庫可以在關系數據庫中按照通用的建立數據庫的方法進行創建。把水文數據倉庫數據庫中設計的表創建好,數據類型依據原始數據庫中的各個表和字段的數據類型設置。將從業務系統或外部系統中獲得的數據,轉換和清洗成數據倉庫需要的格式和形態,并在規定的時間內裝入數據倉庫。
2.4水文數據分析
水文數據通過聯機分析處理可以用不同的格式組織和提供數據,以滿足水文數據分析的需求。基于多維數據模型,通過分析對象主題來對數據進行組織,并根據需求添加不同的數據集市的數據。其結果可以作為簡單數據挖掘的結果,也可以作為深度數據挖掘需要的預處理數據集合。
3結語
由于水文數據量大,影響預測的因素多,相比傳統的水文預測方法,數據挖掘技術可以智能地從大量的、不完全的、有噪聲的、模糊的數據中提取出有用信息,建立起誤差小、精度高的水文預測模型。利用數據倉庫從歷史數據中挖掘水文現象所隱含的價值,完全可以滿足水文決策和服務的需求,但是水文數據倉庫模型的應用也需要我們在實踐中反復的試驗和驗證,根據河流的不同特性,找到符合實際的參數設置,最終得到接近真實的預測預報結果。
參考文獻
[1]艾萍,宋海波,馮鵬.一種支持水文信息組織數據倉庫的模型[J].信息技術,2013,27(07),27-30.
[2]尹濤,關興中,萬定生.數據挖掘技術在水文數據分析中的應用[J].計算機工程與設計,2012,33(12),4721-4725.
[3]陳德清,王問宇,楊海坤.數據倉庫技術在水文數據綜合分析中的應用研究[J].水利信息化,2010,18(02),18-21.
作者:何可 單位遵義市水政監察支隊