本站小編為你精心準備了數據挖掘物流管理參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
現代物流系統是一個復雜的系統,包括運輸、倉儲、配送、搬運、包裝和物流再加工等諸多環節,信息流量十分巨大。巨大的數據流,使得企業很難對這些數據進行準確、高效的收集和及時處理,因此決策者也就很難做出快速、準確地決策,實現對物流過程的控制,降低整個過程的物流成本。隨著知識經濟和現代信息技術的迅猛發展,信息技術特別是網絡技術的發展,為物流發展提供了強有力的支撐。物流管理信息系統是企業信息系統和企業信息化的基礎,能夠利用信息技術對物流中的各種信息進行實時、集中、統一管理。
數據挖掘技術就是利用機器學習統計數學和可視化技術,從大量的數據庫中確認出有效的、新穎的、潛在的、有用的以及最終挖掘出可理解模式的高級處理過程。數據挖掘(Data?Mining)?能夠挖掘蘊藏在海量數據中大量未知的和有價值的信息,為企業物流管理提供各種決策信息,減輕物流管理者從事低層次信息處理和分析的負擔,使他們專注于最需要決策智慧和經驗的工作,因此提高了管理和決策的水平。隨著信息技術的不斷發展,數據挖掘技術將為企業物流管理決策提供越來越強大的支持功能。
2數據挖掘的概念
數據挖掘(DataMining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
完整的數據挖掘過程分為四步進行。第一步是確定業務對象,清晰地定義出業務問題,認清數據挖掘的目的;第二步是數據準備,先要搜索所有與業務對象有關的內部和外部數據信息,并從中選擇出適用于數據挖掘應用的數據。接下來對數據進行預處理,研究數據的質量,為進一步的分析作準備。還要對數據進行轉換,將數據轉換成一個適合挖掘算法的分析模型;第三步是數據挖掘,完善從選擇合適的挖掘算法,對所得到的經過轉換的數據進行挖掘;最后一步是結果分析,解釋并評估結果。
數據挖掘的主要技術有集合論法、決策樹法、遺傳算法、神經網絡方法等。集合論法又分為粗(糙)集理論方法、概念樹方法、覆蓋正例排斥反例方法等。決策樹法又分為ID3算法、CLS算法、IBLE算法等。遺傳算法又分為分布并行遺傳算法、進化算法等。
數據挖掘為管理決策提供的模型常見的有以下五類:
(1)分類發現模型。分類的目的是學會一個分類函數(分類器),通過分類器把數據庫中的數據項映射到給定類別中的某一個。分類器的構造方法有統計方法、機器學習方法、神經網絡方法、粗糙集方法等。
(2)聚類模型。聚類是把一組個體按照相似性歸成若干類別,使得屬于同一類別的個體之間的距離盡可能的小,而不同類別上的個體間的距離盡可能的大。聚類方法包括統計方法、機器學習方法、神經網絡方法和面向數據庫的方法。
(3)關聯規則模型。關聯規則反映一個事件和其他事件之間依賴或關聯的知識。如果兩項或多項之間存在關聯,那么其中一項的屬性值就可以依據其他屬性值進行預測。最為著名的關聯規則發現方法是R.Agrawal提出的Apriori算法。
(4)預測型知識模型。它是根據時間序列型數據,由歷史的和當前的數據去推測未來的數據。時間序列預測方法有經典的統計方法、神經網絡和機器學習等。
(5)偏差型知識模型。它是對差異和極端特例的描述,揭示事物偏離常規的異常現象,如標準類外的特例,數據聚類外的離群值等。
3關鍵技術分析
基于數據挖掘的物流管理信息系統的關鍵技術主要包括數據倉庫、數據挖掘、數據分析工具等。
數據倉庫技術。數據倉庫是來自多個源的數據的存儲庫,它可通過Internet將不同的數據庫連接起來,并將數據全部或部分復制到一個數據存儲中心。數據倉庫傾向于一個邏輯的概念,它建立在一定數量的數據庫之上,這些數據庫在物理上是可以分開的。數據倉庫通過Internet打破地域界限,將它們合成一個邏輯整體,把一個海量的數據庫展現在用戶面前。數據倉庫管理系統的一項重要工作是實現對傳統數據庫進行提取、清理和轉載到數據倉庫中。
數據挖掘技術。這是整個系統的難點和重點,主要涉及模式模型和挖掘算法。目前,己形成了多種數據挖掘方法,如分類知識發現、數據總結、數據聚類、關聯規則發現、序列模式發現、依賴關系或依賴模型發現、異常發現、趨勢預測等。各種方法均有它一定的優點,也有它的不足。幾種技術并不是單一的使用,而是根據實際情況綜合的加以應用。現在一些流行的數據挖掘工具一般都包括了幾種方法。如IBM公司Almaden研究中心開發的QUEST系統,SGI公司開發的MineSet系統都是多模式的挖掘工具。
數據分析工具。數據倉庫雖然存有大量數據,但提供輔助決策的信息需要利用各種分析工具,如聯機分析處理(OLAP)工具、統計分析和查詢優化工具等。這些工具的性能對管理決策的效果有著重要的影響。目前已出現具有智能功能的強大的數據分析工具,這些分析工具不僅能在系統運行時采集和處理數據,同時也支持對其他業務系統的數據進行采集。
4、數據挖掘在物流管理中的應用
(1)選址問題。物流中心(流通中心、配送中心)選址問題屬于最小成本問題,即求解是運輸成本、變動處理成本和固定成本等之和為最小的最小化問題。物流中心選址,需要考慮到中心點數量和中心點如何分布等情況。由于單一中心選址較為簡單,我們著重討論多個中心選址的問題。所謂多中心選址是指在一些已知的備選地點中選出一定數目的地點來設置物流中心(流通中心、配送中心),使形成的物流網絡的總費用最小,其中包括基本的投資費用、可變費用和不變費用。對于這類問題。在實際操作中,當問題規模變得很大,或者要考慮一些市場因素(比如顧客需求量)時,數學規劃就存在一些困難,因此,針對這一問題,可以用數據挖掘中的分類樹方法來加以解決。通過分類樹的方法,不僅確定了中心點的位置,同時也確定每年各個地址間物品的運輸量,使整個企業必要的銷售量得到保證。企業的長期折現的總成本也會達到最小值。
(2)配送問題。配送問題是現代物流系統中重要的一部分,配送問題包括配送計劃的編制、配送路線的設計和優化以及配送過程中的配載(混載)問題,在許多配送體系中,管理人員需要采取有效的配送策略以提高服務水平、降低貨運費用。其中要考慮到的有車輛的路徑問題,車輛路徑問題是為一些車輛確定一些客戶的路徑,每一客戶只能被訪問一次,且每條路徑上的客戶需求量之和不能超過車輛的承載能力。其次還會考慮到車輛的利用能力,如果車輛在運輸過程中的空載率過高或整車的運力不完全利用,這些無疑會增加企業的運輸成本;另外涉及到車輛的運輸能力,就必須考慮到貨品的規格大小和利潤價值的大小。在采取有效的配送策略時這些因素都必須同時考慮,這時如果能夠對顧客的需求和運輸路徑綜合起來進行分類,對整個配送策略中車輛的合理選擇分派會有著較好的作用。
(3)倉儲問題。倉庫問題在物流管理中正扮演著非常重要的角色。倉庫問題包括存儲貨物、中轉運輸、顧客服務三方面的內容,在這三方面的成本計算中,倉儲成本無疑在企業總的成本核算中占很大一部分,如何合理安排貨品的存儲、壓縮貨品的存儲成本正成為現代物流管理者不斷思考的問題,對于貨品的存放問題,哪些貨品放在一起可以提高揀貨效率?哪些貨品放在一起卻達不到這樣的效果呢?其實在解決這個問題上,我們可以采取數據挖掘中的關聯模式分析來幫助解決這方面的問題。
伴隨著信息時代的數據量劇增的顯著特征,深化物流信息管理的最有效的方法是在其中引進數據挖掘技術,數據挖掘可以從數據中發現趨勢和模式,人們通過數據挖掘得到的回報就是將新發現的指示轉變為經營上的成果,可以提高利潤,降低成本等。充分合理的利用數據挖掘技術,可以進行市場預測和分析,這必將為正確的決策奠定堅實的基礎。同時也為物流的管理和發展指明了方向。