本站小編為你精心準備了電力企業竊漏電用戶自動識別探析參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
【摘要】竊電對電力設施會造成破壞,引發大面積停電事故。這不但給國家造成巨大的經濟損失,也嚴重破壞了供電市場的秩序,影響到廣大用戶的正常生活,甚至威脅到了國家電網的正常運行。本文闡述了將數據挖掘應用到竊漏電中具有重要的研究意義,并介紹了各層具體功能。基于數據挖掘技術構建的竊漏電用戶自動識別模型,對相關技術進行了介紹,利用該系統對用電戶的電能表數據進行模型構建,并對結果進行了分析。
【關鍵詞】數據挖掘;竊漏電;神經網絡;數據分析模型
1前言
據統計,全國每年都因竊漏電造成幾百億的元的經濟損失,被查出的竊漏電案件的數量極低,查處難度比較大,需要一定的專業技術和必要設備,同時還要有眾多的技術人員。如北京工業區一家生產服裝箱包的小廠,在一年的時間里竊電大約在20-30萬元,某省14年就因竊電帶來的損失就高達50億元。對于普通居民戶也存在竊電的行為,竊電量雖不及用電大戶多,但也不能忽視,此外,竊電可造成電力設施的破壞,引發大面積停電事故,每年都發生多起因竊電引起的事故。這不但給國家造成巨大的經濟損失,也嚴重破壞了供電市場的秩序,威脅到了國家電網的正常運行,影響到廣大用戶的正常生活。現有的用電檢查及反竊電工作主要依靠突擊檢查的方式來打擊竊電行為,費時又費力,存在先天性的缺陷和不足:一是由于傳統用電檢查工作往往是有計劃有周期的,在非檢查期用戶可能存在用電安全的隱患、電能表的故障以及竊電的行為,這些在檢查中不一定會被稽查人員發現。二是沒有針對性,在傳統的用電檢查中,對嫌隙電能表進行測量檢查校正,這也不是竊漏電檢查的主要方式和手段,但相對于數以萬計的用電戶不能夠及時的發現。三是稽查人員在查出竊漏電工作中,缺少很多必要的信息,例如用電戶的用電負荷情況或時時的電能表的信息。到現場去檢測也只能是獲得檢測時的電能信息。假如用戶采取不定時隨機的竊電方式,這種行為很難被稽查人員發現。對用電異常模型分析,雖然能獲取一些竊漏電的有用信息,但由于終端誤報或漏報,不能快速準確的識別出真正的竊漏電用戶,這種情況下對竊漏電的查處很不利,獲取到的信息不能真正發揮作用,在構建這種分析模型時還需要一定的專業知識和豐富的經驗,所得到的結果還有一定的誤差和主觀性。
2數據挖掘技術
神經網絡技術是一種對信息進行處理的算法的數學模型,用來信息處理的算法。這種技術依附復雜的系統特征,通過調整系統內部大量節點之間的相互聯系,進而實現對信息的處理和利用。人工神經網絡隨著不斷的訓練和完善,它的學習能力和適應的能力也在不斷的提高,通過給它提供大量的數據,分析這些數據之間潛在的聯系和規律,并根據訓練得出的規律,來分析新的大量的輸入數據并推斷出符合期望的結果。CART決策樹ClassificationAndRegressionTree,即分類回歸樹算法,簡稱CART算法,它是決策樹的一種實現,通常決策樹主要有三種實現,分別是ID3算法,CART算法和C4.5算法。CART算法把樣本數據分割為多個子樣本,每一個生成的非葉子結點都有兩個分支,CART是一種二分遞歸分割技術,用它生成的決策樹是結構簡潔的二叉樹。它可以分為以下兩個步驟:(1)將樣本遞歸劃分進行建樹過程;(2)用驗證數據進行剪枝。
3模型的實現
3.1分析方法與過程
竊漏電用戶在電力計量自動化系統的監控大用戶中只占小部分,同時某些大用戶也不可能存在竊漏電行為,如銀行、稅務、學校、工商等非居民類別,故在數據預處理時有必要將這些類別用戶剔除。系統中的用電負荷不能直接體現出用戶的竊漏電行為,終端報警可能存在誤報和漏報,因此要對數據進行探索和預處理,總結竊漏電用戶的行為規律,再從數據中提煉出描述竊漏電用戶的特征指標。最后結合歷史竊漏電用戶信息,整理出專家樣本數據集,再進一步構建分類模型,實現竊漏電用戶的自動識別。主要包括以下步驟:(1)從電力計量自動化系統、營銷系統有選擇性地抽取部分大用戶用電負荷、終端報警及違約竊電處罰信息等原始數據;(2)對樣本數據探索分析,剔除不可能存在竊漏電行為行業的用戶,即白名單用戶,初步審視正常用戶和竊漏電用戶的用電特征;(3)對樣本數據進行預處理,包括數據清洗、缺失值的處理和數據變換;(4)構建專家樣本集;(5)構建竊漏電模型;(6)在線監測用戶用電負荷及終端報警,調用模型實現實時診斷。
3.2數據抽取與竊漏電相關的原始數據
主要有用電負荷數據、終端報警數據、違約竊電處罰信息以及用戶檔案資料等,故進行竊漏電診斷建模時需從如下系統中抽取數據。
3.2.1從營銷系統抽取的數據主要有(1)用戶基本信息:用戶名稱、用戶編號、用電地址、用電類別、報裝容量、計量方式、電流互感器變比、電壓互感器變比;(2)違約、竊電處理記錄;(3)計量方法及依據。
3.2.2從計量自動化系統采集的數據屬性主要有(1)實時負荷:時間點、計量點、總有功功率、A/B/C相有功功率、A/B/C相電流、A/B/C相電壓、A/B/C相功率因數;(2)終端報警。竊漏電用戶的竊漏電開始時間和結束時間是表征其竊漏電的關鍵時間節點,在這些時間節點上,用電負荷和終端報警等數據也會有一定的特征變化,故樣本數據抽取時務必要包含關鍵時間節點前后一定范圍的數據,并通過用戶的負荷數據計算出當天的用電量,公式如下:fl=0.25∑mi∈l天mi(1)其中fl為第l天的用電量,mi為第l天每隔15分鐘的總有功功率,對其累加求和得到當天用電量。基于此,本案例抽取某市近5年來所有的竊漏電用戶有關數據和不同用電類別正常用電用戶共208個用戶的有關數據,時間跨度為五年,從2009年元旦開始,截止到2014年12月31日,同時包含每天是否有竊漏電情況的標識。
3.3構建模型
3.3.1構建竊漏電用戶識別模型在專家樣本準備完成后,需要劃分出測試、訓練樣本,隨機選取20%作為測試樣本,剩下的作為訓練樣本。竊漏電用戶識別可通過構建分類預測模型來實現,比較常用的分類預測模型有神經網絡和CART決策樹,各個模型都有各自的優點,故采用這兩種方法構建竊漏電用戶識別,并從中選擇最優的分類模型。
3.3.2神經網絡設定神經網絡的輸入節點數為3,輸出節點數為1,隱層節點數為10,權值的衰減參數為0.05。訓練樣本建模的混淆矩陣見表3-9,分類準確率為94.17%,正常用戶被誤判為竊漏電用戶占正常用戶的1.95%,竊漏電用戶被誤判為正常用戶占正常竊漏電用戶的28.6%。
3.3.3CART決策樹利用訓練樣本構建CART決策樹模型,得到的決策樹模型見圖2。分類準確率為91.67%,正常用戶被誤判為竊漏電用戶占正常用戶的5.85%,竊漏電用戶被誤判為正常用戶占正常竊漏電用戶的22.86%。
3.4模型評價
對于訓練樣本,構建模型后的神經網絡分類準確率與CART決策樹的分類準確率相差不大,兩者都能達到90%以上。為了進一步評估模型分類的性能,故利用測試樣本對兩個模型進行評價,評價方法采用ROC曲線進行評估,一個較為滿意的分類器所對應的ROC曲線應該是盡量靠近左上角。神經網絡和CART決策樹對測試數據集的測試代碼。分別畫出神經網絡和CART決策樹在測試樣本下的ROC曲線。經過對比上面兩個ROC曲線發現神經網絡的ROC曲線比CART決策樹的ROC曲線更加靠近單位方形的左上角,神經網絡模型曲線下的面積更大,說明神經網絡模型的分類性能較好,能應用于實際的竊漏電用戶的識別。
4結論
基于數據挖掘技術,探討了竊電識別系統,既解決了竊漏電的難以檢測的問題,挽回了國家的損失,又很好的建立了快速檢測竊漏電的檢測系統,為電力監測提供了很好的檢測手段,減輕了稽查人員的工作負擔,提高了他們的工作效率。
參考文獻:
[1]曾翔宇.基于數據挖掘的列車智能駕駛模型研究[D].北京:北京交通大學,2014.
[2]陳淵.數據挖掘技術在丙酮精制過程中的應用研究[D].北京:清華大學,2007.
[3]成蓬勃.基于數據挖掘技術的配電網故障診斷研究[D].南寧:廣西大學,2007.
[4]黃中海.數據挖掘在高校學生心理危機預防中的應用[D].武漢:武漢科技大學,2015.
[5]靳濤.數據挖掘及在電廠凝汽設備診斷中的應用[D].北京:華北電力大學北京,2003.
作者:劉婷婷;王志新;葛明濤 單位:鄭州大學西亞斯國際學院