美章網(wǎng) 資料文庫 經(jīng)濟統(tǒng)計中數(shù)據(jù)挖掘技術(shù)分析范文

經(jīng)濟統(tǒng)計中數(shù)據(jù)挖掘技術(shù)分析范文

本站小編為你精心準備了經(jīng)濟統(tǒng)計中數(shù)據(jù)挖掘技術(shù)分析參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

經(jīng)濟統(tǒng)計中數(shù)據(jù)挖掘技術(shù)分析

摘要:

社會經(jīng)濟的發(fā)展,使得經(jīng)濟統(tǒng)計工作越來越重要,統(tǒng)計的數(shù)據(jù)能夠?qū)⒄麄€社會經(jīng)濟運行的情況進行準確科學反映,同時能夠為國家政策的調(diào)整提供參考依據(jù)。一般而言,要想確保經(jīng)濟數(shù)據(jù)的實效性、可信性以及真實性,必須要在經(jīng)濟統(tǒng)計中充分應(yīng)用數(shù)據(jù)挖掘技術(shù),這樣才能有效保證經(jīng)濟統(tǒng)計工作的順利進行。隨著數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的作用日益突出,因此社會各界開始廣泛關(guān)注其在社會活動中的應(yīng)用。本文就對經(jīng)濟統(tǒng)計中數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用進行深入分析和探討。

關(guān)鍵詞:

經(jīng)濟統(tǒng)計;數(shù)據(jù)挖掘技術(shù);應(yīng)用

自改革開放以來,我國的經(jīng)濟發(fā)展較為迅速,經(jīng)濟建設(shè)活動日益增多,累積了大量的經(jīng)濟統(tǒng)計數(shù)據(jù)。由于信息的多樣性以及數(shù)據(jù)的復雜性,使得工作人員在統(tǒng)計數(shù)據(jù)時,僅僅只采用其中數(shù)理知識,而沒有深入挖掘相關(guān)的統(tǒng)計資料。隨著科學技術(shù)的發(fā)展,數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中發(fā)揮出了十分重要的作用,其能夠?qū)?shù)據(jù)進行縱橫式開發(fā),并通過挖掘基礎(chǔ)數(shù)據(jù),獲得更多有用的信息,從而滿足社會對統(tǒng)計數(shù)據(jù)的需求[1]。一般在社會經(jīng)濟管理活動中,在對經(jīng)濟數(shù)據(jù)進行統(tǒng)計管理時,必須要確保統(tǒng)計數(shù)據(jù)的真實性以及實用性。數(shù)據(jù)挖掘技術(shù)作為一種經(jīng)濟數(shù)據(jù)統(tǒng)計技術(shù),能夠有效促進經(jīng)濟數(shù)據(jù)統(tǒng)計活動的順利進行,其在經(jīng)濟數(shù)據(jù)統(tǒng)計活動中的應(yīng)用方法主要包括三種:一是預處理方法;二是決策樹方法;三是集成化處理方法。

一、處理方法的有效應(yīng)用

在經(jīng)濟數(shù)據(jù)統(tǒng)計活動中,預處理方法是最為基礎(chǔ)的處理方式,其主要是對基礎(chǔ)數(shù)據(jù)信息進行智能分析。一般來說,數(shù)據(jù)挖掘受基礎(chǔ)數(shù)據(jù)信息的限制,不能代替經(jīng)濟數(shù)據(jù)系統(tǒng)的功能,并且在數(shù)據(jù)挖掘系統(tǒng)中,其數(shù)據(jù)基礎(chǔ)的經(jīng)濟統(tǒng)計數(shù)據(jù)信息具有多樣性和復雜性,因此必須要對經(jīng)濟統(tǒng)計數(shù)據(jù)信息進行預處理[2]。在處理統(tǒng)計數(shù)據(jù)信息時,主要就是對不準確、不正確以及真實的數(shù)據(jù)進行處理,并分析不同經(jīng)濟統(tǒng)計數(shù)據(jù)信息之間的差距。數(shù)據(jù)清理是指對存在問題的數(shù)據(jù)進行處理的過程,目前在對數(shù)據(jù)進行清理時,主要采用預測法、平滑法以及均值法。一般如果基礎(chǔ)數(shù)據(jù)中的某個數(shù)據(jù)點是噪聲數(shù)據(jù)以及空值時,對其進行處理時可以采用均值法,利用數(shù)據(jù)庫中所有該屬性已知的屬性均值,并對其的空缺進行填補,從而確保數(shù)據(jù)挖掘系統(tǒng)能夠正常整理和分析基礎(chǔ)數(shù)據(jù),使統(tǒng)計分析的數(shù)據(jù)具備較高的準確度。其中數(shù)據(jù)點的取值用Ci表示,數(shù)據(jù)點前后不為空的數(shù)據(jù)點用Cj表示,計算數(shù)據(jù)點所取的參考數(shù)據(jù)點數(shù)量用K表示。平滑法行為一種計算方法,其也是對基礎(chǔ)數(shù)據(jù)中噪聲數(shù)據(jù)以及空值進行計算。但是與均值法有所不同,其是用加權(quán)平均數(shù)來代替平均數(shù),并對計算過程中提取的數(shù)據(jù)對數(shù)據(jù)結(jié)果的影響權(quán)重進行綜合考慮,因此平滑法計算出的數(shù)據(jù)結(jié)果更為真實準確。其中數(shù)據(jù)點的取值用Ci表示,數(shù)據(jù)點前后不為空的數(shù)據(jù)點用Cj表示,計算數(shù)據(jù)點所取的參考數(shù)據(jù)點數(shù)量用K表示,Cj數(shù)據(jù)點的權(quán)值用Wj表示。

二、策樹方法的有效應(yīng)用

在應(yīng)用數(shù)據(jù)挖掘技術(shù)的過程中,系統(tǒng)經(jīng)過分析與總結(jié)之后,必須要對數(shù)據(jù)的輸出分析,一般數(shù)據(jù)的輸出形式直接影響著使用者的經(jīng)濟管理決策。決策樹作為一種分類方法,其更為直觀與快速,采用決策樹方法的關(guān)鍵就是對決策樹進行構(gòu)建。首先必須要利用訓練集監(jiān)理決策樹,并對其進行精簡,建立出輸出分析的模型。然后利用決策樹對輸入的數(shù)據(jù)進行分類,可以從決策樹根部開始進入樹丫,直到輸入數(shù)據(jù)的分類滿足條件之后停止。一般其停止分割時,必須要滿足兩個條件:一是某個節(jié)點上的全部數(shù)據(jù)屬于同一類別;二是輸入數(shù)據(jù)沒有分類屬性進行再分割。值得注意的是,在構(gòu)建完決策樹之后,必須要結(jié)合使用者的實際情況和要求,對決策樹進行“剪枝”,因為使用訓練集能夠影響決策樹本身數(shù)據(jù)的輸出,這樣能夠有效降低該數(shù)據(jù)產(chǎn)生起伏影響。

三、成化處理方法的有效應(yīng)用

一般在對數(shù)據(jù)挖掘技術(shù)進行應(yīng)用時,由于數(shù)據(jù)統(tǒng)計的主體不同以及統(tǒng)計的標準不統(tǒng)一,往往會出現(xiàn)數(shù)據(jù)集成問題,因此為了保證經(jīng)濟數(shù)據(jù)的有效集成以及統(tǒng)計的準確性,必須要考慮數(shù)據(jù)集成過程中的模式集成以及冗余問題。

(一)模式集成社會經(jīng)濟活動中,經(jīng)濟數(shù)據(jù)的統(tǒng)計很多來自于民間統(tǒng)計組織,導致統(tǒng)計內(nèi)容過于廣泛,因此在數(shù)據(jù)挖掘過程中,在集成經(jīng)濟數(shù)據(jù)時必須要進行實體識別。如在數(shù)據(jù)挖掘過程中,怎樣對一個數(shù)據(jù)庫中的“std-no”與另一數(shù)據(jù)庫中的“std-id”是否表示同一實體進行確定,目前主要是利用數(shù)據(jù)庫與數(shù)據(jù)庫之間的含元數(shù)據(jù)對比,從而提高實體識別的質(zhì)量和效率。

(二)冗余問題經(jīng)濟統(tǒng)計數(shù)據(jù)經(jīng)過數(shù)據(jù)挖掘技術(shù)的加工之后,能夠達到最簡狀態(tài)。在數(shù)據(jù)挖掘過程中,必須要精簡其與其他數(shù)據(jù)之間存在正相關(guān)關(guān)系的數(shù)據(jù)項目,這樣才能使數(shù)據(jù)庫中數(shù)據(jù)量保持在較低的水平,便于數(shù)據(jù)的應(yīng)用和管理[3]。一般在數(shù)據(jù)挖掘中容易出現(xiàn)冗余問題,如國民生產(chǎn)總值,其數(shù)值的計算主要是利用總?cè)丝趯傩耘c國內(nèi)生產(chǎn)總值加以計算。一般在判斷冗余屬性時,主要是利用相關(guān)度的對比。其中元組的個數(shù)用n表示,屬性A和屬性B的平均值用以及表示,屬性A和屬性B的標準方差用σA以及σB表示。其中如果rA,B>0,則說明屬性A與屬性B呈正相關(guān),屬性A增大,則屬性B也隨之增大;如果rA,B=0,則說明屬性A與屬性B沒有直接關(guān)系,彼此相互獨立;如果rA,B<0,則說明屬性A與屬性B呈負相關(guān),屬性A增大,屬性B則減小。

四、結(jié)束語

一般而言,對經(jīng)濟數(shù)據(jù)進行處理時,傳統(tǒng)的數(shù)據(jù)處理方式是利用樹數(shù)理統(tǒng)計學的知識與軟件,開發(fā)利用經(jīng)濟統(tǒng)計數(shù)據(jù)庫中的數(shù)據(jù),但是這樣的處理方式往往形式單一,無法對數(shù)據(jù)進行深入挖掘,因此無法有效滿足社會的需求。但是數(shù)據(jù)挖掘能夠?qū)⑻摷俚臄?shù)據(jù)加以剔除,從而提高數(shù)據(jù)的質(zhì)量,并且能夠?qū)?shù)據(jù)之間的聯(lián)系進行深入挖掘,充分有效挖掘數(shù)據(jù)。因此在經(jīng)濟統(tǒng)計中應(yīng)用數(shù)據(jù)挖掘技術(shù)顯得十分之必要。

[參考文獻]

[1]王康.關(guān)于數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用[J].財經(jīng)界(學術(shù)版),2011,05:98.

[2]郝巖.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用探究[J].現(xiàn)代經(jīng)濟信息,2013,11:294.

[3]崔丹.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用探索[J].財經(jīng)界(學術(shù)版),2014,03:149.

[4]劉秀華.淺談數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用[J].商場現(xiàn)代化,2014,23:280

作者:田計樂 單位:河北省雞澤縣衛(wèi)生監(jiān)督所

主站蜘蛛池模板: 色天天综合色天天看| 一个人看的视频www在线| 欧美日本韩国一区二区| 免费国产在线观看不卡| 豆奶视频官网下载观看| 国产精品亚洲а∨天堂2021 | 国产午夜福利在线观看红一片| 182在线播放| 在线观看免费大黄网站| 一本到卡二卡三卡免费高| 无翼乌邪恶工番口番邪恶| 久久综合五月婷婷| 欧美乱妇高清无乱码亚洲欧美| 亚洲色国产欧美日韩| 精品人妻一区二区三区四区在线 | 国产丝袜第一页| 久久久精品久久久久三级| 国产精品视频九九九| 99精品中文字幕| 好男人什么影院| 三级中文有码中文字幕| 无码毛片视频一区二区本码| 久久国产精品亚洲一区二区| 最新无码a∨在线观看| 亚洲人成在久久综合网站| 欧美日韩视频在线第一区| 亚洲综合一区二区| 狠狠色丁香婷婷久久综合| 免费无码va一区二区三区| 美女扒开尿眼让男人桶爽视频| 国产一级αv片免费观看| 韩国护士hd高清xxxx| 国产成人免费在线| 欧美另类videovideosex| 国产精品xxxx国产喷水| 222www免费视频| 国产精品视频免费视频| 99re热视频这里只精品| 在线观看亚洲一区| av毛片免费看| 大又大粗又爽又黄少妇毛片|