本站小編為你精心準(zhǔn)備了大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)重構(gòu)分析參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
摘要:基于大數(shù)據(jù)特征,統(tǒng)計(jì)學(xué)的抽樣理論和總體理論的存在價(jià)值、統(tǒng)計(jì)方法的重構(gòu)及統(tǒng)計(jì)結(jié)果評(píng)價(jià)標(biāo)準(zhǔn)的重建等成為統(tǒng)計(jì)學(xué)理論面臨解決的首要問題.為適應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展,分析了大數(shù)據(jù)時(shí)代傳統(tǒng)統(tǒng)計(jì)學(xué)所面臨的機(jī)遇與挑戰(zhàn),對(duì)傳統(tǒng)統(tǒng)計(jì)學(xué)的繼承、發(fā)展和完善,重構(gòu)大數(shù)據(jù)時(shí)代新的統(tǒng)計(jì)理論有其重要意義.
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);數(shù)據(jù)分析;抽樣理論;理論
重構(gòu)隨著信息科學(xué)技術(shù)的高速度發(fā)展,當(dāng)代獲取和儲(chǔ)存數(shù)據(jù)信息的能力不斷增強(qiáng)而成本不斷下降,這為大數(shù)據(jù)的應(yīng)用提供了必要的技術(shù)環(huán)境和可能.應(yīng)用大數(shù)據(jù)技術(shù)的優(yōu)勢(shì)愈來(lái)愈明顯,它的應(yīng)用能夠幫助人類獲取真正有價(jià)值的數(shù)據(jù)信息.近年來(lái),專家學(xué)者有關(guān)大數(shù)據(jù)技術(shù)問題進(jìn)行了大量的研究工作[1],很多領(lǐng)域也都受到了大數(shù)據(jù)分析的影響.這個(gè)時(shí)代將大數(shù)據(jù)稱為未來(lái)的石油,它必將對(duì)這個(gè)時(shí)代和未來(lái)的社會(huì)經(jīng)濟(jì)以及科學(xué)技術(shù)的發(fā)展產(chǎn)生深遠(yuǎn)的意義和影響.目前對(duì)于大數(shù)據(jù)概念,主要是從數(shù)據(jù)來(lái)源和數(shù)據(jù)的處理工具與處理難度方面考慮,但國(guó)內(nèi)外專家學(xué)者各有各的觀點(diǎn),并沒有給出一致的精確定義.麥肯錫全球數(shù)據(jù)分析研究所指出大數(shù)據(jù)是數(shù)據(jù)集的大小超越了典型數(shù)據(jù)庫(kù)工具集合、存儲(chǔ)、管理和分析能力的數(shù)據(jù)集,大數(shù)據(jù)被Gartner定義為極端信息管理和處理一個(gè)或多個(gè)維度的傳統(tǒng)信息技術(shù)問題[23].目前得到專家們認(rèn)可的一種觀點(diǎn),即:“超大規(guī)模”是GB級(jí)數(shù)據(jù),“海量”是TB級(jí)數(shù)據(jù),而“大數(shù)據(jù)”是PB及其以上級(jí)別數(shù)據(jù)[2].
一些研究學(xué)者把大數(shù)據(jù)特征進(jìn)行概括,稱其具有數(shù)據(jù)規(guī)模巨大、類型多樣、可利用價(jià)值密度低和處理速度快等特征,同時(shí)特別強(qiáng)調(diào)大數(shù)據(jù)區(qū)別于其他概念的最重要特征是快速動(dòng)態(tài)變化的數(shù)據(jù)和形成流式數(shù)據(jù).大數(shù)據(jù)技術(shù)發(fā)展所面臨的問題是數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理和數(shù)據(jù)分析、數(shù)據(jù)顯示和數(shù)據(jù)安全等.大數(shù)據(jù)的數(shù)據(jù)量大、多樣性、復(fù)雜性及實(shí)時(shí)性等特點(diǎn),使得數(shù)據(jù)存儲(chǔ)環(huán)境有了很大變化[45],而大部分傳統(tǒng)的統(tǒng)計(jì)方法只適合分析單個(gè)計(jì)算機(jī)存儲(chǔ)的數(shù)據(jù),這些問題無(wú)疑增加了數(shù)據(jù)處理和整合的困難.數(shù)據(jù)分析是大數(shù)據(jù)處理的核心過程,同時(shí)它也給傳統(tǒng)統(tǒng)計(jì)學(xué)帶來(lái)了巨大的挑戰(zhàn)[6].產(chǎn)生大數(shù)據(jù)的數(shù)據(jù)源通常情況下具有高速度性和實(shí)時(shí)性,所以要求數(shù)據(jù)處理和分析系統(tǒng)也要有快速度和實(shí)時(shí)性特點(diǎn),而傳統(tǒng)統(tǒng)計(jì)分析方法通常不具備快速和實(shí)時(shí)等特點(diǎn).基于大數(shù)據(jù)的特點(diǎn),傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)理論已經(jīng)不能適應(yīng)大數(shù)據(jù)分析與研究的范疇,傳統(tǒng)統(tǒng)計(jì)學(xué)面臨著巨大的機(jī)遇與挑戰(zhàn),然而為了適應(yīng)大數(shù)據(jù)這一新的研究對(duì)象,傳統(tǒng)統(tǒng)計(jì)學(xué)必須進(jìn)行改進(jìn),以繼續(xù)和更好的服務(wù)于人類.目前國(guó)內(nèi)外將大數(shù)據(jù)和統(tǒng)計(jì)學(xué)相結(jié)合的研究文獻(xiàn)并不多.本文對(duì)大數(shù)據(jù)時(shí)代這一特定環(huán)境背景,統(tǒng)計(jì)學(xué)的抽樣理論和總體理論的存在價(jià)值、統(tǒng)計(jì)方法的重構(gòu)及統(tǒng)計(jì)結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn)的重建等問題進(jìn)行分析與研究.
1傳統(tǒng)意義下的統(tǒng)計(jì)學(xué)
廣泛的統(tǒng)計(jì)學(xué)包括三個(gè)類型的統(tǒng)計(jì)方法:①處理大量隨機(jī)現(xiàn)象的統(tǒng)計(jì)方法,比如概率論與數(shù)理統(tǒng)計(jì)方法.②處理非隨機(jī)非概率的描述統(tǒng)計(jì)方法,如指數(shù)編制、社會(huì)調(diào)查等方法.③處理和特定學(xué)科相關(guān)聯(lián)的特殊方法,如經(jīng)濟(jì)統(tǒng)計(jì)方法、環(huán)境科學(xué)統(tǒng)計(jì)方法等[7].受收集、處理數(shù)據(jù)的工具和能力的限制,人們幾乎不可能收集到全部的數(shù)據(jù)信息,因此傳統(tǒng)的統(tǒng)計(jì)學(xué)理論和方法基本上都是在樣本上進(jìn)行的.或者即使能夠得到所有數(shù)據(jù),但從實(shí)際角度出發(fā),因所需成本過大,也會(huì)放棄搜集全部數(shù)據(jù).然而,選擇最佳的抽樣方法和統(tǒng)計(jì)分析方法,也只能最大程度還原總體一個(gè)特定方面或某些方面的特征.事實(shí)上我們所察覺到的數(shù)據(jù)特征也只是總體大量特征中的一小部分,更多的其他特征尚待發(fā)掘.總之,傳統(tǒng)統(tǒng)計(jì)學(xué)是建立在抽樣理論基礎(chǔ)上,以點(diǎn)帶面的統(tǒng)計(jì)分析方法,強(qiáng)調(diào)因果關(guān)系的統(tǒng)計(jì)分析結(jié)果,推斷所測(cè)對(duì)象的總體本質(zhì)的一門科學(xué),是通過搜集、整理和分析研究數(shù)據(jù)從而探索數(shù)據(jù)內(nèi)部存在規(guī)律的一門科學(xué).
2統(tǒng)計(jì)學(xué)是大數(shù)據(jù)分析的核心
數(shù)的產(chǎn)生基于三個(gè)要素,分別是數(shù)、量和計(jì)量單位.在用數(shù)來(lái)表示事物的特征并采用了科學(xué)的計(jì)量單位后,就產(chǎn)生了真正意義上的數(shù)據(jù),即有根據(jù)的數(shù).科學(xué)數(shù)據(jù)是基于科學(xué)設(shè)計(jì),通過使用觀察和測(cè)量獲得的數(shù)據(jù),認(rèn)知自然現(xiàn)象和社會(huì)現(xiàn)象的變化規(guī)律,或者用來(lái)檢驗(yàn)已經(jīng)存在的理論假設(shè),由此得到了具有實(shí)際意義和理論意義的數(shù)據(jù).從數(shù)據(jù)中獲得科學(xué)數(shù)據(jù)的理論,即統(tǒng)計(jì)學(xué)理論.科學(xué)數(shù)據(jù)是通過統(tǒng)計(jì)學(xué)理論獲得的,而統(tǒng)計(jì)學(xué)理論是為獲得科學(xué)數(shù)據(jù)而產(chǎn)生的一門科學(xué).若說數(shù)據(jù)是傳達(dá)事物特征的精確語(yǔ)言,進(jìn)行科學(xué)研究的必備條件,認(rèn)知世界的重要工具,那么大數(shù)據(jù)分析就是讓數(shù)據(jù)最大限度地發(fā)揮功能,充分表達(dá)并有效滿足不同需求的基本要求.基于統(tǒng)計(jì)學(xué)的發(fā)展史及在數(shù)據(jù)分析中的作用,完成將數(shù)據(jù)轉(zhuǎn)化為知識(shí)、挖掘數(shù)據(jù)內(nèi)在規(guī)律、通過數(shù)據(jù)發(fā)現(xiàn)并解決實(shí)際問題、預(yù)測(cè)可能發(fā)生的結(jié)果等是研究大數(shù)據(jù)的任務(wù),而這必然離不開統(tǒng)計(jì)學(xué).以大數(shù)據(jù)為研究對(duì)象,通過數(shù)據(jù)挖掘、提取、分析等手段探索現(xiàn)象內(nèi)在本質(zhì)的數(shù)據(jù)科學(xué)必須在繼承或改進(jìn)統(tǒng)計(jì)學(xué)理論的基礎(chǔ)上產(chǎn)生.
統(tǒng)計(jì)數(shù)據(jù)的發(fā)展變化經(jīng)歷了一系列過程,從只能收集到少量的數(shù)據(jù)到盡量多地收集數(shù)據(jù),到科學(xué)利用樣本數(shù)據(jù),再到綜合利用各類數(shù)據(jù),以至于發(fā)展到今天的選擇使用大數(shù)據(jù)的過程.而統(tǒng)計(jì)分析為了適應(yīng)數(shù)據(jù)可觀察集的不斷增大,也經(jīng)歷了相應(yīng)的各個(gè)不同階段,產(chǎn)生了統(tǒng)計(jì)分組法、大量觀察法、歸納推斷法、綜合指標(biāo)法、模型方程法和數(shù)據(jù)挖掘法等分析方法,并且借助計(jì)算機(jī)以及其他軟件的程度也越來(lái)越深.300多年來(lái),隨著數(shù)據(jù)量以指數(shù)速度的不斷增長(zhǎng),統(tǒng)計(jì)學(xué)圍繞如何搜集、整理和分析數(shù)據(jù)而展開,合理構(gòu)建了應(yīng)用方法體系,幫助各個(gè)學(xué)科解決了許多復(fù)雜問題.現(xiàn)在進(jìn)入了大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)學(xué)依舊是數(shù)據(jù)分析的靈魂,大數(shù)據(jù)分析是數(shù)據(jù)科學(xué)賦予統(tǒng)計(jì)學(xué)的新任務(wù).對(duì)于統(tǒng)計(jì)學(xué)而言,來(lái)自新時(shí)代的數(shù)據(jù)科學(xué)挑戰(zhàn)有可能促使新思想、新方法和新技術(shù)產(chǎn)生,這一挑戰(zhàn)也意味著對(duì)于統(tǒng)計(jì)學(xué)理論將面臨巨大的機(jī)遇.
3統(tǒng)計(jì)學(xué)在大數(shù)據(jù)時(shí)代下必須改革
傳統(tǒng)統(tǒng)計(jì)學(xué)是通過對(duì)總體進(jìn)行抽樣來(lái)搜索數(shù)據(jù),對(duì)樣本數(shù)據(jù)進(jìn)行整理、分析、描述等,從而推斷所測(cè)對(duì)象的總體本質(zhì),甚至預(yù)測(cè)總體未來(lái)的一門綜合性學(xué)科.從研究對(duì)象到統(tǒng)計(jì)結(jié)果的評(píng)判標(biāo)準(zhǔn)都是離不開樣本的抽取,完全不能適應(yīng)大數(shù)據(jù)的4V特點(diǎn),所以統(tǒng)計(jì)學(xué)為適應(yīng)大數(shù)據(jù)技術(shù)的發(fā)展,必須進(jìn)行改革.從學(xué)科發(fā)展角度出發(fā),大數(shù)據(jù)對(duì)海量數(shù)據(jù)進(jìn)行存儲(chǔ)、整合、處理和分析,可以看成是一種新的數(shù)據(jù)分析方法.數(shù)據(jù)關(guān)系的內(nèi)在本質(zhì)決定了大數(shù)據(jù)和統(tǒng)計(jì)學(xué)之間必然存在聯(lián)系,大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的發(fā)展提出了挑戰(zhàn),體現(xiàn)在大樣本標(biāo)準(zhǔn)的調(diào)整、樣本選取標(biāo)準(zhǔn)和形式的重新確定、統(tǒng)計(jì)軟件有待升級(jí)和開發(fā)及實(shí)質(zhì)性統(tǒng)計(jì)方法的大數(shù)據(jù)化.但是也提供了一個(gè)機(jī)遇,體現(xiàn)在統(tǒng)計(jì)質(zhì)量的提高、統(tǒng)計(jì)成本的下降、統(tǒng)計(jì)學(xué)作用領(lǐng)域的擴(kuò)大、統(tǒng)計(jì)學(xué)科體系的延伸以及統(tǒng)計(jì)學(xué)家地位的提升[7].
3.1大數(shù)據(jù)時(shí)代抽樣和總體理論存在價(jià)值
傳統(tǒng)統(tǒng)計(jì)學(xué)中的樣本數(shù)據(jù)來(lái)自總體,而總體是客觀存在的全體,可以通過觀測(cè)到的或經(jīng)過抽樣而得到的數(shù)據(jù)來(lái)認(rèn)知總體.但是在大數(shù)據(jù)時(shí)代,不再是隨機(jī)樣本,而是全部的數(shù)據(jù),還需要假定一個(gè)看不見摸不著的總體嗎?如果將大數(shù)據(jù)看成一個(gè)高維度的大樣本集合,針對(duì)樣本大的問題,按照傳統(tǒng)統(tǒng)計(jì)學(xué)的方法,可以采用抽樣的方法來(lái)減少樣本容量,并且可以達(dá)到需要的精度;對(duì)于維度高的問題,可以采取對(duì)變量進(jìn)行選擇、降維、壓縮、分解等方法來(lái)降低數(shù)據(jù)的復(fù)雜程度.但實(shí)際上很難做得到,大數(shù)據(jù)涵蓋多學(xué)科領(lǐng)域、多源、混合的數(shù)據(jù),各學(xué)科之間的數(shù)據(jù)融合,學(xué)科邊界模糊,各范疇的數(shù)據(jù)集互相重疊,合成一體,而且大數(shù)據(jù)涉及到各種數(shù)據(jù)類型.因此想要通過抽樣而使數(shù)據(jù)量達(dá)到傳統(tǒng)統(tǒng)計(jì)學(xué)的統(tǒng)計(jì)分析能力范圍是一件相當(dāng)困難或是一件不可能的事.大量的結(jié)構(gòu)數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)交織在一起,系統(tǒng)首先要認(rèn)清哪個(gè)是有價(jià)值的信息,哪個(gè)是噪聲,以及哪些不同類型的數(shù)據(jù)信息來(lái)自于同一個(gè)地址的數(shù)據(jù)源,等等,傳統(tǒng)的統(tǒng)計(jì)學(xué)是無(wú)法做到的.在大數(shù)據(jù)時(shí)代下,是否需要打破傳統(tǒng)意義的抽樣理論、總體及樣本等概念和關(guān)系,是假設(shè)“樣本=總體”,還是“樣本趨近于總體”,還是不再使用總體和樣本這兩個(gè)概念,而重新定義一個(gè)更合適的概念,等等.人們?cè)撛鯓印鞍才拧背闃印⒖傮w及樣本等理論,或人們?cè)撛鯓有拚闃印⒖傮w、樣本的“公理化”定義,這個(gè)問題是大數(shù)據(jù)時(shí)代下,傳統(tǒng)統(tǒng)計(jì)學(xué)面臨改進(jìn)的首要問題.
3.2統(tǒng)計(jì)方法在大數(shù)據(jù)時(shí)代下的重構(gòu)問題
在大數(shù)據(jù)時(shí)代下,傳統(tǒng)的高維度表達(dá)、結(jié)構(gòu)描述和群體行為分析方法已經(jīng)不能精確表達(dá)大數(shù)據(jù)在異構(gòu)性、交互性、時(shí)效性、突發(fā)性等方面的特點(diǎn),傳統(tǒng)的“假設(shè)-模型-檢驗(yàn)”的統(tǒng)計(jì)方法受到了質(zhì)疑,而且從“數(shù)據(jù)”到“數(shù)據(jù)”的統(tǒng)計(jì)模式還沒有真正建立,急切需要一個(gè)新的理論體系來(lái)指引,從而建立新的分析模型.去除數(shù)據(jù)噪聲、篩選有價(jià)值的數(shù)據(jù)、整合不同類型的數(shù)據(jù)、快速對(duì)數(shù)據(jù)做出分析并得出分析結(jié)果等一系列問題都有待于研究.大數(shù)據(jù)分析涉及到三個(gè)維度,即時(shí)間維度、空間維度和數(shù)據(jù)本身的維度,怎樣才能全面、深入地分析大數(shù)據(jù)的復(fù)雜性與特性,掌握大數(shù)據(jù)的不確定性,構(gòu)建高效的大數(shù)據(jù)計(jì)算模型,變成了大數(shù)據(jù)分析的突破口.科學(xué)數(shù)據(jù)的演變是一個(gè)從簡(jiǎn)單到復(fù)雜的各種形式不斷豐富、相互包容的過程,是一個(gè)循序漸進(jìn)的過程,而不是簡(jiǎn)單的由一種形式取代另一種形式.研究科學(xué)數(shù)據(jù)的統(tǒng)計(jì)學(xué)理論也是一樣,也是由簡(jiǎn)單到復(fù)雜的各種形式相互包容、不斷豐富的發(fā)展過程,而絕不是完全否定一種理論、由另一種理論形式所代替.大數(shù)據(jù)時(shí)代的到來(lái)統(tǒng)計(jì)學(xué)理論必須要進(jìn)行不斷的完善和發(fā)展,以適應(yīng)呈指數(shù)增長(zhǎng)的數(shù)據(jù)量的大數(shù)據(jù)分析的需要.
3.3如何構(gòu)建大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn)框架
大數(shù)據(jù)時(shí)代下,統(tǒng)計(jì)分析評(píng)價(jià)的標(biāo)準(zhǔn)又該如何變化?傳統(tǒng)統(tǒng)計(jì)分析的評(píng)價(jià)標(biāo)準(zhǔn)有兩個(gè)方面,一是可靠性評(píng)價(jià),二是有效性評(píng)價(jià),然而這兩種評(píng)價(jià)標(biāo)準(zhǔn)都因抽樣而生.可靠性評(píng)價(jià)是指用樣本去推斷總體有多大的把握程度,一般用概率來(lái)衡量.可靠性評(píng)價(jià)有時(shí)表現(xiàn)為置信水平,有時(shí)表現(xiàn)為顯著性水平[8].怎么確定顯著性水平一直是個(gè)存在爭(zhēng)議的問題,特別是在模型擬合度評(píng)價(jià)和假設(shè)檢驗(yàn)中,因?yàn)楦髯詤⒄盏姆植碱愋筒灰粯?其統(tǒng)計(jì)量就不一樣,顯著性評(píng)價(jià)的臨界值也就不一樣,可是臨界值又與顯著性水平的高低直接相關(guān).而大數(shù)據(jù)在一定程度上是全體數(shù)據(jù),因此不存在以樣本推斷總體的問題,那么在這種情況下,置信水平、可靠性問題怎么確定?依據(jù)是什么?有效性評(píng)價(jià)指的是真實(shí)性,即為誤差的大小,它與準(zhǔn)確性、精確性有關(guān).通常準(zhǔn)確性是指觀察值與真實(shí)值的吻合程度,一般是無(wú)法衡量的,而精確性用抽樣分布的標(biāo)準(zhǔn)差來(lái)衡量.顯然,精確性是針對(duì)樣本數(shù)據(jù)而言的,也就是說樣本數(shù)據(jù)有精確性問題,同時(shí)也有準(zhǔn)確性問題.抽樣誤差和非抽樣誤差都可能存在于樣本數(shù)據(jù)中,抽樣誤差可以計(jì)算和控制,但是非抽樣誤差只能通過各種方式加以識(shí)別或判斷[910].大多數(shù)情況下,對(duì)于樣本量不是太大的樣本,非抽樣誤差可以得到較好的防范,然而對(duì)于大數(shù)據(jù)的全體數(shù)據(jù)而言,沒有抽樣誤差問題,只有非抽樣誤差問題,也就是說大數(shù)據(jù)的真實(shí)性只表現(xiàn)為準(zhǔn)確性.但是由于大數(shù)據(jù)特有的種種特性,使得大數(shù)據(jù)的非抽樣誤差很難進(jìn)行防范、控制,也很難對(duì)其進(jìn)行準(zhǔn)確性評(píng)價(jià).總之,對(duì)于大數(shù)據(jù)分析來(lái)說,有些統(tǒng)計(jì)分析理論是否還有意義,確切說有哪些統(tǒng)計(jì)學(xué)中的理論可以適用于大數(shù)據(jù)分析,而哪些統(tǒng)計(jì)學(xué)中的理論需要改進(jìn),哪些統(tǒng)計(jì)學(xué)中的理論已不再適用于大數(shù)據(jù)統(tǒng)計(jì)研究,等等,都有待于研究.所以大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)學(xué)必是在繼承中求改進(jìn),改進(jìn)中求發(fā)展,重構(gòu)適應(yīng)大數(shù)據(jù)時(shí)代的新統(tǒng)計(jì)學(xué)理論.
4結(jié)論
來(lái)自于社會(huì)各種數(shù)據(jù)源的數(shù)據(jù)量呈指數(shù)增長(zhǎng),大數(shù)據(jù)對(duì)社會(huì)發(fā)展的推動(dòng)力呈指數(shù)效應(yīng),大數(shù)據(jù)已是生命活動(dòng)的主要承載者.一個(gè)新事物的出現(xiàn),必然導(dǎo)致傳統(tǒng)觀念和傳統(tǒng)技術(shù)的變革.對(duì)傳統(tǒng)統(tǒng)計(jì)學(xué)來(lái)說,大數(shù)據(jù)時(shí)代的到來(lái)無(wú)疑是一個(gè)挑戰(zhàn),雖然傳統(tǒng)統(tǒng)計(jì)學(xué)必須做出改變,但是占據(jù)主導(dǎo)地位的依然會(huì)是統(tǒng)計(jì)學(xué),它會(huì)引領(lǐng)人類合理分析利用大數(shù)據(jù)資源.大數(shù)據(jù)給統(tǒng)計(jì)學(xué)帶來(lái)了機(jī)遇和挑戰(zhàn),統(tǒng)計(jì)學(xué)家們應(yīng)該積極學(xué)習(xí)新事物,適應(yīng)新環(huán)境,努力為大數(shù)據(jù)時(shí)代創(chuàng)造出新的統(tǒng)計(jì)方法,擴(kuò)大統(tǒng)計(jì)學(xué)的應(yīng)用范圍.
參考文獻(xiàn):
[1]陳冬玲,曾文.頻繁模式挖掘中基于CFP的應(yīng)用模型[J]沈陽(yáng)大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,27(4):296300.
[3]卞友江.“大數(shù)據(jù)”概念考辨[J].新聞研究導(dǎo)刊,2013,35(5):2528.
[5]靳小龍,王元卓,程學(xué)旗.大數(shù)據(jù)的研究體系與現(xiàn)狀[J].信息通信技術(shù),2013(6):3543.
[6]覃雄派,王會(huì)舉,杜小勇,等.大數(shù)據(jù)分析:Rdbms與Mapreduce的競(jìng)爭(zhēng)與共生[J].軟件學(xué)報(bào),2012,23(1):32-45.
[7]游士兵,張佩,姚雪梅.大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)和機(jī)遇[J].珞珈管理評(píng)論,2013(2):165171.
[8]李金昌.大數(shù)據(jù)與統(tǒng)計(jì)新思維[J].統(tǒng)計(jì)研究,2014,31(1):1017.
[10]付凱.詢問法市場(chǎng)調(diào)研中的非抽樣誤差研究[D].南京:南京航空航天大學(xué),2005.
作者:岳曉寧;丁宇 單位:沈陽(yáng)大學(xué)