本站小編為你精心準(zhǔn)備了數(shù)據(jù)科學(xué)及期刊編輯學(xué)參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
數(shù)據(jù)科學(xué)于20世紀(jì)60年代被提出,定義為處理數(shù)據(jù)的科學(xué)[2],但當(dāng)時(shí)并沒有引起人們的關(guān)注,直到最近流行一個(gè)新名詞——數(shù)據(jù)科學(xué)家之后,數(shù)據(jù)科學(xué)才真正成為一門新興的學(xué)科。現(xiàn)在它之所以熱門,主要是因?yàn)閿?shù)據(jù)的廣泛性和多樣性以及數(shù)據(jù)研究的共性。當(dāng)今社會(huì)的各行各業(yè)都會(huì)產(chǎn)生各種分析數(shù)據(jù),一方面這些數(shù)據(jù)類型繁多,不僅包括傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),也包含非結(jié)構(gòu)化數(shù)據(jù),如網(wǎng)頁(yè)、文本、圖像、語(yǔ)音、視頻等;另一方面,社會(huì)的復(fù)雜性決定了行業(yè)的決策必須依賴于繁多復(fù)雜的數(shù)據(jù)。各行各業(yè)對(duì)數(shù)據(jù)的大量需求,使得數(shù)據(jù)科學(xué)受到社會(huì)的廣泛關(guān)注。期刊編輯學(xué)中的期刊數(shù)據(jù)庫(kù)使用的是數(shù)據(jù)科學(xué)的可視化數(shù)據(jù),相關(guān)的信息論方法和期刊影響力指標(biāo)定量分析體系都依賴于數(shù)據(jù)分析技術(shù),這是期刊界數(shù)據(jù)科學(xué)的核心內(nèi)容之一。
(一)數(shù)據(jù)科學(xué)及其特征
與數(shù)據(jù)科學(xué)密切相關(guān)的一個(gè)概念是數(shù)據(jù)科學(xué)家。數(shù)據(jù)科學(xué)家通常是指用統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)、分布式處理等技術(shù),從大量數(shù)據(jù)中提取對(duì)業(yè)務(wù)有意義的信息,以易懂的形式傳達(dá)給決策者,并創(chuàng)造出新的數(shù)據(jù)運(yùn)用服務(wù)的人才[3]。數(shù)據(jù)科學(xué)其實(shí)是一個(gè)理、工、文綜合的新興交叉學(xué)科,主要研究?jī)?nèi)容包括用數(shù)據(jù)的方法研究科學(xué)和用科學(xué)的方法研究數(shù)據(jù)兩個(gè)方面。用數(shù)據(jù)的方法研究科學(xué),涵蓋生物信息學(xué)、天體信息學(xué)、數(shù)字地球、數(shù)據(jù)可視化等學(xué)科;用科學(xué)的方法研究數(shù)據(jù),涉及統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、數(shù)據(jù)庫(kù)等技術(shù)手段。這些內(nèi)容都是數(shù)據(jù)科學(xué)的重要組成部分,涉及多個(gè)學(xué)科,但只有把它們有機(jī)地整合在一起,才能形成整個(gè)數(shù)據(jù)科學(xué)的全貌[4]。數(shù)據(jù)科學(xué)的第一特征是通過數(shù)據(jù)的方法研究科學(xué)。例如,開普勒根據(jù)天文學(xué)家第谷的大量觀察數(shù)據(jù),總結(jié)出了關(guān)于行星運(yùn)動(dòng)的三個(gè)定律。數(shù)據(jù)科學(xué)的第二特征是用科學(xué)的方法研究數(shù)據(jù)。即通過數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析等研究數(shù)據(jù),首先確定具體的目標(biāo)函數(shù)以及研究的主要目標(biāo)或要達(dá)到的效果,然后分析影響目標(biāo)函數(shù)的主要因素及其表現(xiàn)形式,如表格、點(diǎn)集、時(shí)間序列、圖像、視頻、網(wǎng)絡(luò)數(shù)據(jù)、隨機(jī)噪聲數(shù)據(jù)等,最后再使用已有的科學(xué)方法或理論研究。數(shù)據(jù)科學(xué)的第三特征是數(shù)據(jù)分析。數(shù)據(jù)分析非常難實(shí)現(xiàn),主要是因?yàn)椋?1)數(shù)據(jù)量龐大。數(shù)據(jù)量大帶來的挑戰(zhàn)是計(jì)算問題,因此一些隨機(jī)計(jì)算和分布式計(jì)算方法就顯得尤為重要。(2)數(shù)據(jù)維數(shù)高。維數(shù)高給人們帶來的是維數(shù)災(zāi)難,即模型的復(fù)雜度和計(jì)算量隨著維數(shù)的增加而指數(shù)增長(zhǎng)。(3)數(shù)據(jù)類型復(fù)雜。數(shù)據(jù)可以是網(wǎng)頁(yè)或報(bào)紙,也可以是圖像、視頻,多種類型的數(shù)據(jù)給數(shù)據(jù)融合帶來了困難。(4)噪音大。數(shù)據(jù)在生成、采集、傳輸和處理等流程中,均可能被噪音干擾,這些噪音的存在給數(shù)據(jù)的清洗和分析帶來挑戰(zhàn)。此外,數(shù)據(jù)科學(xué)還有大數(shù)據(jù)的價(jià)值特征。在數(shù)據(jù)爆炸的時(shí)代,大數(shù)據(jù)的廣泛應(yīng)用激起了全世界人們的興趣,具有巨大的價(jià)值前景。
(二)數(shù)據(jù)科學(xué)廣泛的社會(huì)應(yīng)用
隨著信息化時(shí)代數(shù)據(jù)科學(xué)的資源性特點(diǎn)逐漸顯露,數(shù)據(jù)科學(xué)在社會(huì)生活中的作用越來越大,“用數(shù)據(jù)說話”已成為人們進(jìn)行科學(xué)研究、管理社會(huì)、認(rèn)識(shí)世界的一種新方法。信息化時(shí)代,數(shù)據(jù)成為自然和社會(huì)生活的一種表現(xiàn)形式,目前大數(shù)據(jù)研究已經(jīng)觸及政治、經(jīng)濟(jì)、文化、教育、科技等社會(huì)領(lǐng)域,人們已習(xí)慣用數(shù)據(jù)記錄工作、生活、社會(huì)發(fā)展等行為信息。現(xiàn)實(shí)世界中的事物和現(xiàn)象被以數(shù)據(jù)的形式存儲(chǔ)到計(jì)算機(jī)中,這些數(shù)據(jù)被快速、大量地生產(chǎn)和再存儲(chǔ)。可以說,信息和數(shù)據(jù)的傳播速度和范圍呈現(xiàn)出難以遏制的發(fā)展趨勢(shì)。“數(shù)據(jù)被認(rèn)為是一種與能源和材料相提并論的資源,其所蘊(yùn)含的價(jià)值難以估量”[5]33,成為一種重要的戰(zhàn)略資源。正如礦產(chǎn)資源需要挖掘、提煉加工后才能變成黃金、鉆石和石油,龐大的數(shù)據(jù)也需要通過大數(shù)據(jù)技術(shù)進(jìn)行知識(shí)挖掘,才能實(shí)現(xiàn)其價(jià)值[6]。
(三)數(shù)據(jù)科學(xué)與期刊編輯學(xué)
數(shù)據(jù)科學(xué)的信息技術(shù)給人們的社會(huì)生活和感知世界帶來了巨大的便利,互聯(lián)網(wǎng)、App新聞客戶端、微博、微信等新媒體形態(tài)都以數(shù)據(jù)的基礎(chǔ)信息作為技術(shù)支撐,改變了人們對(duì)信息的接收方式和習(xí)慣[7]5。期刊編輯學(xué)作為一門具有廣泛社會(huì)性的學(xué)科,其發(fā)展與社會(huì)科學(xué)、自然科學(xué)有著千絲萬縷的聯(lián)系,所以,它的發(fā)展離不開對(duì)數(shù)據(jù)科學(xué)相關(guān)方法的借鑒和吸收。盡管數(shù)據(jù)科學(xué)和期刊編輯學(xué)之間的關(guān)系這一概念沒有被正式地提出,但實(shí)際上它們之間的密切關(guān)系在數(shù)據(jù)科學(xué)這門學(xué)科出現(xiàn)之前就已經(jīng)存在。期刊編輯學(xué)中重要的載體——期刊或期刊數(shù)據(jù)庫(kù),都是數(shù)據(jù)科學(xué)中數(shù)據(jù)的重要表現(xiàn)形式,同時(shí),期刊編輯學(xué)的期刊可視化數(shù)據(jù)庫(kù)的研究方法和信息計(jì)量學(xué)研究方法也為數(shù)據(jù)科學(xué)提供了重要的方法論研究技術(shù)。目前,中國(guó)科學(xué)文獻(xiàn)計(jì)量評(píng)價(jià)研究中心及清華大學(xué)圖書館研制的“中國(guó)學(xué)術(shù)期刊影響因子年報(bào)”,中國(guó)人民大學(xué)人文社會(huì)科學(xué)學(xué)術(shù)成果評(píng)價(jià)研究中心及中國(guó)人民大學(xué)書報(bào)資料中心研發(fā)的“復(fù)印報(bào)刊資料轉(zhuǎn)載指數(shù)排名研究報(bào)告”,南京大學(xué)中國(guó)社會(huì)科學(xué)評(píng)價(jià)中心開發(fā)研制的引文數(shù)據(jù)庫(kù)“中文社會(huì)科學(xué)引文索引(CSSCI)”(用于檢索中文社會(huì)科學(xué)領(lǐng)域的論文收錄和被引用情況)等,對(duì)國(guó)內(nèi)期刊進(jìn)行質(zhì)量評(píng)價(jià)所采用的重要工具就是期刊文獻(xiàn)計(jì)量學(xué)。其核心就是對(duì)所采集的大量數(shù)據(jù)進(jìn)行有目的的分析,建立期刊影響力定量綜合評(píng)價(jià)指標(biāo)——期刊影響力指數(shù)。譬如,相關(guān)學(xué)者利用CSSCI數(shù)據(jù)庫(kù),在學(xué)術(shù)研究、期刊測(cè)評(píng)、機(jī)構(gòu)評(píng)估等領(lǐng)域?qū)ξ覈?guó)人文社會(huì)科學(xué)的發(fā)展水平和影響力現(xiàn)狀進(jìn)行了廣泛、深入的研究,利用CSSCI的數(shù)據(jù)挖掘技術(shù),充分發(fā)揮了學(xué)術(shù)數(shù)據(jù)的應(yīng)用價(jià)值,為學(xué)術(shù)研究和學(xué)術(shù)創(chuàng)新提供了更好的數(shù)據(jù)支撐。因此,期刊影響力指標(biāo)需要借用統(tǒng)計(jì)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行定量分析,這是數(shù)據(jù)科學(xué)的研究?jī)?nèi)容,也是數(shù)據(jù)科學(xué)如何科學(xué)評(píng)價(jià)的關(guān)鍵所在。這就要求在信息化時(shí)代的發(fā)展背景下,期刊編輯應(yīng)該具備一定的數(shù)據(jù)素養(yǎng),以便從宏觀上分析和把握期刊的發(fā)展趨勢(shì)。