本站小編為你精心準(zhǔn)備了數(shù)據(jù)挖掘技術(shù)在圖書館中的應(yīng)用參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
【摘要】
隨著信息技術(shù)的不斷發(fā)展,高校圖書館的規(guī)模和圖書數(shù)量逐步增加,對圖書管理工作提出了更大的考驗(yàn)。圖書館管理系統(tǒng)的數(shù)據(jù)存儲量呈現(xiàn)指數(shù)增長趨勢,原來的傳統(tǒng)人工統(tǒng)計(jì)方法不能全面、準(zhǔn)確、高效的應(yīng)對如此大量的數(shù)據(jù)分析狀況,如何根據(jù)自身需求合理的提取需要的信息資源并進(jìn)行充分的利用成為當(dāng)代圖書館人面臨的挑戰(zhàn)。采用數(shù)據(jù)挖掘技術(shù)可以很方便的解決上述問題,但也存在機(jī)遇和挑戰(zhàn)。本文從數(shù)據(jù)挖掘概念本身出發(fā),了解數(shù)據(jù)挖掘步驟,將其應(yīng)用于高校圖書館,為讀者提供個(gè)性化推介服務(wù)。
【關(guān)鍵詞】
圖書館管理系統(tǒng);數(shù)據(jù)挖掘;個(gè)性化推介服務(wù)
1.引言
高校圖書館作為高校師生獲取教學(xué)知識和科研活動的重要場所,一直以來是以館藏圖書為主的服務(wù)模式,主要工作性質(zhì)就是對圖書的借還處理。現(xiàn)如今的很多圖書館管理系統(tǒng)對館內(nèi)的數(shù)據(jù)分析處理僅限于對數(shù)據(jù)表面的統(tǒng)計(jì)、記錄查詢等一些簡單的操作,對存儲的數(shù)據(jù)本身沒有進(jìn)行深層次、潛在的挖掘、分析利用。因此,如何科學(xué)、合理、有效的提取這些數(shù)據(jù)資源,更加便捷的為師生提供優(yōu)質(zhì)服務(wù)、人性化服務(wù)、智能化服務(wù);充分發(fā)揮圖書館的資源優(yōu)勢,拓寬圖書館的工作職能,用先進(jìn)的管理理念指導(dǎo)圖書館的管理工作,進(jìn)而更好的發(fā)揮圖書館資源作用,提高高校圖書館的服務(wù)效率,成為圖書管理者和決策者面臨的新問題[1]。數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,恰好可以解決這一問題。
2.數(shù)據(jù)挖掘的簡述
2.1數(shù)據(jù)挖掘的概念所謂的數(shù)據(jù)挖掘技術(shù),就是將存儲在數(shù)據(jù)庫中的大量數(shù)據(jù)信息進(jìn)行整理、提取,挖掘出有利于人們使用的一種數(shù)據(jù)處理技術(shù)。其對數(shù)據(jù)處理包括以下幾個(gè)步驟:
2.1.1首先需要確定分析對象;在對需要的數(shù)據(jù)進(jìn)行挖掘時(shí),首先要進(jìn)行對象的確立,即就是挖掘?qū)ο笫鞘裁匆_(dá)到什么樣的目標(biāo)。
2.1.2對需要挖掘的數(shù)據(jù)對象進(jìn)行了解,有所準(zhǔn)備;在進(jìn)行挖掘數(shù)據(jù)前,需要對數(shù)據(jù)對象有個(gè)了解,知道數(shù)據(jù)來源于哪里,如何針對數(shù)據(jù)特點(diǎn)采取不同的數(shù)據(jù)挖掘方式會得到更加有利的數(shù)據(jù)結(jié)果。雖然前期的準(zhǔn)備工作需要時(shí)間很長,但是它的作用卻是不可磨滅的。
2.1.3數(shù)據(jù)探索過程;在進(jìn)行數(shù)據(jù)挖掘過程時(shí),可以對某些有意義的數(shù)據(jù)進(jìn)行深度探索,掌握數(shù)據(jù)規(guī)律,對某些數(shù)據(jù)信息進(jìn)行簡單的預(yù)測,便于指導(dǎo)性的引導(dǎo)實(shí)際工作的實(shí)施。
2.1.4建模與應(yīng)用過程;在建模過程中,可以結(jié)合數(shù)據(jù)本身特點(diǎn),選取合適的數(shù)據(jù)挖掘技術(shù),建立數(shù)據(jù)基礎(chǔ),后期采用適當(dāng)?shù)姆椒▽ν诰驍?shù)據(jù)進(jìn)行計(jì)算和驗(yàn)證,檢驗(yàn)后確定可以使用,便可以進(jìn)行相關(guān)的數(shù)據(jù)決策,便于后期投入使用。
2.2數(shù)據(jù)挖掘的意義
現(xiàn)如今,隨著網(wǎng)絡(luò)技術(shù),信息技術(shù)的不斷發(fā)展,高校圖書館規(guī)模的擴(kuò)大,藏書量的不斷擴(kuò)大,管理系統(tǒng)中數(shù)據(jù)量也呈增長趨勢,對數(shù)據(jù)的有效處理使得圖書館的服務(wù)質(zhì)量更優(yōu),因此數(shù)據(jù)挖掘顯得尤為重要。
2.2.1數(shù)據(jù)挖掘可以提高圖書館的決策能力。目前,數(shù)據(jù)挖掘技術(shù)被廣泛應(yīng)用于高校圖書館的管理工作中,領(lǐng)導(dǎo)可以通過挖掘出來的有用數(shù)據(jù)信息進(jìn)行分析研究,提高了自身的決策準(zhǔn)確性和實(shí)施性。比如,采用數(shù)據(jù)挖掘技術(shù)對圖書館的圖書借閱情況進(jìn)行分析,可以對讀者的讀書喜好和行為提取,發(fā)現(xiàn)讀者借閱規(guī)律,便于指導(dǎo)圖書館下一步工作,為圖書館的管理工作提出了可行性的依據(jù)[2]。數(shù)據(jù)挖掘技術(shù)可以將圖書館管理系統(tǒng)中的內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)結(jié)合起來進(jìn)行分析,為領(lǐng)導(dǎo)提供靈活的、隨時(shí)可用的決策信息。數(shù)據(jù)挖掘技術(shù)可以從歷史數(shù)據(jù)中找出某種規(guī)律,發(fā)現(xiàn)某種潛在的模式,以此預(yù)測未來,提供決策信息[3]。
2.2.2可以對采購工作提供指導(dǎo)性輔助。通過數(shù)據(jù)挖掘得到的分析結(jié)果,可以對圖書館進(jìn)一步采購圖書進(jìn)行預(yù)測和分析,更加科學(xué)合理的指導(dǎo)采購圖書行為,大大的降低了采購圖書人員由于主觀因素采購圖書帶來的影響,提高了圖書館的決策能力。
2.2.3個(gè)性化服務(wù)建設(shè)。在高校中根據(jù)不同讀者個(gè)體的閱讀需求,采用不同的服務(wù)標(biāo)準(zhǔn),這樣不僅可以提升高校圖書館面向讀者服務(wù)的質(zhì)量,也可以增加讀者的閱讀興趣,促進(jìn)讀者的自主與綜合學(xué)習(xí)。
3.數(shù)據(jù)挖掘在高校圖書館管理系統(tǒng)中的應(yīng)用
現(xiàn)階段,高校圖書館采用多種管理系統(tǒng)維護(hù)圖書館的日常管理,有北郵系統(tǒng)、銀博等。讀者作為高校圖書館的服務(wù)主體,在高校圖書館的日常管理工作中起著重要作用。高校的圖書館管理系統(tǒng)中包含流通子系統(tǒng)、編目子系統(tǒng)、典藏子系統(tǒng)、采訪子系統(tǒng)等,這些系統(tǒng)中涵蓋大量的數(shù)據(jù)信息,可采用采集器將其中的相關(guān)數(shù)據(jù)信息抽取出來,經(jīng)過過濾、整理后存放在系統(tǒng)的數(shù)據(jù)倉庫中。這里的數(shù)據(jù)倉庫是指在對原有系統(tǒng)不構(gòu)成影響的前提下,對已有的數(shù)據(jù)信息資源進(jìn)行抽取、綜合、集成及挖掘等操作過程,再利用數(shù)據(jù)挖掘技術(shù)對存有的數(shù)據(jù)信息資源進(jìn)行深層次的整理和分析,找尋數(shù)據(jù)之間的關(guān)聯(lián)性和相關(guān)性,并采用圖形化的界面予以輸出,便于對圖書館的管理工作進(jìn)行科學(xué)合理化的指導(dǎo)。具體的操作過程如下:
3.1數(shù)據(jù)收集模塊;數(shù)挖掘技術(shù)的數(shù)據(jù)其主要來源是圖書館管理系統(tǒng),其主要對這些方面數(shù)據(jù)進(jìn)行了抽取并整理。
3.2數(shù)據(jù)挖掘模塊;數(shù)據(jù)挖掘主要是發(fā)現(xiàn)原始數(shù)據(jù)當(dāng)中所隱含的信息,將讀者的借閱規(guī)律進(jìn)行掌握并能對讀者的需求進(jìn)行預(yù)測,這是高校圖書館實(shí)現(xiàn)主動化服務(wù)的基礎(chǔ)。系統(tǒng)主要利用數(shù)據(jù)采集器將數(shù)據(jù)源當(dāng)中的數(shù)據(jù)傳送到數(shù)據(jù)倉庫,然后利用數(shù)據(jù)挖掘系統(tǒng)進(jìn)行了處理,最后得到很多有助于決策的信息及知識。
3.3讀者信息分析;在數(shù)據(jù)倉庫建立以后,若想要充分利用數(shù)據(jù)倉庫中的數(shù)據(jù)資源,就需要有特定的工具能夠分析數(shù)據(jù)倉庫中的數(shù)據(jù)[4]。近些年來,在數(shù)字化圖書館信息資源的個(gè)性化的推介中,數(shù)據(jù)挖掘技術(shù)已經(jīng)得到了廣泛的應(yīng)用,并取得了很大程度的進(jìn)展和突破。面對高校圖書館對讀者所提供的個(gè)性化服務(wù),數(shù)據(jù)挖掘技術(shù)同樣起著至關(guān)重要的作用。在實(shí)際的讀者服務(wù)過程中,數(shù)據(jù)挖掘技術(shù)主要用在高校額圖書館個(gè)性化推介服務(wù)的隱式反饋過程中,即就是:根據(jù)實(shí)際存儲的數(shù)據(jù)信息資源,利用數(shù)據(jù)挖掘算法,在如此龐大的數(shù)據(jù)中找到隱含的有價(jià)值的數(shù)據(jù)信息,幫助館際指導(dǎo)讀者信息模式,利于館內(nèi)領(lǐng)導(dǎo)實(shí)現(xiàn)決策管理,最終實(shí)現(xiàn)對讀者用戶提供個(gè)性化的推介服務(wù)。數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則可以對讀者對哪些書感興趣,以及被借閱時(shí)同時(shí)被借閱,發(fā)現(xiàn)讀者行為中隱含的潛在關(guān)聯(lián)關(guān)系,這樣可以有效的指導(dǎo)圖書館館員行為,利于圖書的有利擺放位置,為讀者提供更加可供選擇的優(yōu)質(zhì)推介化服務(wù)推薦。
4.數(shù)據(jù)挖掘在高校圖書館中面臨的挑戰(zhàn)
縱觀數(shù)據(jù)挖掘技術(shù)在高校圖書館中所發(fā)揮的作用,雖說可以解決很多目前管理系統(tǒng)所不能解決的問題,但從數(shù)據(jù)挖掘技術(shù)本身來講,還存在著一定程度的主客觀因素,從高校圖書館數(shù)據(jù)信息資源長遠(yuǎn)話發(fā)展的角度來說,既要看到數(shù)據(jù)信息資源所帶來的機(jī)遇,也要看到數(shù)據(jù)信息資源發(fā)展所帶來的挑戰(zhàn)和產(chǎn)生的新問題。經(jīng)過對現(xiàn)有的高校圖書館數(shù)據(jù)信息資源的深層次分析了解,得出其在未來發(fā)展過程中面對的挑戰(zhàn):
4.1如何從異構(gòu)數(shù)據(jù)源中挖掘到信息;異構(gòu)數(shù)據(jù)源指的是來自多個(gè)不同的相關(guān)數(shù)據(jù)源,如何從中獲取到有用的信息資源并綜合分析,最終得到有用的信息資源,這并非易事。加之,當(dāng)今信息時(shí)代,各種資源信息層數(shù)不窮,更新?lián)Q代很快,這就對高校圖書館的技術(shù)人員提出了更高的要求。
4.2如何對數(shù)據(jù)挖掘結(jié)果進(jìn)行合理表示;雖說可以對高校圖書館的數(shù)據(jù)信息資源進(jìn)行挖掘,但是挖掘得到的結(jié)果卻帶有不可確定性因素,挖掘結(jié)果種類繁多,表述也不相同。這就對高校圖書館從業(yè)人員對挖掘結(jié)果有個(gè)更深刻、不同角度的研究與審視,從這些不同中得到不同形式的挖掘結(jié)果。4.3如何從不同的層面上對數(shù)據(jù)信息資源進(jìn)行交互式的挖掘;首先要明白自己想要得到何種數(shù)據(jù)挖掘目標(biāo)。當(dāng)然,對于大量的數(shù)據(jù)信息資源,在進(jìn)行數(shù)據(jù)挖掘之前,也很難得知究竟挖掘出來的是什么樣的信息資源。所以可以將此過程認(rèn)為是一種信息資源的復(fù)雜查詢過程,對于查詢過程中有用的環(huán)節(jié)定要保留,以備進(jìn)一步為數(shù)據(jù)挖掘提供依據(jù)。在數(shù)據(jù)挖掘過程中,可以不斷的對搜索查詢條件進(jìn)行時(shí)時(shí)地、動態(tài)地調(diào)整,促進(jìn)數(shù)據(jù)挖掘過程的最終化推進(jìn)。在此過程中,對中間過程需要挖掘者以不同的角度進(jìn)行審視,并時(shí)時(shí)觀察數(shù)據(jù)挖掘過程中的數(shù)據(jù)靈活性變動,有效指導(dǎo)挖掘結(jié)果。
5總結(jié)
綜上所述,本文從數(shù)據(jù)挖掘技術(shù)概念入手,分析其挖掘數(shù)據(jù)步驟及其意義,為在高校圖書館管理工作中的應(yīng)用提供理論依據(jù),最后分析其所面臨的機(jī)遇與挑戰(zhàn),為正確指導(dǎo)讀者行為提供可靠依據(jù)。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,圖書館管理系統(tǒng)廣泛應(yīng)用于高校圖書館,館內(nèi)各種數(shù)目原始數(shù)據(jù)不斷積累,數(shù)字校園口號的不斷普及,產(chǎn)生的眾多數(shù)據(jù)信息資源,為數(shù)據(jù)挖掘技術(shù)奠定基礎(chǔ)。
參考文獻(xiàn):
[1]李玉海,余玲,胡偉雄.數(shù)字圖書館中的網(wǎng)絡(luò)層次結(jié)構(gòu)分析[J].情報(bào)理論與實(shí)踐,2007,(02):256-288.
[2]張煒,洪霞.基于讀者利用挖掘的圖書館決策與應(yīng)用分析[J].現(xiàn)代情報(bào),2009,29(7).
[3]羅仕健,朱光磊.數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)環(huán)境下圖書館中的應(yīng)用[J].情報(bào)雜志,2004(6).
[4]陳建軍.數(shù)據(jù)挖掘技術(shù)在高校圖書館管理工作中的應(yīng)用[J].信息與電腦,2013(7).
作者:晁陽 單位:陜西學(xué)前師范學(xué)院圖書館