本站小編為你精心準備了數據挖掘的讀者群行為模型研究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
圖書館是高校師生學習與科研的知識平臺,個性化服務是圖書館服務的核心任務,是以讀者群為中心,圍繞讀者群的個性化文獻信息需求展開服務的[1]。為了實現個性化服務,(1)要獲取讀者群的需求信息,建立讀者群行為模型;(2)獲取所在圖書館讀者原始需求信息數據,利用數據挖掘(DataMining)技術,提取隱含在其中的,事先不知道的但又潛在的有用的信息和知識,對相關的資源進行分析處理,幫助圖書館決策者更好地了解讀者的閱讀興趣需求,合理地指導資源配置,為優質個性化服務提供有效的決策依據;(3)針對讀者需求,利用各種現代化關鍵技術將相關的資源主動推送給讀者,滿足讀者的需求,有效地提高資源的利用率,提高圖書館服務水平。
1高校圖書館讀者群行為分析
高校圖書館每天均有讀者借閱圖書種類統計、借閱圖書冊數統計、電子資源訪問量統計、借閱者到館統計等大量數據產生,目前大多數圖書館只是將這些數據用作常規的工作量統計,無法對讀者行為進行分析預測,并以此判斷讀者對文獻信息資源的個性化需求。將數據挖掘技術應用在圖書館海量、無序的讀者行為數據挖掘中,發現不同種類數據之間的相似度、相異度及關聯度,確定讀者群的借閱行為趨勢和個性偏好。
1.1數據樣本的選擇從某圖書館清大新洋系統中選擇抽取了2014年11月份讀者群借閱的數據,以圖表的形式展現見表1。表1中,圖書館讀者群包括了在校教師、博士生、碩士研究生、本科生、自考生、專科生、勤工助學學生、圖書館青年志愿者(本科生)及行政管理教職工等9個類型;借閱的圖書是按《中圖分類法》分成的22個大類。表1顯示了2014年11月份,每一類讀者群借閱每一類別圖書的冊數。
1.2讀者群借閱數據分析
1.2.1本科生讀者群借閱行為模型將表1中本科生讀者群建立借閱行為模型(見附圖),根據本科生讀者群借閱的不同類型圖書的數據,分析讀者群的行為,通過數據挖掘的應用,為學科建設及圖書館紙質文獻資源建設提供決策依據。某校教學以本科教學為主,以研究生及其它層次教學為輔,是以農業科學為特色,農、工、文、理、經、管、法、醫、教、藝術多學科綜合發展的教學研究型大學。從借閱的數據看來,某校的本科生讀者群11月份借閱總冊數為49706冊,是9類讀者群中借閱量最大的,說明本科生讀者群是某校圖書館的主要讀者群。從借閱類型來看,本科生借閱量最大的是H類(語言文字類)的書,這與某校四、六級考試過關率高是相吻合的;其次T類(工業技術類)的圖書借閱量大,這與某校的信息技術教育質量好及計算機過級率高是相吻合的;第三就是文史類、心理學類、經濟學類圖書館比較受本科學生青睞;第四農學、生物學等專業圖書流通量較大;數學等類的基礎教育類圖書借閱量大,這與某校被選入國家“中西部高校基礎能力建設工程”,重視基礎教育是相一致。在表一中,可以看到思想政治類、教育類等其他圖書借閱量不大,而某在校“十二五”期間,提出了以培養“厚基礎、寬口徑、強能力、高素質”的應用型人才和復合型人才為目標,要推進“基礎教育+專業教育+素質拓展教育”的實施,完善大學生思想政治教育“123456”工程,不斷提高大學生思想政治教育水平。因此,圖書館要配合學校實現培養目標,促使本科生讀者群提高思想政治教育水平,還要在思想政治類文獻資源建設、宣傳和推介等方面下功夫。
1.2.2讀者群相似度分析在數據挖掘中,聚類分析是一個活躍的研究領域,其應用也相當廣泛。在圖書館個性化服務中亦可應用到。研究讀者群的相似度可以為圖書館文獻資源建設和利用提供決策依據。現抽取一線教師讀者群(T1),行政管理教職工讀者群(T2)、博士生群體(D)、碩士生群體(M)、普通全日制本科生群體(B1)與自考生本科生群體(B2)四個讀者群的數據進行相似度分析對比。采用度量的方式是距離,數據為每個群體的借書種類集合。群體相異度計算系數定義如下的距離公式。則相似度的計算為S=1-d(O1,O2)。其中,O1,O2為兩個讀者對象群,X1,X2分別為兩個對象群有借書種類集合,根據相似度計算公式得到表2的讀者群的相似計算矩陣。從這個模型可以看出:(1)T1與T2的借閱相似度小,T1因工作需要,所借閱的B類(哲學宗教類)、D類(政治法律類)、H類(語言文字類)、I類(文學類)、K類(歷史地理類)、F類(經濟類)、S類(農業科學)、Q類(生物科學類和T類(工業技術類)較多,而T2借閱圖書的總量相對比較少,所借閱的書以K類(歷史地理類)、I類(文學類)及R(醫學類)的圖書為主;(2)T1與D的借閱相似度也不大,借閱量小,說明某校的博士生讀者群受教師指導不夠,以自學為主的同時也說明圖書館適合這個讀者層閱讀的紙本文獻資源不足,要加大資金投入力度;T1與M的相似度達0.79,說明這兩個讀者群共同的閱讀偏好相似度高,可以根據其閱讀興趣特點做好相同類別的圖書文獻資源準備和資源推介工作,T1與B1、B2的閱讀相似度高達0.83、0.85,因為需求量大,對相似度高的圖書類別增加種類和復本的采購,同時還要加強對這些類別的圖書的宣傳和推介,以保持他們的忠誠度。
1.2.3讀者群與借閱圖書分析依據表1和表2,將讀者群的屬性分為T1、T2、D、M、B1、B2;將所借閱讀書種類排名TOP10的圖書類別,即:H、I、T、B、F、K、O、J、Q、S類的數據置于表3,建立讀者借閱模型。讀者群與借閱圖書模型,要說明的是讀者群與所借閱圖書的關系。從表3中,可以看出以下幾個方面的問題。(1)一線教師讀者群(T1)以借閱I、B、F、S、Q等類別的圖書比較多,這說明一線教師讀者群專注人文、心理學、專業知識的學習,但總體對紙本圖書的利用率是比較低的,從電子資源利用調查研究可以知道教師讀者群利用電子資源較多。行政管理教職工讀者群(T2)紙本圖書借閱量小,其中文學、醫學類的圖書借閱量稍有一點,說明個人的學習偏好重在人文和養生;(2)某校的博士生讀者群所借閱的圖書量特別少,而且與T1的關聯性不大,其中H、S、Q等類的書相對多一些,無I、K類,說明某校博士生讀者群在校人數少,在職人數多;而圖書館適合博士生的專業圖書和外文圖書不足;博士讀者群利用電子文獻資源及所在院系的專業文獻資源更多一些,更主要的是博士讀者群要加強人文教育;(3)某校目前碩士研究生讀者群有4285人,M所借閱的F、B、H、T等類別圖書較多,與T1關聯度大,與B1、B2相似度高。說明某校在研究生培養方法,延用了本科生的培養方法,還有待提高和改進;(4)普通全日制本科生讀者群目前辦證人數達26073人(含獨立學院學生8125人),他們的閱讀范圍廣,涵蓋了某校開設的所有專業和課程,他們所需求的文獻信息主要是學科基礎知識、教輔圖書、專業拓展圖書、考試用書等,與T1的關聯性大,說明B1是在T1的指導下進行學習的;(5)B2(自考生讀者群)的借閱圖書類型與T1的關聯性大,與B1、M相似度也非常高,說明自考生讀者群所需文獻資源B1、M比較接近,某校的研究生生源有很大一部分來自考生讀者群,且會在很多時候沿用本科的學習方法。圖書館在為這部分讀者做好資源準備和服務的同時還可以推介一些好的學習方法。
2結語
通過對五類讀者群的借閱數據分析,從借閱行為模型來看,一線教師與行政管理教師相似度不大,本科生、自考生與研究生的相似度很大,這有助于圖書館對不同的讀者群進行個性化服務,提高圖書館的服務質量。
作者:李煦 戴小鵬 黃堯 胡秀琴 單位:湖南農業大學圖書館 湖南農業大學信息科學技術學院