本站小編為你精心準備了借閱數據的圖書推薦研究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
【摘要】本文以哈爾濱商業大學圖書館為例,通過對圖書管理系統借閱數據進行聚類分析,揭示讀者群體的需求結構,了解其文獻利用情況,歸納其用戶偏好模型,以提高推薦策略的準確度,有針對性地為讀者提供個性化服務。
【關鍵詞】數據處理;聚類分析;讀者群;個性推薦
隨著數字化信息量的成倍增長,圖書館服務質量也受到影響。讀者面對海量的信息,需要花費更多時間找到自己真正所需。怎樣高效、迅速、主動地為讀者提供其所需信息,已成為當今圖書館建設過程中亟待解決的問題。數字圖書館的個性化推薦是通過主動服務的方式,根據讀者的不同需求,有針對性地提供服務,使讀者能夠快速、準確地發現自己所需要的圖書[1]。它主要通過跟蹤和分析讀者的行為記錄,建立讀者的借閱偏好模型,并區分讀者群,有針對性地進行書籍推薦,這樣既能幫助讀者快速、準確地找到所需信息,同時也提高了圖書館的館藏利用率,增加了讀者對圖書館的滿意度[2]。
1研究方法
1.1數據預處理在進行數據挖掘之前,需要對原始數據進行預處理,對數據進行清洗,把數據中不正確的、不完整的、不一致的、格式不同的進行處理,處理成為標準的數據結構和格式,如圖1為原始數據需要做預處理的流程[3]。數據預處理是構建數據倉庫的第一步,在數據挖掘過程中是非常重要的步驟。它可以改進數據質量,有效提高數據挖掘的精準度。
1.2聚類分析方法聚類分析主要是根據讀者的共同偏好劃分讀者群,清晰掌握讀者群體的信息需求,把資源進行合理優化。利用讀者群,能夠更好地為讀者開展個性化推薦服務;根據讀者群可以很好地了解讀者對信息資源利用狀況的活躍度,為圖書館信息資源的宣傳與培訓提供依據[4-5]。讀者群聚類可以分別基于圖書類型和圖書借閱頻次進行[6]。基于借閱圖書類型聚類是從讀者需求角度進行細分,基于借閱頻次聚類是從讀者活躍度的角度來實現讀者細分。
2實例分析
本文樣本是哈爾濱商業大學圖書館借閱數據,包含讀者數據、圖書數據、借閱情況等,是反映讀者信息的重要依據。
2.1讀者數據預處理讀者數據包含姓名、年級、院系、專業等屬性,這些屬性是對讀者劃分的重要依據,可以將讀者區分為不同群體。
2.2聚類分析我們把讀者信息數據和借閱信息數據作為對象,利用上面模型進行讀者聚類分析。經統計,哈爾濱商業大學圖書館從2016年3月到2017年3月借閱人次13686,提取原始借閱記錄248491條,有效讀者29842人。圖書館圖書管理系統數據庫為ORACLE,依據聚類分析流程圖,將預處理后的數據轉換為標準數據結構,然后利用SPSSClementine平臺進行聚類分析[9]。
2.3圖書推薦可以清楚地看出每類書籍的熱門排行。依據聚類分析結果,每位讀者的類屬關系和興趣,進行相應圖書的批量推薦。
3結論
隨著信息量的劇增,為了給讀者提供更加精確的個性化推送服務,本文以圖書管理系統數據為研究目標,利用聚類的方法對讀者群體進行劃分;建立用戶偏好模型,根據數據庫中讀者的借閱、續借和歸還等操作行為所產生的記錄,對這些記錄信息進行綜合分析,了解讀者的圖書借閱喜好,建立不同的讀者群,按照興趣度,根據各類圖書排名進行相應的圖書推薦。通過聚類分析結果,哈爾濱商業大學的讀者群體以文學類、社科類、經濟管理類書籍需求量為最大,其中文學類書籍利用率最高。通過此種推薦策略,能夠更好地為讀者提供個性化服務。
參考文獻
[3]柴彥.基于共詞聚類分析方法的知識管理國內研究述評[J].情報科學,2015(4):149-153.
[4]閔超,孫建軍.學科交叉研究熱點聚類分析———以國內圖書情報學和新聞傳播學為例[J].圖書情報工作,2014(1):109-116.
[5]熊海濤.面向復雜數據的推薦分析研究[M].北京:北京理工大學出版社,2015:15-16.
[6]郭秋萍.企業數據挖掘理論與實踐[M].鄭州:黃河水利出版社,2005:54-56.
[7]騰廣青,畢強.基于概念格的數字圖書館用戶市場細分———數字圖書館用戶的概念聚類分析數字圖書館[J].現代圖書情報技術,2010(2):7-11.
[8]朱東郡,等.基于標簽聚類和興趣劃分的協同過濾推薦算法[J].計算機工程,2017(11):146-151,160.
[9]李新廣.數字圖書館的用戶偏好模型及個性化推薦研究[D].武漢:武漢大學,2011.
作者:閆俊霞 單位:哈爾濱商業大學圖書館