本站小編為你精心準備了圖書館生物醫學科研數據管理參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
大數據時代,數據密集型科學研究模式的產生和科研數據管理任務的建立不斷催生科研人員對科研數據管理支持服務的需求[1]。國外圖書館為了應對大數據帶來的機遇和挑戰,紛紛探索科研數據管理服務的方法與模式。2012年,科研數據監管被認為是美國高校圖書館十大發展趨勢之一[2]。國外圖書館界,尤其是學術圖書館正不斷發展支持科研數據管理的基礎設施和服務。不同學科的科研人員對科研數據管理服務的需求存在差異[3-4]。在進行科研數據管理服務之前應考慮學科之間的異同,考慮不同學科、不同課題組科研人員在資金、設備、技術、研究方法、原材料等方面的差異,根據特定學科的特定需求提供一系列有針對性的科研數據管理服務。生物醫學是關系到人類自身健康的重要領域,是生物醫學信息、醫學影像技術、基因芯片、納米技術、新材料等技術的學術研究和創新基地,其科技活動非常活躍,已產生海量數據,并在持續快速增長。一些獨特的科研數據是不可復制的,具有重要的研究價值。如何共享、規范、管理和利用這些海量數據是非常關鍵的。學科館員通常具備相關學科背景和圖書情報的實踐經驗,并且與科研用戶建立了較為密切的聯系和信任關系,能夠深入科研一線,以綜合的視角來研究科研數據的采集、描述、存儲、管理和使用等問題[5]。在當前信息大環境下和已建立的學科化服務成果之上,學科館員進一步深入開展科研數據管理服務已是大勢所趨。筆者結合解放軍醫學圖書館學科化服務對象的學科特性[6],對國外圖書館尤其是醫學圖書館開展科研數據管理支持服務的情況進行了調研,以期建立生物醫學領域科研數據管理支持服務模式,對學科館員參與科研數據管理的實踐發揮指導作用。
1國外圖書館生物醫學科研數據管理服務
在國外,科研數據管理已經成為一種制度。美國國立衛生研究院(NIH)要求申請50萬以上基金項目的科研人員都提交一個數據共享計劃或者數據不共享的說明[7]。該數據計劃包括:數據共享的時間軸、數據集格式、數據分析工具、共享協議、數據共享方式等內容。英國生物技術和生物科學研究理事會(BBSRC)、英國癌癥研究中心和英國醫學研究理事會(MRC)[8]在資助科研項目時都要求研究人員提交數據共享計劃,包括數據領域、類型和格式,標準和元數據,二次使用和數據共享的方法等內容,并為科研人員提供了數據共享計劃模板,包括描述數據、數據收集、數據管理、數據安全、數據共享和責任等。澳大利亞政府、國家健康和醫學研究理事會(NHMRC)和澳大利亞研究理事會(ARC)聯合的澳大利亞誠信科研行為規范[9]中對于研究數據和重要資料的管理提出了明確的要求:研究者有責任保留科研數據,提供安全的數據存儲,對數據進行明確標識,明確數據的擁有者以及確保數據的安全可靠性等。高等教育機構開始嘗試解決如何支持科研數據管理的問題,有的開展科研數據共享和管理的咨詢和培訓服務,有的提供專業的數據服務,包括研究管理和計算機服務等。高校圖書館被認為可以在支持科研數據管理中發揮很大作用。但根據2012年一項關于英國大學圖書館正在從事的研究數據管理服務的調研表明,圖書館當前為研究密集型機構高水平活動所提供的科研數據管理服務還遠遠不夠,在技能、資源和文化上仍存在巨大的挑戰[10]。圖書館正在努力參與開發科研數據管理政策和服務,并將其視為未來角色的重要組成部分之一。本文選取印第安納大學圖書館(IndianaUniversityLibraries)和提供生物醫學科研數據管理服務的圖書館進行調研,參考借鑒其圖書館員為科研人員提供的數據管理支持服務的模式、內容、方法及工具等。
1.1印第安納大學圖書館生命科學數據管理服務印第安納大學圖書館[11]開展了針對生命科學數據的數據管理服務。該圖書館設立了科學數據管理館員(ScienceDataManagementLibrarian)的職位,專職負責科研數據管理服務與聯絡工作,免費為本校科研人員提供科研數據云存儲和存儲介質,或協助科研人員找到能夠滿足需求的第三方數據存儲的解決方案,建立數據管理服務網頁,提供針對生命科學領域數據管理的詳細指南和服務。具體服務內容主要涉及以下四大部分。
1.1.1記錄數據對實驗室記錄,提供針對生命科學實驗室數據記錄獲取的指南,如保持好的實驗室筆記(包括案例和清單)的新手指南,萊斯大學生物化學和細胞生物學保持實驗室記錄的指南,甚至比較了各種油墨后提出的實驗室筆記本選擇建議,還有專業研究人員描述他們如何成功地管理專業筆記的書籍等。對于元數據,提供了生命科學科學數據常用的機讀標準,如DarwinCore的生物多樣性數據標準,生態元數據語言(EML)的生態學數據標準,ISA-Tab的omics-based實驗數據標準以及其他的生命科學數據標準等。
1.1.2撰寫數據資源管理計劃協助制定數據管理計劃,提供了一個采用IU-specific語言編寫的NSF數據管理計劃模板,并且建議使用DMPTool作為計劃撰寫工具,提供關于數據管理的指南,包括數據管理的一般概念(即記錄數據與元數據,如何處理敏感數據等)和鏈接相關資源,以及提供制定數據管理計劃的培訓視頻等。另外,還提供有關科研數據管理計劃的人工咨詢服務,由科學數據管理館員審查核定,確保計劃符合基金的要求。
1.1.3存儲數據和保護資源印第安納大學圖書館提供免費的數據長期保存服務,研究人員能夠獲得50TB的數據存儲空間。印第安納大學科研人員還可以注冊一個研究文件系統(RFS)或學術數據檔案(SDA)賬戶,為進行中和已結束的研究提供獨立的私人存儲數據。它提供的小型開放數據空間,可以上傳150M的文件到IU-ScholarWorks平臺。它提供的私有數據到開放數據的轉換體統,研究人員可以將研究文件系統(RFS)或學術數據檔案(SDA)中的科研數據傳輸到開放數據平臺,供他人訪問下載,實現科研數據共享。此外,印第安納大學圖書館還向科研人員介紹了Biosharing.org和databib.org兩個科研數據網站,主題領域涉及生物科學、生態系統科學、環境科學和健康與醫學科學等。
1.1.4匯集數據管理相關政策提供印第安納大學和科研數據管理相關的研究政策,如在生命科學領域特殊的研究政策,印第安納大學關于人類被試研究的標準操作程序,敏感數據管理指南等。1.2馬薩諸塞大學醫學院圖書館數據管理服務[12]馬薩諸塞大學醫學院與新英格蘭地區的幾所圖書館聯合開發了新英格蘭協作數據管理課程(NEC-DMC)項目。NECDMC課程是科學數據管理最佳實踐的教學工具,適用于健康科學的本科生、研究生以及科研人員。馬薩諸塞大學醫學院圖書館將這套課程上傳至網站上,供科研人員和學生學習。課程的案例來自臨床研究、生物醫學實驗室、工程項目和行為醫學定性研究等科研數據管理的最佳實踐案例。除了MECDMC課程外,馬薩諸塞大學醫學院圖書館還提供生物醫學科研數據管理支持服務,由3名不同專業的圖書館員負責聯系、咨詢及其他服務。服務內容主要包括四個部分。
1.2.1科研數據管理介紹馬薩諸塞大學醫學院圖書館大力強調管理科研數據的重要性、為什么管理數據、良好的數據管理是什么樣的、數據丟失的結果等。
1.2.2管理數據數據引用:向科研人員介紹為什么要引用數據、數據引用規范、引用數據的工具(DOI引文格式化程序),并列出了若干數據引用規范案例。數據倫理:向科研人員指出什么是負責任的研究行為、什么是數據完成性、如何匿名化定量數據和定型數據、去除識別信息的病人數據使用,并且提供了數據倫理案例研究等。文件管理:提供了文件結構和命名模板,數據文件組織建議等。文件儲存和備份:介紹數據存儲介質(個人存儲介質、網絡驅動器、云存儲)和存儲設備,數據存儲、備份和安全的建議及最佳實踐。所有權:介紹了知識產權政策、數據所有權和知識產權相關知識。規劃:提供數據管理計劃政策、程序和指南,數據管理計劃制定工具,以及eScholarship@UMM管理平臺。政策:提供各類數據政策,如基金自助者數據政策、出版商數據政策、期刊數據政策以及馬薩諸塞大學醫學院的數據管理政策。數據保留時長:介紹本地數據保留政策、數據保留時間及負責數據保留的部門。
1.2.3提供學校的資源與政策提供了學校的數據管理工具BioTools@UMassMedicalSchool安全的數據云存儲、學校的數據管理政策、學校數據分析規劃服務、臨床資料咨詢和解決方案以及研究計算方案和工具等。
1.2.4提供其他開放和可用的數據資源提供了開放以及公開可用的數據(如Bioinfor-maticsTimesaver、Data.gov、Databib、GenomicDataRepositories、HSRIC:Data,Tools,andStatistics、NIHDataSharingRepositories等資源)和可用的生物科學的數據存儲庫(如Dryad、GenBank、GeneExpressionOmnibus、MouseGenomeInformatics、ProteinDataBank等資源),以及公開的衛生數據集、社會科學數據集和開放數據資源等。從上述圖書館科研數據管理服務來看,生物醫學科研數據管理咨詢服務占很大比重,除了數據管理政策咨詢、數據管理計劃撰寫指南及模板、知識產權咨詢等咨詢服務外,具有生物醫學領域特色的數據收集方法、元數據標準、數據類型和范圍、生物醫學數據特有的分析方法和工具、生物醫學研究政策、生物醫學數據資源以及生物醫學研究數據管理的最佳實踐案例更成為了服務的重點。科研數據管理服務與文獻情報服務有很大差異,需要配備專業的數據管理服務人員。
2對我國圖書館醫學科研數據管理服務的啟示
2.1以用戶為中心無論圖書館如何提供科研數據管理支持服務,科研數據管理的主要責任者仍是科研人員。因此圖書館開展科研數據管理支持服務必須堅持以用戶為中心,從用戶的實際需求出發。首先在服務范圍內對生物醫學科研人員進行科研數據管理服務需求的調研,主要內容包括對科研數據管理政策的掌握情況,實際的科研數據管理方法及工具、科研數據管理計劃的模板及工具使用情況,元數據格式、轉換格式和工具使用情況,數據分析方法及工具的利用情況,科研數據管理目前存在的困難,以及對于圖書館能夠提供的科研數據管理服務的需求等。針對以上情況,學科館員需深入重點課題組,對科研數據管理實際情況進行考察,全面掌握服務對象在科研數據管理方面實際存在的問題,提升模式和對服務的需求。然后根據對調研結果的分析,初步設計出科研數據管理服務思路,結合本單位學科化服務重點服務計劃,進一步開展基于生物醫學數據生命周期的科研數據管理服務模式的研究和實踐。
2.2基于數據生命周期的科研數據管理服務模式科研數據是根據科研工作的流程而產生的,同科研項目一樣,也有生命周期。醫學圖書館學科館員為科研團隊或科研人員提供科研數據管理服務,必須遵循生物醫學科研數據的生命周期,滿足科研進程不同階段對科研數據管理的不同需求,才能有效地提供科研數據管理服務。學科館員根據數據文檔計劃(DataDocumenta-tionInitiative,簡稱DDI)的研究數據生命周期[13],確定基于數據生命周期的科研數據管理服務模型,包括研究設計、數據收集、數據處理、數據存檔、數據、數據發現、數據分析及數據再利用8個階段,并根據不同研究階段數據管理需求來確定科研數據管理服務的內容和方式。
2.2.1研究設計階段在研究設計階段,確定研究任務的同時需制定一份關于未來科研數據管理的規范計劃。科研數據管理計劃(DMP)是描述研究過程中及研究項目完成后科研數據處理方式的正式文件。清晰完備的數據管理計劃不僅使得科研數據生成、保存、共享和利用等操作規范化,也可保證他人分享數據和長期保存數據的完整性和一致性。學科館員要提供各基金機構數據管理政策、數據管理計劃軟件、基于科研數據管理計劃的制訂提供咨詢與指導、基于數據生命周期的DMP最佳實踐案例以及詳細的研究數據管理指南等。
2.2.2數據收集階段在數據收集階段,科研數據管理需要確定數據格式、尺寸和命名方式,以及對數據短期進行存儲。但生物醫學領域的研究由于實驗方法、對象、材料等方面存在諸多差異,導致數據收集方法與工具也存在很大差異。學科館員需協助科研人員創建元數據,提供生物醫學數據元數據格式、生物醫學數據存儲標準、一些分布式文件系統的介紹、其他可用的圖書館數據資源,以及根據情況構建或引入科研數據管理平臺。
2.2.3數據處理階段在數據處理階段,科研數據管理的任務主要為數據轉換和數據重新構建。生物醫學領域數據類型比較復雜,需要針對不同類型的數據提供專業數據分析處理工具,學科館員可以為科研人員介紹高性能計算中心、專業數據處理課程、數據處理方法等。
2.2.4數據存檔階段在數據存檔階段,科研數據管理的任務主要為數據長期保存與管理。目前用于科研數據長期保存的系統主要有公共數據倉儲庫、各學科領域的專門數據倉儲庫、各機構建立的數據倉儲系統等。學科館員需協助科研人員進行數據的上傳存檔,提供生物醫學數據歸檔政策、數據倉庫介紹、數據上傳歸檔工具以及數據字典等。
2.2.5數據階段在數據階段,科研數據管理的任務主要為數據共享、確保數據安全和權力。數據的和出版是將研究數據視為科學研究活動的產出成果進行和出版,將有助于推動數據共享的進程。學科館員可以提供生物醫學科研數據共享與數據出版政策、生物醫學科研數據交換格式標準,以及科研數據安全相關問題咨詢等。
2.2.6數據發現階段在數據發現階段,科研數據管理的任務主要為數據挖掘和數據利用服務。學科館員可以幫助科研人員發掘更多可用的數據來源、提供數據引用規范以及科研數據知識產權相關問題。
2.2.7數據分析階段在數據分析階段,科研數據管理的任務主要為萃取和提煉科研數據中的信息知識。此時,學科館員需幫助科研人員對數據進行統計分析,找到數據內在的知識聯系,提供生物醫學科研數據分析軟件(如SAS、SPSS等)及生物醫學科研數據統計咨詢服務等。
2.2.8數據再利用階段在數據再利用階段,科研數據管理的任務主要為數據關聯與再利用。學科館員可以為科研人員提供再利用的政策,并根據新的科研任務提供新的科研數據管理計劃等。學科館員在基于數據生命周期的科研數據管理服務過程中可以使用libguides建立數據管理支持服務平臺,提供生物醫學領域數據管理詳細的指南和服務,重點建設數據計劃及元數據標準、生物醫學科研數據管理最佳實踐、生物醫學領域資源等。
2.3館員能力建設科研數據管理服務的發展對圖書館員帶來了極大挑戰,如專業領域的科研數據管理服務受知識和技能的限制。有研究表明[14],健康、科學的圖書館員雖然對科研數據管理服務的開發具有興趣,但往往缺乏提供生物醫學科研數據管理服務的有效技能。學科館員雖然具備一定的學科知識和圖書館實踐經驗,但對于專業的科研數據管理服務仍需提升各方面能力。在數據管理咨詢服務能力方面,需加強理解和把握生物醫學科研數據的生命周期,學習生物醫學數據管理相關技術知識,熟悉生物醫學元數據,掌握生物醫學領域科研數據相關政策及規定,熟悉生物醫學領域科研數據的范圍和存儲格式,加強對機構知識庫的了解,補充基金申請書寫作經驗,提升與科研人員合作和溝通的技巧等。另外還需加強開發數據管理軟硬件的能力,掌握應用專業軟件(如Dspace、Fedora、Eprints等)定制開發特定領域的數據管理平臺的能力等。
3結語
目前學科館員開展科研數據管理支持服務的一個主要難點是缺乏數據標準。不同的科研領域,不同的管理方式都會產生不同的數據格式,缺乏數據標準使得已產生的海量數據因為兼容性問題難以實現共享和分析。學科館員在協助科研人員進行科研數據管理初期應充分參考該領域的最佳實踐案例,盡量使用國際通用標準,以避免之后調整數據標準的麻煩。在生物醫學科研數據管理服務過程中存在一系列問題,如數據重構、數據分析、數據出版等,需要服務人員對生物醫學和數據管理兩個領域都具有較深的造詣[15]。學科館員需要投入大量的時間和精力去學習新的研究方法、政策、工具等知識,才能很好地為科研人員提供生物醫學科研數據管理服務。科研數據管理服務對學科館員而言既是機遇也是挑戰,優質的生物醫學科研數據管理服務可以幫助培養新的研究、新的發現以及獲得更好的科研成果,但需要更加深刻地把握學科領域研究數據的特性,開發更為便捷可靠的工具,不斷優化的服務模式,持續地在數據挖掘、知識服務等方面進行深入探索。
作者:李芳薇 程瑾 張群 張萌 張孟子 張曉燕 陳建青 單位:解放軍醫學圖書館