本站小編為你精心準備了電子檔案元數據體系及元數據庫建設參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:通過對數字檔案室建設過程中實踐經驗進行總結,對機關電子檔案管理過程中元數據的分類、元數據體系構建方面進行分析梳理并為機關元數據庫建設提供經驗借鑒。以自然資源部數字檔案室建設為例從形成階段、捕獲方式、實體類型、通用及專用屬性、聚合層次等方面分析元數據體系的組成部分,研究機關電子文件收集與電子檔案管理過程中元數據體系構建及元數據庫建設的關鍵環節并分析元數據在數字檔案管理過程中的重要作用。
關鍵詞:元數據;電子文件;電子檔案;數據庫
引言
隨著機關辦公自動化及電子政務建設的發展,以及信息技術在機關檔案管理工作中的應用,電子文件歸檔是檔案管理信息化建設和數字檔案室建設的必然趨勢和發展方向。元數據是指描述電子檔案的內容、結構、背景及其整個管理過程的數據,因此元數據是電子文件歸檔的重要內容,元數據信息可應用于電子檔案歸檔、移交、接收、利用以及長期保存數據檢測過程中,是實現各個環節電子檔案數據真實性、完整性、可用性和安全性的重要保障。本文以自然資源部為例,分析機關電子檔案元數據體系的構建和組成結構,元數據在電子檔案管理過程中的作用和實踐經驗。
1機關電子檔案元數據體系構建
機關電子檔案元數據體系的構建與電子檔案類別息息相關,既有傳統的文書、科技、專業、照片、音像、會計等類別,還有電子郵件、網頁信息以及專業數據庫、空間圖形數據等新興的檔案類別。如何科學合理地設置各類檔案的元數據,構建機關電子檔案元數據體系,需要綜合考慮各個類別檔案的通用性,形成通用元數據項,也要考慮各個類別的特殊性,針對特殊屬性設置各個類別特有的元數據項;同時考慮到檔案收集的方式和環節、描述的實體及檔案整理的聚合層次,對各個元數據項進行分類聚合,共同形成機關電子檔案元數據體系。[1]元數據體系構建示意圖如圖1所示。
2機關電子檔案元數據組成結構
2.1按元數據的形成階段,可分為電子文件的形成階段、歸檔階段、管理階段。
其中形成階段可形成題名、日期、起草人、部門等元數據,以及審批人、審批部門、審批日期等元數據,整理歸檔階段可形成檔號、件號、保管期限、移交人員、接收人員、歸檔日期等元數據,管理階段可形成存儲位置、處置方式、處置日期等元數據。
2.2按元數據的捕獲方式分,可分為從移出系統接收、默認賦值、自動捕獲、半自動化賦值、手工錄入等方式。
其中從移出系統接收、默認賦值、自動捕獲為主要獲取方式。元數據的獲取方式與業務流程、功能節點密切關聯,應在電子檔案管理系統總體設計時做統籌規劃。從移出系統接收是指從原辦公自動化系統與業務審批系統接收數據時與電子文件同時接收的元數據,例如電子文件的題名、文號、形成日期在從辦公自動化系統向檔案系統的推送過程中進行接收;默認賦值是指通過系統初始化設置對諸如全宗號、單位名稱等元數據賦值;自動捕獲是指在電子文件接收、掛接或管理過程中對元數據信息進行捕獲,例如電子文件格式、大小、分辨率等信息在接收或者導入電子文件的同時進行自動捕獲,電子文件移交、登記、銷毀等業務行為元數據在業務行為發生的同時進行自動捕獲。半自動化賦值是指在系統中為元數據設置詞典,用戶通過下拉菜單等形式選擇元數據值并賦值,比如保管期限等元數據。手工錄入方式主要是針對無法實現自動捕獲的元數據,由整理人員進行手工著錄,例如在電子文件整理過程中對題名、責任者等信息進行確認和修改的過程需要手工著錄,對歷史檔案中缺失元數據需要手工著錄或手工批量錄入。
2.3按元數據實體類型分,可分為文件實體元數據、機構人員實體元數據、業務實體元數據和實體關系元數據等。
其中文件實體元數據可分為檔案信息元數據、內容描述元數據、形式特征元數據、電子屬性元數據、數字化屬性元數據、電子簽名元數據、存儲位置元數據、權限管理元數據等。以采礦權登記檔案元數據方案為例,表1列出了各類元數據的主要元數據項:或者導入電子文件的同時進行自動捕獲,電子文件移交、登記、銷毀等業務行為元數據在業務行為發生的同時進行自動捕獲。半自動化賦值是指在系統中為元數據設置詞典,用戶通過下拉菜單等形式選擇元數據值并賦值,比如保管期限等元數據。手工錄入方式主要是針對無法實現自動捕獲的元數據,由整理人員進行手工著錄,例如在電子文件整理過程中對題名、責任者等信息進行確認和修改的過程需要手工著錄,對歷史檔案中缺失元數據需要手工著錄或手工批量錄入。
2.3按元數據實體類型分,可分為文件實體元數據、機構人員實體元數據、業務實體元數據和實體關系元數據等。
其中文件實體元數據可分為檔案信息元數據、內容描述元數據、形式特征元數據、電子屬性元數據、數字化屬性元數據、電子簽名元數據、存儲位置元數據、權限管理元數據等。以采礦權登記檔案元數據方案為例,表1列出了各類元數據的主要元數據項:
2.4按元數據的通用屬性分,可分為通用元數據和專用元數據。
通用元數據是指各類電子文件都需要設置的且可獲取的、符合檔案管理一般要求的元數據,例如:檔號、件號、保管期限、題名、電子文件格式、大小、存儲地址等。專用元數據是指針對各個特殊類別特有的元數據項,例如:照片檔案專用元數據包括攝影者、攝影時間、攝影地點、人物、水平分辨率、垂直分辨率、圖像高度、圖像寬度、色彩空間、設備制造商、設備型號等。音像檔案專用元數據包括攝錄者、攝錄時間、時間長度、設備制造商、設備型號、色彩空間、分辨率、幀率等。專業檔案專用元數據要依據專業檔案的分類,針對各個類別特有的信息確定專用元數據,例如自然資源專業檔案中礦產資源管理檔案專用元數據包括類別、礦山名稱、礦山地址、許可證號、開采礦種、礦區面積、開采方式、采礦權人、生產規模、礦區范圍拐點坐標等,建設用地預審檔案專用元數據包括申請單位、用地規模、行業分類、涉及省份、項目代碼、批復文號等。網頁類電子檔案專用元數據包括欄目、網址、時間、單位等。[2]
2.5按聚合層次分,可分為案卷層元數據、文件層元數據以及電子文件層元數據。
按照現有的有關標準,元數據聚合層次分為案卷層和文件層,但是實際管理工作當中,文件層電子文件往往不是由一個單一文件組成,而是由一組文件組成,例如文書類電子文件一件檔案由正文、審批單、定稿、花臉稿以及來文審批單、來文組成,需要針對每一個電子文件描述文件大小、格式等信息。根據檔案組件方式,如果是以案卷整理的檔案,需要設計案卷層元數據和文件層元數據,其中案卷層元數據需要列出案卷題名、卷號、檔號、保管期限等案卷信息屬性,文件層元數據需要列出文件編號、文件題名、日期等信息。如果是按件整理的檔案,則不需要設計案卷層元數據。如果文件層的電子文件數量大于1件,對每個電子文件還要分出電子文件層元數據,將電子文件的格式、大小、存儲位置等信息列入電子文件層元數據。
3元數據體系構建與元數據庫建設的幾個關鍵環節
如前文所述,元數據體系是一個復雜的系統,涉及電子文件形成到整理歸檔、檔案管理的各個環節,因此元數據體系的設計與構建需要綜合考慮檔案分類體系,辦公自動化系統、業務系統以及檔案管理系統的流程,獲取方式等方面,具體的關鍵環節如下:
3.1確定機關檔案分類體系及各類檔案通用元數據項、專用元數據項。
檔案分類體系的確立是實現檔案科學規范管理的基礎,根據國家有關要求,自然資源部機關檔案可分為文書檔案(WS)、專業檔案(ZY)、照片檔案(ZP)、音像檔案(YX)、網頁檔案(WY)、科技檔案(KJ)、會計檔案(KU)等。其中專業檔案、科技檔案需要再細化進行分類。根據檔案分類體系確定通用元數據項以及各類別專用元數據項,共同構成機關元數據體系構架。
3.2在檔案系統中構建元數據庫實現元數據統一配置和管理。
在元數據庫建設中需要考慮各元數據項設置規則,例如數據類型、填寫格式、長度限制、編碼規則、聚合層次、值域、權限控制等。將元數據實體以及實體之間的關系進行科學設計,例如業務行為實體元數據涉及整個擬文、歸檔流程,分別在擬文、簽發、用印、整理、檢查、接收、移交等環節都需要設置,并且有一定的邏輯先后關系,以及各業務行為之間的關系。通過設置完整的元數據配置信息和數據字典等信息。在檔案的門類管理模塊根據 元數據的聚合層次和各類檔案的專有屬性分別針對各類檔案的卷、件層級設置相應的元數據項。
3.3確定元數據的獲取方式并逐一細化實現元數據規范填寫。
元數據完整規范的收集是元數據體系構建和元數據庫建設的難點。在元數據體系設計之初需要考慮可獲得性。確定元數據體系后,在辦公自動化系統、業務系統與檔案系統的設計和建設中,系統之間接口開發以及數據收集、整理、掃描過程中逐一落實。例如成文日期元數據,需要與辦公自動化系統中正文的落款日期一致,捕獲節點以部發文為例是在部領導最后一次簽批的節點進行捕獲。責任者元數據的收集需要根據發文的文號類別、簽報起草司局在數據字典中提前設置,自動判別和填報,收文的責任者需要在收文登記的環節通過辦公自動化系統進行錄入。照片以及掃描件的分辨率、圖像高度、圖像寬度、色彩空間等元數據在數據整理和數字化環節進行自動捕獲。
4機關電子檔案元數據作用分析
隨著電子文件的大量產生,元數據方案的確定、捕獲與管理是電子文件歸檔和電子檔案管理中不可缺少的一部分。對于實現電子文件的歸檔和電子檔案的有效管理和利用,完整地記錄電子文件的背景、內容、結構等信息,在保障電子文件的真實性、完整性、可靠性和可用性等方面發揮著重要作用。[3]
4.1元數據為電子文件的重要組成部分。
電子檔案與傳統載體檔案的一個重要區別就在于,電子檔案既包括電子文件又包括描述電子文件的一系列元數據。元數據隨著電子文件生成而生成,伴隨著電子文件流轉、歸檔和管理的各個環節,是電子檔案不可或缺的組成部分。
4.2元數據是電子檔案規范管理的保障。
電子檔案管理的過程中,收集階段除了要完成電子文件收集外,還要完成元數據的捕獲與收集。傳統載體檔案整理需要編制目錄,目錄數據可以理解為元數據的一部分,電子檔案的元數據信息在傳統載體檔案目錄的基礎上進行擴充,在檔案鑒定、整理、歸檔等管理環節,元數據作為重要的基礎數據,是現實電子檔案規范管理的重要依據。4.3元數據為四性檢測的信息來源和依據。電子檔案歸檔規程中需要進行四性檢測,分別檢測電子檔案的真實性、完整性、可靠性和可用性。元數據檢測為四性檢測的重要內容,四性檢測的實現主要通過對各類元數據信息內容的檢測進行實現。由于電子文件的可復制、可修改等特性,與電子文件伴生的能夠說明電子文件性質的元數據是證明電子文件真實性的重要依據,包括電子文件產生時的電子文件自身屬性、技術環境等。
4.4元數據是電子檔案數據查詢檢索、編研利用的基礎。
電子檔案利用過程中,對元數據的檢索是實現電子檔案查詢與利用的基礎功能,對文件名稱、文號、機構、年度以及檔號等信息填寫完整和規范是實現快速準確檢索的基礎。同時電子檔案的統計編研分析利用也是基于結構化的元數據信息實現的,需要各類檔案元數據的設計與填寫齊全完整規范。
5機關電子檔案元數據體系及元數據庫建設幾點體會
首先,各類檔案元數據體系的設計與構建是元數據庫建設的前提條件。需要針對各個類別的檔案從電子文件形成開始,到整理、歸檔整個流程進行分析研究。電子文件起草單位和人員、審批流程、整理者、歸檔信息等元數據都需要收集,明確各個環節的元數據項和獲取方式,制定元數據標準體系框架,作為電子文件歸檔和電子檔案管理的重要內容和依據。其次,元數據收集齊全完整,有助于電子文件歸檔與電子檔案的規范高效管理。例如,文書檔案稿本信息元數據的收集,包括正文、定稿、花臉稿等各類稿本,這些信息收集齊全可以實現利用系統自動化判別文檔是否收集齊全完整,排序是否規范等,大大減少了檔案工作人員的工作量。業務行為元數據的收集,對于檔案是由誰、在什么時間整理、登記、歸檔、移交等行為進行詳細記錄,可以實現電子檔案全流程電子化管理與歷史追溯。最后,元數據中對內容的描述信息,特別是對各類專業檔案內容的描述進一步細化、分類合理對檔案的利用和編研工作的開展非常重要。各類業務檔案需要檔案人員和業務人員一起,認真分析研究提出針對各類業務檔案重要的、專有的元數據項。例如礦業權登記檔案設立礦山名稱、礦山坐標、所屬省份、開采礦種、礦區面積、生產規模等元數據項,能夠對今后檔案利用、統計分析和編研提供豐富的內容,進一步對行政管理與政策研究提供支撐與服務。
參考文獻:
[1]陶水龍.電子文件和電子檔案元數據分類與方案設計[J].檔案學研究,2016(6),83-90
[2]田雷.電子文件元數據分類與方案設計對策研究[J].中國檔案,2017(4),62-63
[3]毛海帆.電子檔案元數據方案設計與應用初探[J].檔案學研究,2010(1),74-78
作者:李芳芳 吳玉龍 米捷 陳成 單位:自然資源部信息中心