跳到主要內容

國立公共資訊圖書館

Menu

讀者服務

本館出版品

數位館藏的維護與保存

文:周欣鶯(國立中興大學圖書資訊學研究所)

【摘要】

  數位化資料雖然有使用上的便利性、具檢索性以及儲存空間小等優勢,然而,到目前為止它所引發的弊端也著實不少,它所涉及的問題多,範圍廣,其中之一就是有關數位資源的長久保存與維護議題。本文從數位資源長久保存的重要性談起,接著探討圖書館的館藏管理與保存活動、數位資訊保存與維護的困難,以及學者專家們所提出的一些保存策略,供圖書館從事館藏資源數位化時之參考與省思,防止重要資訊的遺失或破壞。

【Abstract】

  Digital information can help the prevention of data loss due to natural disasters and deterioration of printing materials. However, the advantages of digital information, such as accessibility, retrieval functions, and minimal space, are accompanied with problems on preservation and maintenance. In order to provide suggestions for the library that is working on digitalizing collection, this article intends to discuss preservation of digital information from the following perspectives: library collection management and development, projects on digital collection, difficulties of digital preservation, and strategies proposed by scholars.

關鍵詞:數位館藏;維護;保存;館藏管理

Keywords: digital collections;maintenance;preservation;collection management

一、前言

  中國圖書館學會2000年4月研訂的「圖書館事業發展白皮書」指出圖書館事業的五大願景為:保存文化紀錄、維護知的權利、統整資訊資源、滿足資訊需求、推動終身學習。而為達成這五項願景,圖書館應追求七項發展目標,其中第三項發展目標為善用資訊科技,文化紀錄保存數位化。(註1)足見圖書館自動化、網路化、館藏數位化等思潮已打入圖書館發展事業核心,數位館藏今後將扮演著舉足輕重的角色。

  數位化資料雖然有各種優勢存在,如使用上的便利性、可檢索性、儲存空間小等,然而,到目前為止其所引發的弊端也著實不少。不可否認的不論是將館藏數位化或是直接引進數位館藏,都不會是一件單純的工作,所涉及的問題多,範圍廣,其中之一就是有關數位資源的長久保存與維護議題,尤其圖書館的保存任務並不是為保存而保存,更希望能夠將前人的知識紀錄永續傳承與使用,隨時維護讀者知的權利,滿足其資訊需求。

二、數位資源長久保存的重要性

  古埃及亞歷山大城圖書館收藏的手稿毀於一場火災。早期的印刷書刊因年久變質成了一堆無法辨認的廢紙。歷史最悠久的電影片有許多已被當作廢品回收處理,以取得其中所含的銀。遺憾的是在Internet的發展過程中,歷史可能重演。(註2)

  歷史確實已經重演,黃鴻珠教授(註3)與陳昭珍教授(註4)均曾引述美國資料維護及取閱委員會(Commission Research Libraries Group)與研究圖書館聯盟(Research Libraries Group)合組的數位化資訊檔案專責小組(Task Force on Archiving of Digital Information)於探討數位資料保存問題時,列舉數個以數位化典藏的資訊,若干年後發生資料無法閱讀的後遺症個案(註5),第一個個案是美國1960年代所做的人口普查資料,存於UNIVAC Tape II-A,到1976年欲閱讀該批資料時,只找到二部可以閱讀的機器,一在華府史密斯索尼亞(Smithsonian)的博物館,一在日本,經大費周章後,方將該批資料轉出,結果發現該資料極其珍貴。而1964年麻省理工學院及卡內基美隆大學(Carnegie Mellon University)的第一封電子郵件,因系統的改變並未保存下來;1970年代,比利時的人造衛星觀測資料,特別是有關亞馬遜河變遷的資料也已遺失。以上案例明確點出電子資訊技術(digital technology)的限制與數位資訊遺失的可能,而諸如此類的例子相信不勝玫舉,值得借鏡與深思。

三、從電子館藏發展方向與館藏管理看保存活動

  ALA Glossary of Library And Information Science一書表示:「館藏發展是指包含決定及協調選書政策、評估讀者及潛在讀者的需求、館藏使用調查、館藏評鑑、確認館藏需求、選擇資料、資訊共享的規畫、館藏維護,以及館藏淘汰等有關館藏的發展活動」。(註6)同樣地,數位館藏發展也應擬出一套資源選擇與評估標準,包含ownership與access的考量,其他活動亦當訂定發展政策以供遵循。此外,由於各個學科使用者資訊需求行為模式、接受程度均不盡相同,使用資料的方式也會不同。如(圖一)所示,在資訊加值過程、館藏資源管理上,除了考量物件本身特性,也要考慮到使用者利用問題,對資訊物件的保存與功能性做取捨,即analyticity、integrity、transferability、longevity的抉擇。換言之有些資源目前著重的是analyticity與transferability,尚未考慮長期的保存問題,但從另一個角度思考,這些狀態或許也都處於過渡時期而已,可以再轉移的。至於紙本的保存是較經得起時間的考驗,缺點則是較不能節省讀者檢索時間。

圖一

(圖一)Goal values.
(資料來源:Ross Atkinson,"Managing Traditional Materials in an Online Environment:Some Definitions and Distinctions for a Future Collection Management",LRTS 42:1(1997),pp.12.)

  Ross Atkinson認為館藏管理(collection management)相較於館藏發展,係指對資訊物件(objects of information)在選擇進館收藏後依據圖書館的需求(如宗旨與功能)從事的資訊加值或淘汰的重新調整(delete value)。(註7)這也意謂著今後圖書館在建立館藏時,應充分掌握館藏資訊特徵,發揮高度判斷力及智慧,在排除著作權與版權問題後,隨著各種需要去改變其原始型態,重新創作出適合的館藏形式,以符合典藏、保存及取用等原則,公正地、理智地將過去與未來相融合,完成圖書館提供資訊承傳的神聖使命。

  目前圖書館對電子館藏的建置方式大致有1.將實體館藏電子化、2.引進現成的電子資源、3.運用網路上免費的電子資源等三種。關於使用者需求的考量上,圖書館首先必須確認圖書館進行數位化工作的目的為何?或為保存珍貴文獻,或以方便使用者利用為主。誠如某些特藏,像藝術作品、名人手稿、善本書、古版書、絕版書等,為避免因為直接使用而造成的損傷,又期能走出冷氣室廣受利用,增加特藏資料的能見度,則需進行數位化工作。若為後者,則必須對使用者需求加以了解及調查,列出優先順序。

  圖書館界在數位化館藏時,建立館藏特色、重視資源完整性仍為主要導向,彼此間的互助合作更是勢在必行,不論是成立數位聯盟或是分工合作(自行處理或外包)進行數位化,都需要彼此凝結共識,分析資源整體分布情形,發揮團體智慧,各司其職,以免重複浪費或是三不管。對電子資料的長久保存上,不僅期待能提供給現在的讀者,也希望能提供給未來的讀者使用,亦正是數位圖書館服務責無旁貸的新使命。

四、數位化與數位資訊保存維護的困難

  就載體形式的轉換過程言,包括對紙本館藏或藝術品進行數位化時,大致都會有費用龐大、處理專業技術不易獲得、耗費時間等問題(註8),足見館藏數位化所投入心血與金錢所費不貲,況且知識無價,不是用金錢單一因素可計量的。而除了content的保存外,資料的原件是否需要保存?如何保存?這些議題對現階段的保存與維護言,在在困擾著我們。另外,網路上有許多值得參考的資源,圖書館佷少有系統地去蒐集這些資料。然而這些網路資源產生得快,消失得也很快,如何妥善保存,讓未來讀者也能利用,完全無法確定。(註9)以上都是圖書館進行保存、維護作業或者該不該保存、如何取捨時的一大挑戰。其困難點總結如下:(註10)

  1. 電子媒體缺乏耐久性,極易損壞。
  2. 資料需經常更新或轉移,費時費力,並且無法預測。
  3. 資料無法單獨存在,必須有軟體搭配。
  4. 需考慮法律問題:即著作權議題-如重製權、使用權等。
  5. 經濟問題:經常的轉移或更新動作,相當費力、費錢。
  6. 責任歸屬難以確定:由誰負責?誰可以做?有能力做?

  陳昭珍教授(註11)也指出數位資料不易長久保存的最大原因,在於資訊科技典範的快速轉移,包括軟硬體、網路架構等各種層面,由於數位資訊數量的快速增加,即使投入可觀的人力與金錢,也不一定能即時跟上轉移腳步。此外數位媒體的壽命短且容易損壞,造成數位資料的無用,也是電子資源長久保存的嚴重挑戰。

五、數位館藏維護

  館藏發展的三大要素為:採購、淘汰與維護。相較於傳統圖書館因社會、自然等原因,而對館藏採取各種保護措施,諸如防晒、防蟲、防潮等各種環境控制,這些措施都是針對載體本身而設,而數位館藏維護則必須考慮下列三種層次的問題:(註12)

  1. 媒體維護
    主要為資訊載體的保存、備份。前面提過電子媒體缺乏耐久性,極易損壞,根據研究顯示,磁性媒體(magnetic media)與光學媒體(optical media)需要極嚴格的環境控制才能保持其穩定性,避免毀壞,而這樣的環境並不容易獲得與負擔得起,使用起來也不方便。比較經濟的操作方式即是多做備份。不過也有人表示,即使努力增強儲存媒體的壽命也未必有效,因為現在媒體的生命週期已比軟體及其周邊設備長。(註13)
  2. 技術維護
    電腦程式日趨多樣化,版本更新快速,有些甚至演變到最後已完全不相容或是找不到可使用之機器,此外,圖書館是否有能力來維護?是以技術的維護將是電子圖書館想要長久保存電子資訊最重要的課題。
  3. 內容維護
    電子資訊的特色是容易修改、更新,此優點卻也是其維護上的困難點:時效正確性不易判斷、內容容易失真(引發資料安全認證)、複本控制更形複雜等,對維護資料的完整性及權威性將是項嚴重的考驗。完整性的維護應包括其內容、穩定、出處起源、參考資料及關連性(註14),此項工作有賴完善的辨證與考證制度,否則對於內容真偽、版本判斷將是各家說法不一,人見人殊。

  為解決上述三種問題,使數位資料載體保有可信賴性與可用性,我們必須對大量儲存媒體與軟體為能提供檢索與演算的需求,就檔案結構特性、描述性詮釋資料、以及顯示、計算與分析的能力,制定一套長期保存策略(註15)以克服難題。

六、數位館藏的保存策略

  數位資訊維護的威脅主要有四方面:技術過時、資源不充足、規畫不完善以及媒體本身的問題。(註16)數位館藏的保存策略理應根據數位典藏政策與電子館藏發展政策,以及完善的規畫行事,不過就目前環境與技術言,尚未發展一成熟的作業模式,亦即沒有一標準答案與完全適當又經濟的方法。很多策略與辦法都在發展當中,這些策略包括:(註17)(註18)

  1. 印成紙本儲存或變成微縮型式
    在電子資訊時代,再將電子形式的資源印成紙本形式保存,聽起來似乎有點諷剌。此法雖然原始,但卻可靠、安全。這也可解釋為什麼很多數位轉換計畫都會印成紙本或微縮片加以備份。顯而易見的,回歸傳統後,所有數位化的特性與功能也都不見了。
  2. 僅保留最簡單的數位格式
    儘量降低對軟體的依賴,僅保留最簡單、禁得起資訊科技變動的檔案格式與結構,如ASCII文字檔與Flat files,這對一些數據資料庫是可行的,然而若除了要保存content外,又想保有原件或其他功能,則此法亦行不通。
  3. 採用標準
    採用標準應該是最理想的模式,然而說起來容易,做起來並不簡單。首先標準牽涉層面多,其中任何一項都相當專業且複雜,並不易處理,其次用者需求不同,有關標準的共識並不易達成,第三,就技術人員而言,希望大家都採用他的東西,使之成為標準,在誰也不服誰的狀況下,標準很難產生。最後,就算標準產生,標準也會受資訊科技轉移影響,仍需要轉移或更新,其軟體也要跟著向上提升。
  4. 複製(Replication)與備份
    備份主要是媒體的維護,將來還需要搭配其他措施,如印成紙本、轉移、更新等,故複製或備份工作必須是採自動機制且經濟的模式進行。
  5. 轉移(migration)與更新(refreshing)
    轉移包括將資料格式、結構或標準做轉換,更新僅在於儲存媒體間的轉換。這兩者在規畫上所遭遇的困難有:無法預期什麼時候該執行轉移或更新?要做到什麼程度才好?以及花費金額。因為資料之所以需要轉移主要是由於新科技、新版本的出現、軟硬體的改變,未雨綢繆,必須先做轉移,免得等到已無法轉移時才想做,則為時已晚,如此看來,轉移需要有預測的能力。問題是新科技什麼時候會出來?功能有那些?是否立刻與舊有系統不相容?使用者與市場的接受程度又是如何?往往難以預測。現實環境雖然如此殘酷,但轉移還是一不錯的選擇,多從事各種可行性研究(feasibility studies)與成本效益分析,對克服難關還是有幫助的。
  6. 透過管理工具
    就目前看來,透過管理工具維護較屬於短時期的維護,像MOMspider(Multi-Owner MaintenanceSpider)、Web:Lookout強調的即是對現在網路資源的維護,其優點是一自動機制、速度快且經濟,破除傳統勞力密集作業模式,降低人為疏失或損害。因此善用管理工具對管理與維護某些電子資源言,也是一神兵利器,圖書館不宜忽視。
  7. 保存舊有的軟硬體
    Jeff Rothenberg(註19)於1995年曾提議將原數位資料壓縮在一個虛擬的信封(envelope)中,連同軟體檢索操作說明一併置入,優點是可以原封不動地保有原件提供的功能。不過,這仍需要保有原來的軟硬體配備才能達到立意,亦即需要建立電腦博物館,以儲存所有的軟硬體設備,供未來有需要時還原使用。然而正如陳昭珍教授所言,到底這個博物館要由誰來建立、如何建立、要保留那些技術與設備、功能與任務如何,都需要各界進一步討論。

  以上所提供之策略各有所長,而各數位資訊物件使用環境也不一樣,其中像多媒體型式與動態型式的數位資訊之保存問題就不易處理。然而,不論數位資訊格式有多複雜、種類有多繁多,檔案館與圖書館界應積極協商與對談,試圖為這新興且缺乏經驗的數位世界之保存議題設法找出因應解決之道。

七、數位資訊保存維護的省思

  數位館藏是否需要保存以及如何保存,首先應擬訂數位典藏政策,以網路資源而言,在徵集方面,Robert D. Cameron提供了四項基本原則:Link to the Original Source、Identify or Implement Reliable Mirrors、Identify or Implement Value-Added Features以及Maintain the Links。圖書館針對此四種作法,所須投入難易程度不一,像Maintain the Links即可輕易透過電腦程式解決,如MOMspider或Verify_links就是一種自動連結、偵測錯誤的機制。(註20)比較令人憂心的是連結點突然消失造成的資訊遺失現象,故就典藏言,可另分成四種層級:連結級、鏡錄級、服務級與典藏級。(註21)

  圖書館、檔案館或是其他保存維護機構,都負有保存之責,但彼此間仍有差異,然而隨著社會變遷與技術環境的改變,以及政治與經濟因素的介入,這些機構可能要適度妥協而不能一昧堅持、固執,如圖書館方面,對那些已存在的讀者力量就不容小歔,其需求絕對會影響到圖書館對資訊物件的保存決策,因為圖書館存在的最大原因就是為了提供讀者服務。

  數位典藏與電子館藏發展政策是要制訂,但在制訂之前,若剔除經濟與政治因素,完全回歸文化承傳與資訊利用時,我們不禁仍要思考:1.館藏數位化的目標究竟是為了防止舊資料的流失,還是建立未來更好的館藏?2.究竟是要保存舊資料的外貌、格式,還是其中的內容、思想?3.究竟要維護、複製舊資料的內容,還是賦予它新的精神?(註22)

  長久以來,圖書館員背負著保存文化紀錄使命,總保有些許的『Warranty Syndrome』色彩,若能去除這單一思維模式,方可突破瓶頸,挑戰詭譎多變的未來。原則上,不同資訊物件有其特色、生命週期與價值,採取不同作法是較適當的,其中有些可以保存舊有的形式,有些則需要創新,賦予新生命或有所取捨。這種種判斷絕非憑少數人之聰明才智逕行決策,而是需要透過團結群體的力量,利用各種調查與研究,共同思考創作出最適當的模式,訂定各種保存維護策略,對館藏資源做歸類,將其中重要、好的資訊保存下來,因為科技不斷進步發展,但還原與重建原貌的工作就沒那麼簡單。至於知識性、常用的資料,則可利用像OCR等技術,製作資料庫以供檢索取用,配合媒體維護與技術維護,提供持續性的服務。

八、結語

  好的電子資源能永久保存與永續使用是大家的期望,這對肩負歷史承傳的圖書館員言,是光榮使命。發展至今,雖然尚未研究出適當模式,而許多現實因素仍有待克服,如智慧財產權與版權(重製權)等法律議題,不過,電子化資源確實已成為我們追求知識的重要來源之一。世界上很多國家、機構、學術單位已積極投入電子化相關計畫,並將其研究結果、心得、作法與建議積極透過網路完全公開供眾分享,因此,除了有計畫性的進行研擬策略,建立最佳轉換程序之外,應不斷追求新知、注意新科技的限制與應用、吸取他人寶貴經驗與研究成果對數位館藏保存實作有相當助益。

  綜上所論,數位化館藏的典藏、轉移或更新是項繁重、花錢耗時的工作,數位資訊對保存言,若不審慎處理,即可能一會兒功夫就消失殆盡。為避免重複浪費或有漏網資訊,各相關單位,包括各個圖書館、檔案館、資訊提供商等都應一起分擔解憂,分工合作、分配責任歸屬、產生規模經濟,降低維護成本。另外,也應支持與建立一國家數位圖書館機制,負起數位典藏、保存之統籌協調與運作,進而達到電子資源的Universal Available Publications。此外,重視各種對話,從人文關懷精神出發,慎選儲存媒體、重視使用者研究、使用者的評鑑以及館員的教育與訓練也都是數位館藏維護與保存的相關課題。

【註釋】

  • 註1:中國圖書館學會「圖書館事業發展白皮書」編輯委員會暨專案研究小組編撰,圖書館事業發展白皮書(台北市:中國圖書館學會,民國89年),頁12-13。
  • 註2:Brewster Kahle原作;郭凱聲譯,「網際網路的保存」,自然雜誌21卷1-2期(民國87年),頁45。
  • 註3:黃鴻珠,「中文圖書館自動化問題探討」,資訊傳播與圖書館學4卷4期(民國87年),頁35-41。
  • 註4:陳昭珍,「電子出版與電子資源的長久保存」,在電子出版與圖書館學術研討會論文集(新竹市:玄奘人文學院圖書資訊學系暨圖書館,民國89年),頁128-129。
  • 註5:The Commission on Preservation and Access and The Research Libraries Group, Inc. Preserving Digital Information : Report of the Task Force on Archiving of Digital Information., May, 1996, (http://www.rlg.org/ArchTF/tfadi.objects.htm),(檢索日期19 Oct. 2000)。
  • 註6:Heartsill Young ed., The ALA Glossary of Library and Information Science (Chicago:American Library Association, 19830), 49.
  • 註7:Ross Atkinson," Managing Traditional Materials in an Online Environment:Some De finitions and Distinctions for a Future Collection Management", LRTS, 42:1(1997), 7-20.
  • 註8:Roy Tennant, "Digital Libraries-Outsourcing Digitization", (http://www.ljdigital.com/articles/infotech/digitallibraries),(檢索日期16 Mar. 2000).
  • 註9:詹麗萍,「數位圖書館的經濟問題初探」,國家圖書館館刊89年1期(民國89年),頁19。
  • 註10:詹麗萍,「數位圖書館的資訊保存與維護」,國立中興大學圖書資訊學系八十八年度下學期「數位圖書館」課程講義(民國89年4月20日)。
  • 註11:同註5,頁129。
  • 註12:陳昭珍,「電子學術圖書館的館藏發展與維護」大學圖書館1卷1期(民國86年),頁154-155。
  • 註13:Margaret Hedstrom, "Digital preservation:a time bomb for Digital Libraries," (http://www.uky.edu/iernan/DL/hedstrom.html),(檢索日19 Oct. 2000).
  • 註14:同註4。
  • 註15:同註13。
  • 註16:同註5,(http://www.rlg.org/preserv/digpres.html),(檢索日期19 Oct. 2000).
  • 註17:同註4,頁131-132。
  • 註18:同註13。
  • 註19:Jeff Rothenberg, "Ensuring the Longevity of Digital Document," Scientific American 227:1(1995), 24-29。
  • 註20:Robert D. Cameron, "To Link or to Copy?Four Principles for Materials Acquisition in Internet Electronic Libraries," (http://elib.cs.sfu.ca/project/papers/e-lib-links.html),(檢索日期30 Oct.2000).
  • 註21:同註4,頁132-133。
  • 註22:同註10。
讀者登入
回頂部