跳到主要內容

國立公共資訊圖書館

Menu

讀者服務

本館出版品

臺灣省文獻委員會典藏日治時期檔案數位化

文:蕭富隆(臺灣省文獻委員會組長)

【摘要】

  臺灣省文獻委員會典藏日治時期檔案文書為特色,民國八十六年起展開為期五年的數位化專案,頗受矚目。預計將完成的資料量,單僅文件掃描為影像檔即達八百萬至一千萬頁之間。介紹其具體做法是本文主要目的。無關理論分析,純屬實務上的見解,交流工作經驗之作。

【Abstract】

  The Historical Research Commission of Taiwan Province holds lots of archives of the Office of Governor-General in Colonial Taiwan. The Commission started to digitize all the archives since 1997. So far, there are about ten million pages scanned. This article intorduces the way that the Commission digitized the archives, and shares experiences.

關鍵字:數位檔案

Keywords: Digital Archives

壹、前言

  檔案為典型的歷史文獻。將有價值的文獻史料數位化的努力,在臺灣已行之有年。有許多博物館、美術館、圖書館或學術研究機構各自開發完成各類型圖書文獻或文物史料資料庫,提供線上使用。但隨之而來的是資源如何整合的問題。每一個資料庫的開發都是鉅額的時間與金錢的投入,如何避免重複投入、浪費資源,在學界以及文化界逐漸有學者與專家提出質疑,受到關切。更多的機關、公私團體投入工作,固然有助於此一事業蓬勃發展,但各自為政,聯繫不足,不僅無法推動交流互惠,並且有礙整體的進步,實非國家社會之福。

  數位化的意義在將原始的資料轉換為電子訊號,達到長期保存資料並提供廣泛流通的目的。拜科技技術進步之賜,近年來,不論是文字或非文字資料,都已能以電腦建檔處理,品質不斷提升之中。然而,科技進步是一件好事,但也是一項變數。不同團體使用電腦科技的理念及方式不盡相同,整合利用是一件長久以來即已存在的問題;而科技技術不斷進步,復使各種系統新舊雜陳,增加整合的困難程度。同一機關、團體處理資料數位化的作法,前後都恐難一致,推動跨館際合作模式,困難度越高,可想而知。有無可能建立共通性的作業規範,或者提供館際之間相容的資料庫系統,乃是一項各館應該面對的嚴肅課題。不管如何,增進彼此瞭解,交流經驗,應是此一階段可以先行推動的工作。筆者有幸參與臺灣省文獻委員會典藏檔案數位化工作,願就所知提出心得,就教方家,也算是經驗的交流。本文沒有深刻的理論分析與建構,純粹是實務上的見解。檔案數位化工作包括目錄建檔、原始文件影像掃瞄以及系統軟體開發三大部分。本文亦僅著力於原始文件影像掃瞄方面的介紹,這是因為限於時間及篇幅。底下先就檔案性質概括性介紹,再說明影像掃瞄實際作法,最後就未來可能面臨的課題提出個人淺見,就教各方專家。

貳、特藏檔案性質

  臺灣省文獻委員會與中央研究院在民國八十六年十一月簽訂學術合作協議,將以五年為期從事日治時期檔案數位化計畫。此計畫簡稱為「光碟專案」,包括兩部珍貴檔案原始文件及其目錄的數位化。這兩部檔案,一部是臺灣總督府府內各部、局、課、係保存之文書,檔案涉及日治時期臺灣地區政治、社會、文教、經濟、建設……各個層面施政的情況,稱為「臺灣總督府檔案」。檔案總數量一萬五千餘卷。另一部是獨立於臺灣總督府之外的專賣局業務檔案,稱為「臺灣總督府專賣局檔案」,約一萬卷。這是一部包括樟腦、食鹽、煙草、鴉片、糖務……等專賣事業的經濟類文書。兩者皆是研究日治時期臺灣史不可或缺的原始史料、珍貴的文化資產。將這兩部檔案一頁頁進行掃瞄、編製目錄並建檔、開發系統軟體,使成一套影像資料庫,乃是此一專案的主要任務。

一、檔案內涵

 (一)臺灣總督府檔案

  「臺灣總督府檔案」原收藏於臺灣總督府官房文書課的大書庫內。包括「臺灣總督府保存文書類」永久保存卷冊6,789卷、十五年保存卷冊3,226卷,這是最為典型的檔案文書。另外,曾設立於總督府內但因業務已完成而撤銷之機構,如臨時土木局、糖務局、高等林野調查委員會、臨時臺灣土地調查局、人事任免、地方行政機關申請國庫補助、借款關係等之文書卷冊1,104四卷,加上收發文簿、類別目錄、總目錄等文書處理上之登記簿、原總督府內法務部(課)、會計課之參考文件等,使檔案數達到15,062卷之多。此外,西元1895至1901年臺北、新竹、臺中、臺南、嘉義、鳳山、臺東各縣、廳的地方行政文書,即所謂「舊縣文類纂」783卷,亦由當時的臺灣總督府直接管理,一併移轉省文獻會典存至今,通常亦歸併計算於總督府檔案之中,合計檔案總數共15,845卷。統計如下:

檔案類型 卷(冊)數 起迄年代
臺灣總督府保存文書類案(包括其他保存文書類) 11,190 明治28年至昭和20年
臨時臺灣土地調查局各類文書 1,904 明治31年至明治38年
高等林野調查委員會公文書類 91 大正3年至7年
特殊文書:土木局公文類纂及糖務局公文類纂 35 明治35年至明治44年
台灣施行法規類文書 70 大正3年至昭和7年
文書處理用登記簿 1698 明治28年至昭和20年
舊縣公文類纂 783 明治28年至明治34年
其他類文書 74  

 (二)臺灣總督府專賣局檔案

  「臺灣總督府專賣局檔案」為日本治臺時期實施專賣制度之總管理機關之文書記錄。就文書內容而言,不僅是研究日治時期各項專賣史的重要檔案,而且因專賣收入平均占當時台灣總督府歲入四成以上,因此也是了解日治時期臺灣經濟、財政情況不可或缺之直接證據。

  臺灣總督府實施專賣制度,始於明治三十年(一八九七年),以律令發布「臺灣鴉片令」,實施鴉片專賣制度首揭其端,之後漸次增加專賣項目,至日治末期昭和二十年初,專賣物品包括有鴉片、鹽、樟腦、煙草、酒、酒精、石油、火柴、度量衡、鹽滷汁等共十項,當年六月十七日始廢除鴉片專賣,減為九項。檔案歸檔分類前後變動頗大。

  「臺灣總督府專賣局檔案」是在民國四十五年五月及民國八十三年八月分二次送交省文獻會典藏,目前仍在進行編目整理。中研院與省文獻會現正根據其原始歸檔的概念與分類,試將各類文書還原其原貌。包括庶務課、經理課、檢定課、製造課、腦務課、煙草課等單位文書。其中,「鹽務檔」原先典藏於中央研究院近史所檔案館,亦將併入此一專案,同時整理,未來將合併建立聯合檢索目錄。

  臺灣總督府於明治三十九年正式將專賣局獨立出來之後,原由總督府內文書課保存並已裝訂之樟腦、食鹽方面的文書,分別在明治三十七年、四十一年兩次拆解彙整送交專賣局保存。故「臺灣總督府專賣局檔案」實亦包括該局成立前之部分專賣資料,其與「總督府公文類纂」無法分開,互相關聯。「光碟專案」將此兩部檔案一起納入,除有資源運用上的考慮之外,實亦資料的特性,不得不然。

二、保存狀況

  省文獻會接管日治時期檔案前後歷經數年,分次完成。「專賣局公文類纂」係於民國四十五年及八十二年七月,分二次自菸酒公賣局移轉管理。至於「臺灣總督府檔案」,則比較複雜。日治時期係由臺灣總督府官房文書課負責整理保管,臺灣光復後,民國三十六年初,由臺灣省行政長官公署秘書處文書科接收。省府改制後,仍由秘書處文書科管理,及至民國四十二年七月初,始分批移轉至省文獻會。

  省文獻會在接管「臺灣總督府檔案」之初,暫時庋藏於臺北市延平南路一帶。隨後歷經多次搬遷,並無固定典藏庫房,有時以租借民房代替庫房,極其克難,實不利於檔案典藏與整理。空間環境、恆溫濕設備,更難符合理想要求。省文獻會為謀求典藏環境改善之道,經奉省政府核准於南投縣中興新村現址興建臺灣歷史文化園區,其中「文獻史料館」的規劃,以典藏日治時期檔案為特色,民國八十一年落成。自此以後省文獻會接管的日治時期檔案,始獲得一固定而較佳之典藏處所。

  兩部檔案狀況以「總督府檔案」整理較具系統性,亦曾拍攝微捲,開放調閱使用。「專賣局檔案」過去較未受到重視,整理編目,限於人力、專業知識及經費,並未進行。因此,「光碟專案」在處理「專賣局檔案」方面,乃需從最基礎的檔案清查、分類著手,增加許多時間及人力成本。兩部檔案皆為手稿文書,絕大部分以毛筆繕寫而成,紙質優劣不一。或因日久風化,或因長期潮濕、蠹蟲肆虐影響,狀況不佳,亟待妥善維護保存。近十幾年來,臺灣史研究日驅熱絡,蔚為顯學。要求開放利用呼聲日高,提供微捲調閱使用的服務,限於影像品質、調閱方式、列印成本過高等缺點,已不敷讀者的需求。既要提升閱覽利用的品質,又必須審慎保存維護,兼顧兩面利弊,這是檔案數位化面對的挑戰。

  日治時期檔案絕大多數雖然都已裝訂成卷(冊),外觀形式與一般書籍類似(請參閱圖一)。但是,每一卷(冊)檔案乃是以文件為歸檔單元,每一單元彼此是分立的,並無頁碼。處理圖書分類、編目,可以一冊冊書本為單位,處理檔案文書則必須一頁頁加工,從編頁碼開始(請參閱圖二)。兩部檔案的目錄,估計將超過五千萬字;文件總頁次約一千萬頁。一頁頁加工、掃瞄,如何有次序、有效率的進行,是嚴苛的考驗。

參、流程與規範

  檔案數位化技術上牽涉資訊科技與歷史學專業知識,需要多方人才的配合。臺灣省文獻委員會與中央研究院在交流互惠的前提下締結學術合作協議,期程共計五年,從八十七年度準備起,預計民國九十一年完成。此一專案在檔案清查、目錄整理、系統軟體開發方面,由中央研究院負責完成。省文獻會負責檔案典藏管理、提卷、編碼、拆卷、查驗、裱褙維護、抽驗和解決工作進行中發生的問題。檔案文件掃瞄則甄選具有專業經驗與能力的公司駐點服務。

  「駐點服務」是指獲得委辦權利的的廠商,其設備及人員必須於省文獻會指定的場所服務。這是因為檔案文書為原始性手稿文書,極為脆弱,不堪長途搬遷,避免冒不必要的風險之故。這是執行此一專案基本上必須遵守的原則。其次,在實施策略上,決定目錄建檔及影像掃瞄先行進行,系統軟體開發在後。亦即,先處理Data,再撰寫Program。這是因為考量人力資源有限,尚無足夠材料測試運作,資料庫軟體亦無用武之地,況且電腦科技技術日新月異,應避免過早的投資浪費。本案在Data的處理上,選擇通用存檔格式,即目錄文字為.txt檔標準格式,影像檔為24bit全彩.jpg格式,壓縮比90%,且為單一檔名格式(single file name)。.txt檔具有開放性、擴充性優點,允許轉換為時下多種資料庫應用軟體使用。.jpg影像檔標準雖然仍有爭議,但亦是開放性檔案格式之一,使用普遍。

  此一專案決定使用此種檔案格式,其實是經過上百種組合測試而做的選擇。各種組合條件,列述如下表:

各種組合條件列述表

  壓縮比測試至50%以下,某些讀者可能覺得沒有必要,因為講究影像品質者,例如文物、古董、攝影作品、藝術作品,重視色彩、線條、質感的精準度,必不輕易壓縮,如有壓縮,大致上不會低於75%以下。而本案為檔案文書的掃瞄,雖然亦需盡量寫實,以期保存史料原始風貌,但是程度上不能與藝術、文物相比。畢竟日治時期檔案文書史料多達一千萬頁,亦即將有一千萬張影像掃瞄。倘若每一張影像檔案大小增加1MB,總和即增加一千萬MB,不容小覷。維持影像優越的品質與成本效率的考量,恐怕無絕對標準答案,適中便是好的選擇。

  日治時期檔案文書尺寸接近B4,以全彩模式、150DPI掃瞄、存成.jpg格式、壓縮90%結果,每一影像仍有2MB大小,不過相較於原始圖檔15至20MB而言,已減少許多。影像品質經過多位史學專家評鑑,亦能接受。以雷射印表機做16階灰階列印,樣張如圖三,已遠比微捲片列印清晰許多。這些2MB左右的圖檔,每日平均以八千張的速度進行掃瞄,按檔案卷(冊)、文件順序及頁次碼儲存成單一檔名。其規則如下:

機關別  卷(冊)號  門號  類號  目號  文件號 頁次號
□□□-□□□□□□□-□□□-□□□-□□□-□□□-□□□□

  以上命名規則有助於將來系統運作的效率,資料庫系統開發者只要遵循此一規則設計軟體,不至於產生相容性或編碼、解碼的問題。因此,這是一個開放性的架構設計。當一卷(冊)檔案掃瞄完畢時,不論頁數多寡,即以四倍速燒錄於光碟片上。原則上一卷(冊)檔案,燒成一片光碟,如果超過一片,則以1/2、2/2表示之。此即「光碟專案」的母片。目前每日產能約25至30片光碟,累計已達七千多片。當然,一張影像2MB還是太大,將來實際線上運用,仍須批次轉檔。目前省文獻會批次轉檔約完成二千餘片,並以每日一百餘片速度增加之中。將來完成者為子片,與母片分開存放,其圖檔大小約120K左右,品質相差無幾(以相同印表機列印如圖四),但操作使用效率卻提高許多。

  以上除技術規範之外,人員進出操作場所,遵守一定紀律,訂定管理規則,亦是整體作業不能欠缺的一部分。本計畫總投入人力,專責部分即有二十餘人,但其實大部分是操作員,不必很高的學歷或深奧的專業知識。勤快、負責而能遵守紀律反而更重要。人力總投入將在後面詳加介紹。此處先說明所謂作業流程問題。

  影像掃瞄是一件動作重複性很高的工作,為避免數量龐大的文件亂成一團,簡明的作業流程極有必要。從另一角度而言,程序既定,則牽一髮而動全身。事先演練,建立模式確有必要,以免計畫途中面臨困擾,陷於兩難窘境。不修訂作業方式則無法概括適用,欲修訂則需重頭做起。

  底下是日治時期檔案數位化--影像掃瞄的作業流程。

日治時期檔案數位化--影像掃瞄的作業流程

  影像掃瞄作業大部分工作由受委辦廠商(即駐點服務廠商)人員完成,但其中抽驗、文件提領及清點查驗乃是由廠商與省文獻會配合進行,點驗則加上中研院共三方代表共同會驗,每二個月乙次。通過會驗者移存庫房,此即所謂母片。

肆、前置作業

一、清查、編目

  「臺灣總督府檔案」的保存較為完整,前此已有微捲之拍攝及總目錄製作,然而對於檔案本身之現況及圖檔的紀錄則付之闕如。因此,清查工作主要側重於圖檔、圖表及檔案本身的保存狀況,建立較為完整的紀錄。

  「臺灣總督府專賣局檔案」包括:庶務、會計、阿片(鴉片)、樟腦、食鹽、煙草、酒、度量衡、燐寸(火柴)、石油等類別。由於「專賣局檔案」亦為日治時期政府官方文書,故比照總督府公文類纂的整理原則處理,以收體例一致、互相參照利用之效。

  清查步驟,首先依據總督府專賣局總目錄對於公文的保存年限的規定,區分為:永久保存、永久追加、永久別冊、二十年保存、二十年別冊、十年保存、十年別冊、五年保存、五年別冊、其他等十種類型,再依據年代、門類次序,訂定系統性的檔案編號。

  「臺灣總督府檔案」文書在民國八十四及八十五年時曾經進行過清查,大致上已經就緒。「總督府專賣局檔案」清查,則從民國八十六年六月開始著手進行,這是檔案製作光碟前置作業的第一項任務。只有完整而有序列地清理檔案,確定分類、順序,後續的工作才能有條不紊的推動。本項工作由中研院助理研究員專任負責,共有四位人員。近史所、社科所、台史所、經濟所,每週一至二天派員指導助理研究員持續進行;另外,清理檔案最重要的任務是建立目錄,目錄輸入建檔亦由中研院負責完成。將來結合影像資料,成為可供檢索利用的系統,便是一部影像資料庫系統。

二、提卷、編碼、拆卷

  檔案經過清查之後,按順序排架典藏。其進入影像掃描室之前,首需辦理一定的提卷手續。此一手續明確管理員及專案工作人員之間的權責。換言之,檔案進出典藏室,進出都必須經過一定的認證手續。這是管理上必須講求的紀律;同時也因每日進出典藏室的文件往往高達數十卷甚至數百卷,更有必要清楚記錄經管人員、冊數及檔案冊號的登記。另外,由於有些文件尚待裱褙維護、某些文件破損嚴重,若無提卷紀錄,則難以控管品質。提卷是文件離開典藏室必經的第一道程序。

  檔案文書雖然有一定的歸檔順序,但是並無一致性的頁碼,這是與一般圖書最大的不同。圖書管理以「冊」為管理單位,每一冊書的形式通常具有一致性,但是檔案文書卻欠缺頁碼,而必須一頁一頁編碼。(請參閱圖五)檔案管理因此是以「頁」為單位,倍增人力上的需求。文件為何必須編碼呢?這是因為文件的掃描是一頁頁進行。雖然僅只二、三頁,亦必須編碼,何況本計畫將進行之文件掃描估計在八百萬至一千萬頁之間,文件一頁頁如何有條不紊地掃描並且正確無誤地歸位,便是一門很大的學問。為每一張文件編上頁碼,乃是為了能夠確保該文件最後得以恢復原狀的手段。不過,編碼之後仍然不能直接進行掃描,因為檔案在歸檔時大都經過裝訂。裝訂的手續或繁或簡,是保存檔案文書常見的方式。「總督府檔案」亦是,而且,因檔案文書歸檔年代長久,有些紙質鬆脆、變形,益增管理上的困難度。在將文件送往掃描室之前,拆解整卷(冊)檔案,使其一頁頁分離便是「拆卷」。

  「拆卷」的速度比「編碼」還要慢,目前由臺灣省文獻委員會僱請臨工負責此一任務。每人每天編碼約一千八百頁,但是拆卷的速度約僅一千二百頁。臨工還負責文件掃描完畢之後的檢查,確定文件確實一頁頁點交掃描,又一頁頁完好無缺返回。查驗的手續完成之後,文件仍然是分散的,因為每日將近完成三十冊檔案文書的作業,並無法一一立即裝訂回去,這時必須以無酸卡紙,妥善保裝,並註明檔案卷冊號碼,以防散佚。

  從提卷、編碼、拆卷到完成查驗,檔案文書掃瞄、燒錄光碟的作業才算完成一個循環。當文件入庫恢復原先的典藏排架順序,整個作業才算完滿告成。

三、裱褙維護

  裱褙維護檔案文書原屬經常性管理工作,但是在「光碟專案」進行期間,卻必須配合相關作業程序而調整步驟。首先,文件的裱褙乃按檔案的卷(冊)號順序加以分類分級,訂定維護的先後原則。基本上如果現代的裱褙技術仍無法克服的損耗等級情況,亦即文件已嚴重毀損,暫時無法修護完成者,加以註記,包裝封存,暫時排除在計畫範圍之內。如屬可以裱褙修護者,始排序提送裱褙。為了配合影像掃瞄所需,某些情況發生時無法按既定修裱順序進行,這時破損文件是以「急件」方式送抵裱褙室維修。例如:某一卷檔案,絕大部分都完好無缺,僅三、四頁文件需先行裱褙而後才能掃瞄,倘若為了等這三、四頁文件而耽誤其餘,恐有得不償失之虞,因此必須優先處置。裱褙維護因而必須處理許多「急件」工作。裱褙維護作業也就因此而與「光碟專案」密不可分。如何讓裱褙工作有效支援「光碟專案」,其分工合作的條理與系統乃是一件高難度的流程控制。

  省文獻會經常性投入八位技術人員支援這項工作,並且有二位同仁專責於檔案裝訂,總共是十位同仁。每人每天大約處理三十頁文件裱褙,全部都是傳統手工裱褙方式。

伍、人力配置

  檔案文書清查、編碼、拆卷、提卷掃瞄、查驗、抽驗、裱褙維護等作業之間的關係,圖示如下。

檔案文書清查、編碼、拆卷、提卷掃瞄、查驗、抽驗、裱褙維護等作業之間的關係

  「抽驗」的工作任務在確保影像掃瞄品質。駐點服務的廠商本身即有雙重的品檢關口,即上節流程圖所示「初步檢驗」與「最終檢驗」兩道程序。此處所示者為省文獻會在影像製作過程定期性的品質抽驗,由七位同仁輪值服務。每週至少抽查四百張影像,做成記錄。抽檢不合格者,該卷(冊)檔案文書必須重新製作。這一部分人力為兼辦性質,非專責人員。但是他們的學識背景都是碩士以上且精通日文者,對檔案文書性質、分類都有三年以上經驗,平時從事檔案翻譯研究工作。

  檔案的「清查編目」由四位研究助理負責,兩兩一組,分別負責「臺灣總督府檔案」及「專賣局檔案」清點、分類、編製初步目錄,這四位人力是專職人力。

  「典藏室」管理由省文獻會兩位同仁負責,此一人力雖然不完全是專責人力,但大部分時間都是在處理「光碟專案」。因為所有的作業程序幾乎與典藏管理不可分離。例如「裱褙維護」所需的提件、維護紀錄、轉送製作影像……都必須透過典藏管理人員登記,以明權責並協調進度。裱褙及裝訂檔案文書的人力共有十位。這是支援性人力,在文件掃瞄過程中,處理文件緊急修護的工作,使掃瞄程序的進行不至於因文件過於破損而耽擱下來。當然,整套作業難免因操作不甚而有危及檔案文書者,必須修護文件時,這十位人力便可及時支援。

  省文獻會負擔較大的人力需求在檔案文書的拆卷與編碼前置作業,總共有專責的臨時工讀生十位投入。其任務是在文件送交廠商掃瞄之前做好排序的工作,一以確認移送掃瞄卷(冊)有正確的紀錄,另可預防龐雜的檔案散佚或相互雜陳,有稽證的作用。此外,為使文件經掃瞄建檔後,安全而完整的歸還,在入庫典藏之前,這部分人力仍須就文件及掃瞄記錄核對確認,此即所謂「查驗」。

  「提卷掃瞄」由駐會廠商處理。本案在甄選過程中,技術能力的評比除了影像掃瞄的品質、效率的考量以外,最受主辦單位重視者為廠商在人員的投入與管理規劃構想。文件數位化的投入成本之中,機器設備所佔比率並不高,反而是人力經費佔最大部分(如圖六)。廠商除了管理階層不定時巡視督導之外,平時駐點服務維持之人員至少有十四位。其組織架構如下:

廠商組織架構圖

陸、未來的課題

  兩套近千萬頁的歷史文獻數位化的努力並不容易,惟因歷史文獻乃屬國家文化資產、無價之寶。對於臺灣曾在日本帝國主義者統治之下,社會、經濟、政治、教育…各方面的發展與變遷現象,提供第一手的史料,這兩套檔案絕對值得再多的人力及資源的投資。數位化以後,檔案原始文件將轉換為電子訊號儲存,傳之久遠,成為臺灣地區世代子孫共享的文化財。檔案的目錄數位化之後的用途及使用上的效率,都將比現況超越許多。這兩部分的工作在五年計畫中,已率先進行達二年時間,接近完成總計畫一半之進度,資料庫軟體則正開始初步架構之中。但這並不表示此一專案計畫已接近成功階段。事實上,現階段數位化的成果僅止於文字或影像的處理,這是Data的部分。只要採取開放性檔案格式,後續應用及未來發展基本上不至於產生自我設限的情形;但是若僅作到Data的處理,則整個計畫目的才完成一半而已。另一半的工作是如何將文字與影像聯繫在一起,這就牽涉到系統軟體開發,亦是此一專案未來首需面對的課題。嚴格而言,資料處理比較不牽涉館際間能否推動交流合作的問題,但是系統軟體的建置情形就不一樣了。若干學者、專家主張建立所謂共通性規範,在系統方面的困難其實遠比在資料處理上還要多。

  其次,本計畫在大於A3尺寸的圖檔方面,暫不處理。這是因為目前大尺寸文件掃瞄技術(或數位攝影技術)仍未盡令人滿意。技術上可行,例如以饋紙式掃描器替代平台式掃描器,但是對古老的文件而言,風險顯然太大,效益亦不佳,成本高昂、速率仍低。將來仍未解決之前,這部分圖檔將暫不提供線上使用,是另一件未來待決的課題,此一課題實際上是科技進步的問題,科技是一項變數。大約在四年前,處理影像的資料庫幾乎不會採用全彩模式,當時的掃描器在擷取彩色影像時,仍須分三原色、三次掃瞄讀取。一張B4大小的彩色文件,掃瞄時間恐怕需耗費數分鐘之久;原始圖檔如超過10MB以上,個人作業系統幾無運作能力。當時採用黑白影像情形普遍,這是科技的條件問題。任何系統軟體在經過三至四年(甚至更短)通常即面臨升級、限制工作範圍、改版或重新撰寫程式的壓力,這即是科技的變數。本計畫在策略上把系統軟體開發暫置於資料處理之後,原因即在此。況且,此計畫完成者為數TG的影像資料庫,Server端問題可能容易解決,但User端有大環境是否能配合提升的困難。因應潮流趨勢,「光碟專案」完成的影像資料庫,斷非直接以數千乃至數萬片光碟母片直接利用,仍然必須考慮藉助網際網路直接運用的可能性。未來透過網路運用至少必先解決四項課題,第一為網路頻寬。第二為中日文字碼及作業平台整合問題。第三為列印品質(圖檔高度壓縮之後失真、列表機解析度的問題)。第四為版權利益。前三者其實為科技發展大環境的問題,最後一項則為制度規劃的問題。目前在法令面顯然相當模糊,實務面則因館際間合作及互動仍嫌不足,交流互惠的原則不易建立,恐怕仍有一段路要走。所謂建立「數位化」共通性的標準或規範,避免各自為政,應該不僅於討論技術規範如何整合,而是研究一套制度如何運作的問題。

柒、結語

  省文獻委員會、中央研究院長達五年的合作案,試圖建立一套歷史文獻數位化的模式,應是近幾年國內少見嘗試以全彩模式保存文獻史料的資料庫系統建置與開發。十一月十一日正逢本計畫推行滿二週年,乃在中研院近史所檔案館舉辦「台灣總督府檔案數位化初步成果展示會」,邀請學界人士約150餘人參加。反應尚稱熱絡。基本上這並非表現績效的展示會,而是此一大型的專案在經過兩年的推行,到底成效如何,應該公開向社會作個說明。其次,目前此一專案正進入到必須思考將來運用資料庫的問題,希望能集思廣益,邀請未來的讀者、使用者提供卓見,以便於納入規劃設計。因此,展示會實亦即蒐集意見反應的機會。

  展示發表會上頗受矚目之問題為:何時能夠開放利用?此問題會中並無定見,但基本上朝分階段、局部開放應是可行之策,亦是省文獻會與中研院已建立之共識。現階段的開放方式將限於「單機」使用,但是目錄會在網路上提供查詢。「單機」開放使用,情況與利用微捲機調閱有些相像,但是品質及使用效率將大幅提昇。目前省文獻會正在研擬「光碟專案」初步成果利用規則,相信不久的將來讀者即能享受到更高品質的服務。

  典藏品「數位化」之後,在資料的保存與運用上,確實有許多的便利,但是「數位化」絕不是一種流行。欲數位化的典藏是否具有極高的價值、整理編目的前置作業是否準備就緒、建置資料庫成本與效益是否相當、技術的可行性等,都應經過審慎的評估。

檔案典藏庫房

圖一:檔案典藏庫房

檔案拆卷、編碼,並用綿繩暫時固定

圖二:檔案拆卷、編碼,並用綿繩暫時固定

原始圖檔,大小約2332KB

圖三:原始圖檔,大小約2332KB

批次壓縮後圖檔,大小約253KB

圖四:批次壓縮後圖檔,大小約253KB

逐頁查核掃瞄記錄

圖五:逐頁查核掃瞄記錄

影像掃瞄室共有卅餘部PC自成一區域網路

圖六:影像掃瞄室共有卅餘部PC自成一區域網路

讀者登入
回頂部