2010年4月28日 星期三

台大數位典藏與自動推論實驗室

上一篇提到的台大數位典藏中心主任項潔教授,底下有個「台大數位典藏與自動推論實驗室」,就是這個實驗室裡的菁英分子們,建立了現在可見的「台大數位典藏」的豐碩成果,雖然「實驗室」這個名詞對我們這些學人文的學生來說就像是另一個世界一般遙遠陌生,網站上又出現了許多看不太懂的資訊科技名詞,但是,看到以下一段文字,還是令人振奮:其實還是有許多想法和概念,是沒有疆界的。


台灣歷史數位圖書館與歷史資訊學

近年來台大圖書館與本實驗室的合作,在文建會支持下,有系統的蒐集重要的台灣史第一手史料,進行數位化全文建檔與人工標點著錄,包括了明清台灣行政檔案、淡新檔案、岸裡大社文書、古文書、地方志、札記等等。全文已經超過8,000萬字,加上其他整理取得的全文資料,總計超過一億五千萬自,應掌握超過80%之所有明清時期台灣史的第一手資料。這些資料已經建置成「台灣歷史數位圖書館」,提供全文檢索,是全世界獨一無二的台灣史全文資料庫。除了第一手史料外,我們也著手建立各種研究所需要的參考工具,如年表、中西曆轉換、人名地名辭典、官職表等等。

這個資料庫除了強調全文資料量的豐富外,更重要的是在設計上強調文史研究者需求。我們將檢索看成使用的最基本(而非最重要)的功能,強調檢索所得資料的後分類,及相關文件的連結關係。

我們所蒐集的歷史全文資料,其隱含的資訊量與知識量是極驚人的。我們相信,隨著量變而來的,將是研究上得「質變」。換句話說,隨著如此大量且易於使用的全文資料,歷史研究的方式亦應該隨之改變。而資訊科技將在這個新的研究方法論上,扮演極為重要和關鍵的角色。我們將此稱為「歷史資訊學」或「數位人文學」,這也是本實驗室以後研究的主要方法。

沒有留言:

張貼留言