瀏覽“江蘇省珍貴古籍?dāng)?shù)字資源集成平臺(tái)”,如同漫步在歷史長(zhǎng)卷中?!锻豆P集一卷》《憺園文集三十六卷》等文集有序排列在電子書(shū)架上,點(diǎn)開(kāi)一看,古樸厚重的線裝書(shū)一頁(yè)一頁(yè)、圖文并茂地呈現(xiàn)在眼前。
近日,南京圖書(shū)館“清人文集數(shù)據(jù)庫(kù)”上線。作為“江蘇省珍貴古籍全文影像數(shù)據(jù)庫(kù)”項(xiàng)目第一期成果,該平臺(tái)目前共收錄清人文集400部,以全本彩色掃描的方式制作成13萬(wàn)余幅高像素?cái)?shù)字圖像,并帶有檢索功能,在全網(wǎng)發(fā)布。
“南京圖書(shū)館館藏的清刻本有7萬(wàn)多冊(cè),其中不少是清人文集。”南京圖書(shū)館歷史文獻(xiàn)部主任、江蘇省古籍保護(hù)中心副主任陳立說(shuō),本次南京圖書(shū)館發(fā)布的數(shù)據(jù)庫(kù),便是結(jié)合館藏優(yōu)勢(shì),以圖像數(shù)據(jù)庫(kù)形式,集中公布了一批具有相同主題的珍貴文獻(xiàn)。值得一提的是,這其中有許多“罕見(jiàn)”文獻(xiàn),甚至有些還是僅存“孤本”。陳立介紹,例如嘉慶時(shí)期刻本吳俊《榮性堂詩(shī)集》、潘奕雋《三松堂集》等,都是存世較少的清人文集。
這些古籍是怎樣從圖書(shū)館庫(kù)房被“搬”到網(wǎng)絡(luò)平臺(tái)的呢?
陳立介紹,古籍?dāng)?shù)字化過(guò)程分為兩步。首先,要將古籍進(jìn)行掃描。古籍掃描使用專用非接觸式掃描儀,通過(guò)高像素照相機(jī),盡量不按壓古籍頁(yè)面進(jìn)行拍照;采用的光源是防紫外線的LED燈冷光源,圖片顏色不能失真,要用色卡比對(duì)。
掃描完成后,就要對(duì)這些原汁原味的圖像做數(shù)據(jù)化處理,做至少深入到第二層級(jí)的標(biāo)引,方便使用者按子目檢閱相關(guān)內(nèi)容。記者看到,每種文獻(xiàn)的序和跋都進(jìn)行了單獨(dú)標(biāo)引,通過(guò)檢索可以單獨(dú)搜索出來(lái)。“古籍的序和跋中不乏名家作品,具有較強(qiáng)的文學(xué)和研究?jī)r(jià)值,如《莫愁湖風(fēng)雅集》中就有姚鼐作的序。”陳立介紹。
平臺(tái)的開(kāi)發(fā)建設(shè)也至關(guān)重要。一方面,要完整、全面地給古籍“搬家”,還要方便、快捷地幫助使用者找到相應(yīng)內(nèi)容;另一方面,還要給后續(xù)發(fā)布的方志、家譜等多種類型的古籍文獻(xiàn)“搬家”預(yù)留接口。
古籍?dāng)?shù)字化的最大挑戰(zhàn),一是專業(yè)知識(shí),二是技術(shù)。“從事這項(xiàng)工作,需要懂歷史學(xué)、文獻(xiàn)學(xué)、目錄學(xué)等的復(fù)合型人才,還要有甘坐冷板凳的精神。”陳立坦言,南京圖書(shū)館對(duì)古籍文獻(xiàn)進(jìn)行掃描的工作從15年前就開(kāi)始了,數(shù)字標(biāo)引小組也在4年前啟動(dòng)。正因?yàn)橛羞@些基礎(chǔ)準(zhǔn)備,“清人文集數(shù)據(jù)庫(kù)”才能在近期與讀者見(jiàn)面。
不過(guò),古籍?dāng)?shù)字化到這一步還沒(méi)有結(jié)束。陳立介紹,古籍?dāng)?shù)字化的2.0版,將為古籍愛(ài)好者梳理浩如煙海的文字背后的知識(shí)邏輯順序,制作專題知識(shí)圖譜型數(shù)據(jù)庫(kù),甚至可將部分書(shū)中內(nèi)容制作成“數(shù)字文創(chuàng)”,讓曾經(jīng)束之高閣的古籍更好走進(jìn)千家萬(wàn)戶。