數位工具百寶箱 | 次世代數位圖書館

(っ◔◡◔)っ ❤️不必點滑鼠點到肌腱發炎,咻一下就能到達文獻定位點!

親愛的讀者~你知道日本國會圖書館近年來分別提供了全文檢索及定位標記功能嗎?

這可是文獻研究者的一大福音!

日本國會圖書館迄今已利用人工智能輔助的 OCR 技術,提供約 355 萬冊圖書等資料的全文檢索 ,並於 2024 年 10 月導入定位功能,可搭配全文檢索,以圖釘顯示關鍵字在數位圖像上的位置。

但是,你知道在日本國會圖書館主檢索系統的全文檢索,「不是」完整內容的全文檢索嗎?🫨

根據日本國會圖書館官網的 Q&A 但書,及小編的實測,即使在主檢索系統勾選進階檢索「古典籍資料(貴重書等)」,仍無法全文檢索某些已 OCR 的珍稀古籍,但這些古籍對我們考證佛典卻又很重要。

該怎麼辦呢?😱😱😱

小編最近發現——佛學研究者若要應用這項全文檢索功能,還有一個祕密武器,那就是附屬於日本國會圖書館的✨「次世代デジタルライブラリー」(次世代數位圖書館)✨!

次世代數位圖書館就像是日本國會圖書館的九又四分之三月台!

在這個神秘的檢索系統,不僅可以檢索珍稀古籍的全文及類似插圖,還可以在 My Page 留存個人查詢歷史,並設定標籤。而且檢索畫面非常簡約易讀!

小編對校佛典時終於不用再一頁一頁點擊滑鼠,點到手指僵硬了。🥹

◈…◈…◈…◈…◈…◈…◈…◈…◈…◈…◈…◈…◈…◈…◈…◈…◈…◈…◈…◈

話說,在校訂過程最累的兩個環節,就是要找到適用的文本,並找到對應的段落。

以前我們在找對校資料時,可能會遇到什麼問題呢?

一、無效的書名查詢:

資料庫建立索引的書名摻雜無法辨識的符號,或與藏經收錄的書名略為不同。

如 X1392《月磵禪師語錄》在日本國會圖書館的主檢索系統,顯示題名為 《月〓和尚語錄》,若檢索「月磵禪師語錄」,結果是 0 筆資料;檢索「月磵」,只會搜尋到 5 本派不上用場的書籍;檢索「和尚語錄」,則有 982 筆結果!🫠

二、難以找到對應處:

以前,在找到對應文獻後,我們首先得透過 CBETA Reader 或 CBETA Online 右側的拉軸猜測對應文本的可能位置,再透過反覆檢索不同字串的方式,逐步逼近真正的對應位置,這會耗費我們許多時間和心力。

如果遇到分冊方式不同的文本,或是遇到疏鈔類的佛典(譬如在對校的兩個本子裡,其中一個本子載有佛典經文及疏鈔科文,另一個本子則只有疏鈔內容),這時候就沒辦法繼續仰賴拉軸位置猜測法啦!我們得花更多時間才能找到對應位置。😫

而✨次世代數位圖書館✨能大大改善前述問題。🥰🥰🥰

☝️在使用次世代數位圖書館時,有什麼需要留意的地方呢?

一、慎用檢索字串:

有時候不是沒有收錄某份資料,而是我們需要找到正確的鑰匙!🔑

選擇檢索用字時,需留意像是含有「日」「月」、「扌」「木」這些不容易正確辨識,或古籍俗寫時容易被混用的部件,我們可以改用不同的檢索用字來測試。此外,OCR 技術雖然越來越好,但仍可能有辨識錯誤的情況,而像是「磵」、「椉」這樣的罕見字,更是需要避開的檢索字。

二、搭配進階檢索功能:

以《月磵禪師語錄》為例,可輸入要檢索的字串,如「老古錐」,再搭配檢索條件題名「語錄」等條件,有助於限縮檢索範圍哦!

㊙️題外話,如果是在日本國會圖書館的主檢索系統,就算使用前述的全文檢索字串,也找不到《月磵禪師語錄》哦!

奇妙的是——當我們根據全文檢索在次世代數位圖書館找到題名「月〓和尚語錄」的佛典,再回主檢索系統搜尋此題名,是找得到這部佛典的!

然而,雖然這部佛典已經過 OCR 處理,主檢索系統卻不提供這部佛典的全文檢索!

幸好,我們還能在次世代數位圖書館進行珍稀古籍的全文檢索!

三、搭配不同的檢索系統:

雖然在次世代數位圖書館可以對珍稀古籍進行全文檢索,但畢竟日本國會圖書館的主系統可以檢索更多其他類型的近代文獻。所以,如果你不只是想對校古籍,而是想進行更廣範圍的文獻檢索,那麼,搭配不同的檢索系統,有助於探索更多元的內容!

四、工具只是輔助

依不同的工具使用方式,會改變呈現的結果,而所有人造的工具或產物都可能有人為瑕疵。

當我們對工具不抱有「提供標準答案」的期待,就能取其優點,水漲船高囉!

🔜 次世代數位圖書館的入門使用方式請參考圖說!👉

#CBETAers都在做什麼
#校訂組在做什麼
#數位工具百寶箱
#聞編

資料來源:

  1. 次世代數位圖書館由此進:https://lab.ndl.go.jp/dl/
  2. 日本國立國會圖書館數位館藏【全文檢索介紹】,https://dl.ndl.go.jp/fulltext-search
  3. 日本國立國會圖書館數位館藏【常見問答】,https://dl.ndl.go.jp/en/FAQ
Donate