CBETA 與中央研究院近日正式簽訂合作備忘錄(MOU),雙方確立以中研院開發的「中研院文字辨識與校對平台」(https://ocr.ascdc.tw)共同推動民國佛教期刊與近代佛教文獻的數位化工作,為佛教界與社會大眾保存更多元豐富的佛教文獻資產。
「中研院文字辨識與校對平台」是由中研院數位文化中心運用影像處理與深度學習技術研發,在中文古籍與複雜版面處理上具備領先能力,包括:
- 文本版式偵測:能辨識多欄、直排、橫排、圖文混排等多種複雜格式。
- 高精度文字辨識:於香港中文大學舉辦的「中國古籍文字自動識別挑戰 2021」競賽中,以近 91% 的準確率獲得冠軍。
- 文本語意預測:可根據上下文推薦合適文字,並依使用者回饋自動修正,大幅提升人工校訂效率。
- 多人協作與版本管理:支援大規模期刊與文獻的長期數位化流程。
這些技術對民國時期的佛教期刊尤其關鍵——此類文獻欄框複雜、版型多變,又因年代久遠、多次複印造成許多字形模糊與缺損,一直是文獻數位化工作中難以跨越的瓶頸。現今結合中研院的技術優勢與 CBETA 累積多年的文本處理經驗,將能有效突破這些長期存在的難題,全面提升辨識與校訂品質。
本次與中研院簽訂 MOU,象徵佛典數位化工作邁入新的階段。未來,CBETA 也將在此合作基礎上持續精進數位化技術與流程,並積極思考社群參與、志工校對等模式,使大眾不僅能閱讀文獻,更能成為文化保存的重要參與者。
誠摯邀請關心佛教文獻保存的朋友持續支持 CBETA,期盼凝聚眾人的力量,共同守護珍貴的近代佛教文化資產。

圖說:《海潮音》為民國時期最具影響力佛教刊物,可視為當時佛教界思想的縮影。

圖說:中研院文字辨識與校對平台操作畫面

圖說:透過平台的 AI 辨識技術,複雜版型亦能正確處理文字順序