標籤:
在校對過程中,查詢原書也是一件花費工夫的事。由於我們已有大部分的掃瞄的圖檔,故寫了本程式,希望能在利用「比對程式」之結果,進行校對時,根據經文中大正藏格式的資料,能立刻在電腦上秀出原書的字,以增進校對判斷速度,並讓沒有書的人亦可進行校對工作。
本程式利用線上直接看圖的功能,結合了以下數種功能:
- 最基本的看圖功能,能直接讀取 TIFF G4 格式的圖形檔,此部分程式要特別感謝楊忠權先生提供原始程式碼,授權予本協會使用。
- 尋找經文中由「檔案比對程式」(FGFC) 所產生的差異符號 {{ , 並在線上查閱圖形後,得以直接修改。如圖:
- 字串取代的功能。在經典文字處理的過程中,有許多錯誤的發生,其實都是有因有緣,有跡可尋的。OCR 有 OCR 常見的錯,使用注音、倉頡等輸入法的朋友,亦都有常犯而難以發現的失誤。故在校對的過程中,吸取錯誤經驗,並加以記錄統計,進而設計了各式的「常見錯誤字串取代表」。
除了「常見錯誤字串取代表」之外,亦有各式「缺字代換表」,故將字串取代功能整合至「看圖校對程式」之中,如此在找出不易發現的錯誤之同時,配合看圖功能,可立刻叫出原書圖檔,進而加以比較,加速了處理的速率。
如圖: