現在CB上的缺字開放網友幫忙查詢Unicode
http://dict.cbeta.org/word/help_find.php
看了之後也想幫忙查字回饋一下CBETA
但後學有一個疑問
印象中CB缺字的Access資料庫中
每個缺字似乎都有《今昔文字鏡》的M碼
(不是很確定,只看到一個螢幕擷取)
而《今昔文字鏡》已經推出了Unicode版,
可以查詢Unicode
這代表《今昔文字鏡》內部一定有個轉譯器
可以連結M碼跟統一碼
只要取得這項資料
是否就可將CB缺字資料庫中待查unicode的缺字
很快地用程式去查到Unicode
再用人工比對一下Unicode字(Win8 新細明體)與大正藏紙本上的字(影像檔)
這樣是不是比較快?
還是我漏掉什麼地方沒考慮到?
CBETA愛用者 合十
CB缺字查詢Unicode的一個疑問
chen - 週六, 2014/08/23 - 12:44
討論區:
Re: CB缺字查詢Unicode的一個疑問
您好:
謝謝你提供的資訊,我們會再參考文字鏡的資料。
我們目前大約有三萬字的缺字(以Big5的標準來看),而有M碼的只有七千多一點,那些是早期才有查詢M碼,後來的缺字都沒有M碼的紀錄了。
原來如此
謝謝解疑。那還是真的要一個字一個字人工去查。
Unicode 7.0已經推出了,但沒有新增漢字。聽說日本研究大正藏的SAT組織,已經向統一碼組織提出了一個提案(IRGN1858),這個提案預計在未來的「擴充F區」中,新增六千多個大正藏當中的罕用字,如果屆時提案通過的話,CBETA大正藏當中絕大部份的組合字,都可以找到對應的電腦字,這在促成佛經的數位化上,應是美事一樁。
CBETA愛用者 合十
☸☸☸☸☸☸☸☸☸☸☸☸☸☸☸☸
三世諸佛共說此心
吾有一軀佛 世人皆不識
不塑亦不裝 不雕亦不刻
無一塊泥土 無一點彩色
工畫畫不成 賊偷偷不得
體相本自然 清淨常皎潔
雖然是一軀 分身千百億
偈出 聖彌勒菩薩
☸☸☸☸☸☸☸☸☸☸☸☸☸☸☸☸