叔字丢失了标签

《空谷集》卷2:「見亦見濂溪二程以及諸子所得道學之源。。。。

 

周諱惇yi[前-刖+戊][、、][春-日+(〡*日)]陵人也[社-土+刀]扣黃南禅教外別

」(CBETA, D57, no. 9000, p. 45a2-3)

 

红字丢失了标签

maha的头像

此處採用CB31639 [、廾、、]有誤,應改用CB14695 [、廾、、、]。CB14695 [、廾、、、]有對應的unicode 字元

CBETA Maha 吳寶原 

 

这里的问题主要是丢失了标签。导致页面显示出现问题。

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

maha的头像

XML已改作:

在下一季(2018-Q4)更新後,此處就不會有呈現問題。

CBETA Maha 吳寶原 

 

新版的g标签内的pua都给删除掉了?

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

cbeta的头像

是的, 原本 g 標記內有文字, 正是因為這些文字可能是 unicode 3.1 以上, Mac 版會有錯誤, 所以新的版本在 g 標記中不放文字.

晕~, 我的程序依赖pua。全部是使用程序替换pua成正字。然后直接抽取显示的。去掉了pua,这个程序就麻烦了。异体字会全部显示为空白了

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

cbeta的头像

如果您使用 CBETA 正式提供的 TEI P5 XML , 那就和以前一樣, 格式不變.

您大概是使用光碟中 CBReader 在用的 XML 吧? 那個會隨著程式改版而改變, 不建議您直接使用. 

如果只是 g 標籤沒有內文, 只要寫個小程式, 把它加進去應該就可以了. :)

使用的TEI P5 XML。

不过并不好加。因为每个字的替换都需要整个查找一遍数据库,找到需要替换的字,然后修改dom。

而两个字符的一对一替换则简单多了。

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk