Skip to Content

有关悉曇体unicode化的总结

1. cbeta使用的方案是使用汉字的code,覆盖了部分汉字的编码。所以在cbeta的windows版本上复制粘帖的时候,会复制粘帖变成中文。而cbeta在线版则使用了图片。cbeta的图片估计是直接从大正藏中扫描所得,所以清晰度比较差。但是cbeta 的windows版因为使用了ttf字体,所以清晰度很高。

但是cbeta的字体有一个还有一个问题,那就是制作的软件似乎有问题,造成不是标准字体格式,

在windows7以上,linux,mac下,都不能直接使用。

网友的解决办法是先转成otf字体,然后再转回来。才可以使用。

2. unicode 7.0引入了悉曇体,使用了U+11580~U+115FF之间的编码,实际用到U+115DD。unicode8.0又有增加。

但是目前只有一种字体可以支持unicode,就是ApDevaSiddham字体。  

ApDevaSiddham字体目前应该是支持unicode最好的字体。但是还是不支持叠辅音(conjunct consonants),

梵字llaṃ和kṣa不能很好的显示。但是单辅音和摩多字母则毫无问题。

缺点是字形相比汉字来说,有点太小了,和汉字一起的时候显得太小。

另外,它也存在覆盖了天城体的码表的问题。

3. Muktamsiddham 这个字体和cbeta的所采用的覆盖汉字的方案不同,

使用的是覆盖天城体的码表的技术方式来实现的。

据说从1.2版本之后,G版支持unicode8.0,   但是使用之后发现无效。也许使用方式不对

4. cbeta使用的悉曇字一共有2046个,有个别重复。我尝试全部替换为unicode。发现替换了640个之后剩下的全是叠辅音。

5. 阅读unicode标准,其实有处理叠辅音的方法。按照文档n4294- 3.9的描述,只要使用U+115BF VIRAMA连接辅音即可。但是实际显示还是不行,梵字llaṃ和kṣa都横排分散开来,不是按照悉曇字的规定竖排链接。

我猜测,也许缺乏的只是一个更好的字体而已。甚至也许只要解决U+115BF这一个字符就可以了。但是查了很久,没有得到关于如何使用字体软件处理这种特殊情况的资料

最开始觉得这个东西随手就能完成,因为unicode的悉曇字只有50个。做成woff字体文件,不超过50k大小,在web上显示也很简单,没想到是一个大坑。

 

Comment viewing options

Select your preferred way to display the comments and click "Save settings" to activate your changes.

找到了印度系文字等复杂文字的

找到了印度系文字等复杂文字的 Unicode–OpenType 方案,需要先以 Devanagari 这个典型的印度系文字为参考看它的 Unicode Core Spec 章节(Unicode 10.0.0)以及 OpenType 规范(Developing OpenType Fonts for Devanagari Script),然后看 Siddham 的 Unicode Core Spec 章节以及 USE 的规范(Creating and supporting OpenType fonts for the Universal Shaping Engine)。

具体链接:

https://www.microsoft.com/typography/OpenTypeDev/devanagari/intro.htm

https://www.microsoft.com/typography/OpenTypeDev/USE/intro.htm

 

 

Linux版本阅藏程序: https://github.com/zhaowenping/cbeta

DEMO入口: http://45.76.171.153:8000/mulu

 

maha's picture

RE:有关悉曇体unicode化的总结

很專業。佩服,佩服!請持續關心這個主題,等時機因緣到了,還請協助 CBETA 將悉曇字 unicode 化。

CBETA Maha 吳寶原 

 

Comment viewing options

Select your preferred way to display the comments and click "Save settings" to activate your changes.


forum | about seo