iamone - 火, 2018/01/02 - 21:12
查了下教育部字典,找到了缽字,没有找到鉢字。
但是查康熙字典,以鉢字为正字。
统计词频,
缽: 6190字
鉢: 51311字
整整差了一个数量级
可见从大正藏的角度和康熙字典的角度来说,鉢似乎应该是正字。
討論區:
查了下教育部字典,找到了缽字,没有找到鉢字。
但是查康熙字典,以鉢字为正字。
统计词频,
缽: 6190字
鉢: 51311字
整整差了一个数量级
可见从大正藏的角度和康熙字典的角度来说,鉢似乎应该是正字。
RE:问个问题:鉢和缽 那个是正体字?
教育部異體字字典【缽】【鉢】:http://dict2.variants.moe.edu.tw/yitia/fra/fra03198.htm
它以「缽」為正字,而「鉢」為其異體。
所謂的「正字」,在中國不同的朝代,並非是固定不變的。
非常感谢回复。作为大陆人,辨认这些异体字非常辛苦。 但是把
非常感谢回复。作为大陆人,辨认这些异体字非常辛苦。
但是把这些正字辨认出来,对于查找字典和建立全文检索索引来说,应该都是非常有意义的事情。
我通过扫描大正藏,一共发现如下难以辨认正字的异体字,如果有所建议当然非常感谢,如果没有,也仅供参考:
同时说实话,有时候感觉教育部的也不太高明。对于建立索引来说,区分度高是很重要的事情,
比如前面说到的彿和佛。
一个是字形区分度高的话,对于阅读就省力很多。对于字义区分度高的话,就容易找到需要的字词。
如果某个字在大正藏中使用更加频繁,似乎就说明这个字更加正一些。或者如果这个字恰好是大陆简体字,那么当做正字也许可以考虑。
也许以教育部为一个基准,稍作修改,是一个更好一点的方案。哦,但是可惜我是程序员,没法做出这种判断
Linux版本阅藏程序:
http://cbeta.buddhism.org.hk
RE:非常感谢回复。作为大陆人,辨认这些异体字非常辛苦。 但是把
CBETA 過去基於 BIG5 字集的基礎,也有記錄類似文件,大家做個交流,如下:
RE:非常感谢回复。作为大陆人,辨认这些异体字非常辛苦。 但是把
我們從事文獻數位化的目的是很多元的,不單是方便現代人解讀及搜尋,也在保存過去淵遠歷史中所發生的文字現象。
所以基礎工作是盡量建立在如實照錄全文,然後透過標記及字詞知識庫的技巧,來達成各方面的目的。
你这里是第一列作为正字吗?另外甯字在大正藏中多有用于姓,
你这里是第一列作为正字吗?
另外甯字在大正藏中多有用于姓,不能简单通用为寧。
我感觉你这里的用字是属于用那个都可以的,都算作正字的那种?
Linux版本阅藏程序:
http://cbeta.buddhism.org.hk
RE:你这里是第一列作为正字吗?另外甯字在大正藏中多有用于姓,
不,我這個沒做「正字」判別。
莫局限在大正藏,其他地方也看看:
不一定都是「全等」,只能說在字義交集的部份常被拿來通用。
升=陞=昇 一个量词,一个动词 你=妳
升=陞=昇 一个量词,一个动词
你=妳 后面一个在佛经中意思基本是奶
念=唸,佛经里面的区别太大,一个是思维,一个是嘴的动作
哄=鬨 后一个有巷的含义
嘗=嚐 一个是曾经,一个是品尝的意思。
謚=諡 前面读yi,后面读shi。含义不同
Linux版本阅藏程序:
http://cbeta.buddhism.org.hk