大陆这边有一些同修想印刷一些佛经,希望从cbeta里面出。我编写了xsl-fo程序来生成pdf文件。
但是关于咒语这一块有一些疑问。主要的问题就是希望能对咒语做一个拉丁化的转写,然后标注在汉字的上面,
形成类似注音的效果。
但是在处理的过程中发现,cbeta使用的标签cb:tt,有时候是按照音节来标记,而不是按照单词来标记的,
这样在转换过程中,就无法知道每个拉丁单词的分割点在什么地方,打印出的咒语看起来非常零碎。
因为这个标签是cbeta标注的。所以想问问这个标签的更具体含义。
因为感觉按照音节来分割没有什么意义啊?
因为我们对梵文的了解很少,因此许多相关的工作都是请较有研究的专家学者协助。
大部分的情况,我们只能根据书本的格式处理,在不了解梵文的情况下,无法进一步有更好的断词或断句。
如果有专家学者们,愿意进一步提供更好的资讯,我们当然很愿意将 CBETA 的大藏经处理的更完善,相信这也是大家所乐见的。