看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 1080/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: Heavenchow@Lion (Heaven), 信區: BudaTech
標  題: Re: 丹青 ocr 技巧
發信站: 獅子吼站 (Sun Dec 21 12:21:51 1997)
轉信站: Lion

==> 於 網路義工 (peterwei@Lion) 文中述及:
: : ********
: : 另外,對於一些打不出來的字,各位就您熟悉的輸入法輸入
: : 時,若真打不出來(特別是注音),那就以精確或簡易組合
: : 字表示即可。
: :                                        maha 12/14/97
: 請問什麼是組合字?看起來很相同嗎?謝謝!

  之前 maha 有 mail 一份資料給 佛教藏 ocr 小組, 您可能漏接了.
  這裡給您參考, 不一定要用這麼完整的規則, 以您方便, 好辨認即可.
  完稿maha 會再處理過, 至於詳細例子, 我 mail 一份組合字給您參考.

<<< 組字法 >>>(11/19/96 更新)

本組字法含*/@-+?六個全形基本符號,及()[]兩組半形分隔符號。
今舉例說明如下:

* 表橫向連接     如:明=日*月
/ 表縱向連接     如:音=立/日
@ 表包含         如:因=口@大  或  閒=門@月
- 表去掉某部份   如:青=請-言
-+若前後配合,表示去掉某部份而改以另一部份代替  如:閒=間-日+月
?表字根特別,尚未找到足以表示者  如:背=(?*匕)/月
()為運算分隔符號 如:繞=組-且+((土/(土*土))/兀)
[]為文字分隔符號 如:羅[目*侯]羅母耶輸陀羅比丘尼

為求方便,不排除採用全形注音符號、標點符號及英文符號做為組字用字根。

  heaven
--
Ξ Origin: 獅子吼站 <cbs.ntu.edu.tw> [FROM: 140.114.61.170]
閱讀文章: 第 1080/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org