看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 123/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: b83050@cctwin.ee.ntu.edu.tw (Post Gateway), 信區: BudaTech
標  題: 大正藏以 CCCII 碼輸入的近況
發信站: 由 獅子吼站 收信 (Fri Mar 29 19:45:59 1996)


---------- Forwarded message ----------
Date: Mon, 22 Jan 96 10:31:14 -0500
From: Maha Wu <maha@tpts1.seed.net.tw>
Subject: 大正藏以 CCCII 碼輸入的近況

文明兄及各位朋友:

    有關蕭兄那邊的狀況,以下幾點向各位報告:

    一、他還是堅持要將每一冊大正藏以 CCCII 碼輸入。 據我了解他的意
思,他認為若依你的意思,已有人在輸入的冊數或檔案就不要再做的話,那
就無法有一套完整的 CCCII 碼的大藏;即使把以 BIG-5 碼輸入的冊數或檔
案再轉成 CCCII 碼,還不如整個就以 CCCII 碼來輸入來得有效率。

    我認為能有一套 CCCII 碼的完整大藏也是很好, 現在看來雖然沒什麼
用,但相信以後會有大作用的。

    二、他目前已完成的 CCCII 檔,我抽樣拿來看了一下, 它主要的問題
是──像「眾」、「為」、「刊」、「藏」、「舉」、「污」、「涅」等字
,以及很多像「若」、「苦」、「菩」、「著」、「落」等草字頭的字,因
為他是照著大正藏上的字形結構來選字打的,而這些字在大正藏上的字形結
構跟我們在這裡所看到的稍有不同, 所以這些在 CCCII 上有的字,一轉成
BIG-5 就變成空白了。

    他也知道這個轉碼後所產生問題的嚴重性,因為他也希望他的努力能讓
更多使用 BIG-5 碼的人受用, 所以他接受我的建議──把這些有轉碼問題
的字儘量找出來,然後以 BIG-5 裡面意義相通的異體字來替代。 我打算用
漢書的搜尋取代巨集來處理;本來是想在轉碼程式上修改,但闓運看了看說
很累,還不如用漢書的巨集來處理。

    三、他目前一個月的薪水約四萬五,以目前每月一本的進度,每月要支
出三萬,他自己覺得還勉強過得去。不過他還是希望讓多募一些款,好讓他
能請人來校對或是加快進度。

    對於輸入一本大正藏要多少錢,我以手上有的第二十六冊來實際估算:
總共 1031 頁,每頁 3 欄,每欄 29 行,每行約 20 字(含句點), 所以
一冊大正藏的總字數是 20*29*3*1031=1793940 字。又,台灣目前的大量打
字行情約是   50  元/  1000   字,  因此一冊大正藏的輸入費用大約是
1793940*50/1000=89697 元。

    所以他能夠用三萬塊就辦到(還包括往返大陸的費用),再怎麼加加減
減的算,也實在不容易。

    我看他還是喜歡握有作業的主控權,不因有錢沒錢而左右自己原先的一
些基本想法。所以北佛青這邊如果能資助他,那是最好,但不要想去改變他
所堅持的 CCCII。





摩訶工作室  吳寶原  maha@tpts1.seed.net.tw

閱讀文章: 第 123/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org