看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 123/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: b83050@cctwin.ee.ntu.edu.tw (Post Gateway), 信區: BudaTech 標 題: 大正藏以 CCCII 碼輸入的近況 發信站: 由 獅子吼站 收信 (Fri Mar 29 19:45:59 1996) ---------- Forwarded message ---------- Date: Mon, 22 Jan 96 10:31:14 -0500 From: Maha Wu <maha@tpts1.seed.net.tw> Subject: 大正藏以 CCCII 碼輸入的近況 文明兄及各位朋友: 有關蕭兄那邊的狀況,以下幾點向各位報告: 一、他還是堅持要將每一冊大正藏以 CCCII 碼輸入。 據我了解他的意 思,他認為若依你的意思,已有人在輸入的冊數或檔案就不要再做的話,那 就無法有一套完整的 CCCII 碼的大藏;即使把以 BIG-5 碼輸入的冊數或檔 案再轉成 CCCII 碼,還不如整個就以 CCCII 碼來輸入來得有效率。 我認為能有一套 CCCII 碼的完整大藏也是很好, 現在看來雖然沒什麼 用,但相信以後會有大作用的。 二、他目前已完成的 CCCII 檔,我抽樣拿來看了一下, 它主要的問題 是──像「眾」、「為」、「刊」、「藏」、「舉」、「污」、「涅」等字 ,以及很多像「若」、「苦」、「菩」、「著」、「落」等草字頭的字,因 為他是照著大正藏上的字形結構來選字打的,而這些字在大正藏上的字形結 構跟我們在這裡所看到的稍有不同, 所以這些在 CCCII 上有的字,一轉成 BIG-5 就變成空白了。 他也知道這個轉碼後所產生問題的嚴重性,因為他也希望他的努力能讓 更多使用 BIG-5 碼的人受用, 所以他接受我的建議──把這些有轉碼問題 的字儘量找出來,然後以 BIG-5 裡面意義相通的異體字來替代。 我打算用 漢書的搜尋取代巨集來處理;本來是想在轉碼程式上修改,但闓運看了看說 很累,還不如用漢書的巨集來處理。 三、他目前一個月的薪水約四萬五,以目前每月一本的進度,每月要支 出三萬,他自己覺得還勉強過得去。不過他還是希望讓多募一些款,好讓他 能請人來校對或是加快進度。 對於輸入一本大正藏要多少錢,我以手上有的第二十六冊來實際估算: 總共 1031 頁,每頁 3 欄,每欄 29 行,每行約 20 字(含句點), 所以 一冊大正藏的總字數是 20*29*3*1031=1793940 字。又,台灣目前的大量打 字行情約是 50 元/ 1000 字, 因此一冊大正藏的輸入費用大約是 1793940*50/1000=89697 元。 所以他能夠用三萬塊就辦到(還包括往返大陸的費用),再怎麼加加減 減的算,也實在不容易。 我看他還是喜歡握有作業的主控權,不因有錢沒錢而左右自己原先的一 些基本想法。所以北佛青這邊如果能資助他,那是最好,但不要想去改變他 所堅持的 CCCII。 摩訶工作室 吳寶原 maha@tpts1.seed.net.tw |
閱讀文章: 第 123/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |