收藏 分销(赏)

“殷契文淵”甲骨文字形庫的建設與思考.pdf

上传人:自信****多点 文档编号:521698 上传时间:2023-11-06 格式:PDF 页数:17 大小:2.46MB
下载 相关 举报
“殷契文淵”甲骨文字形庫的建設與思考.pdf_第1页
第1页 / 共17页
“殷契文淵”甲骨文字形庫的建設與思考.pdf_第2页
第2页 / 共17页
“殷契文淵”甲骨文字形庫的建設與思考.pdf_第3页
第3页 / 共17页
亲,该文档总共17页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、“殷契文淵”甲骨文字形庫的建設與思考*喬雁群(安陽師範學院計算機與信息工程學院甲骨文信息處理教育部重點實驗室)摘要作當今最大型、全免費的甲骨文大數據網絡平臺“殷契文淵”,主要包含字形庫、著録庫、文獻庫,其中的甲骨文字形庫是具有學術獨立性與字體原創性的基礎與核心組成部分。该字形庫注重“學術性、藝術性和技術性”,具體體現在字形的準確性、字體的規範性與字庫整體構建的集成性幾方面。關鍵詞甲骨文甲骨文字庫大數據平臺殷契文淵“殷契文淵”(h :w )是在宋鎮豪先生指導下,安陽師範學院甲骨文信息處理教育部重點實驗室與中國社會科學院甲骨學殷商史研究中心合作建設的甲骨文大數據網絡平臺,這是當今最大型、全免費的甲

2、骨文資源共享平臺。自 年 月發布以來,已逐漸成爲古文字學、歷史學、考古學、文化藝術等诸多領域學者常用的網絡資源。在“殷契文淵”“三庫一平臺”(字形庫、著録庫、文獻庫與知識共享平臺)中,甲骨文字形庫是具有學術獨立性與字體原創性的基礎與核心組成部分。筆者負責字形庫的建設,包括甲骨文字形的全面整理與勘定,甲骨文字體書寫與製作,甲骨文字形庫功能設計與信息整理標注等。甲骨文發現 多年來共發現甲骨文單字數量約在 ,公認的可釋字還不到*本文爲“古文字與中華文明傳承發展工程”資助項目“新出甲骨文著録刻辭類纂”(項目號 )、“殷契文渊 甲骨文數據化平臺”(項目號 )的階段性研究成果。,更多的是未識字。甲骨文字形

3、特點之一是字無定形,異體紛繁;甲骨文的釋字,則有相當一批字無定釋,歧説紛呈,有的字無法用現代漢字方式去隸定,有的字可以隸定,但各家隸定五花八門,極不統一。這些都造成了甲骨文字庫研發的困難。近年來,香港漢達文庫、華東師範大學、北京師範大學、浙江師範大學、方正公司等均有嘗試研發甲骨文字形庫,但是由於各種原因,或者收字不全,或者未能完全對外開放,很難實現大規模的共享和推廣應用。其中應用較廣一些的是 年香港中文大學中國文化研究所中國古籍研究中心建立的“漢達文庫”,其所研發的一套甲骨文字形庫用於甲骨文資料庫所收録的部甲骨著録書的檢索,由於該庫的甲骨文著録釋文幾經校勘,糾正了以往同類資料中的不少錯誤,自開

4、發以來爲不少學者所使用。“殷契文淵”甲骨文字形庫,通過全面采集整理、研究勘定甲骨文字形,形成獨立的甲骨文字形表,再用毛筆書寫,製作爲標準、規範且具有契刻韻味的甲骨文字體,設計、構建了三級字形構成的甲骨文字形庫,並爲字形庫量身定做多種甲骨文字形檢索法,實現了甲骨文的多渠道檢索。以字形編碼爲核心,通過多維度的信息標注,實現字形與字形、字形與相關工具書、著録、文獻等多功能關聯,解決由於甲骨文輸入困難與信息標注繁瑣而導致甲骨文著録、文獻資源難以大規模共享與推廣的難題。二期工程完成後字形庫收録的 多個甲骨文字形(單字爲主,包含少量異形字),已與多種甲骨文工具書建立鏈接,實現“一鍵式”查閲,爲甲骨文學習、

5、應用與研究帶來方便。“殷契文淵”大數據平臺中,字形庫既是獨立的字形研究成果,也是著録庫與文獻庫的重要檢索入口。嚴謹規範的字形,爲甲骨文的學術研究、社會普及、編輯出版與活化利用等提供了基礎資源,也爲人工智能輔助甲骨文研究提供了數據基礎。甲骨文大數據平臺“殷契文淵”(h t t p:/j g w a y n u e d u c n)首頁 甲骨文與殷商史(新十二輯)一、“殷契文淵”甲骨文字形庫的特色“殷契文淵”字形庫注重“學術性、藝術性和技術性”三者的統一,這是該庫的基本特質與主要特色。學術性對甲骨文字形進行全面整理、勘定的學術研究,包括對現存各類甲骨文字工具書進行必要的勘誤與字形的增補和删減,並依

6、據研究成果製作甲骨文字形表,這是保證字庫字形準確性、可靠性或者説學術性的基礎和前提。這也是“殷契文淵”字形庫首要的重頭工作。由於殷墟甲骨文字及其材質的特殊性,任何甲骨文工具書都無法做到圓滿。目前各類甲骨文工具書中所收字形都存在一定數量的誤摹、誤識、誤釋、誤收或重收的字,甚至因誤而致衍生的字形。盡可能將失誤降至最低,給用户提供最準確的字形,這是筆者自始至終對“殷契文淵”字形庫抱持的目標與宗旨。筆者在 年底开始字庫工作時,便發現原定字庫字形的簡單整理與書寫任務遠遠不能滿足高品質學術研究的需要。原字表舛錯較多,爲保證每一期發布字形的準確性,避免以訛傳訛,只得放棄事先預定臨寫實驗室舊版甲骨文字體的方案

7、,先改定字表,逐字依據原拓片釐定字形,再進行書寫。事實上即便目前各類甲骨文工具書也都存在不少失誤。尤其是筆者 年開始全面負責甲骨文字庫工作後,不得不調整進度,重新設定工作目標,在原定書寫工作之外,另行確定勘誤、增補、删減的標準和實施流程,並以大部分精力進行字形的整理研究;根據整理研究結果形成新的字形表,對甲骨文字體的書寫製作也制定了更高標準。字形整理研究的過程中,在全面掌握和梳理現有甲骨文材料基礎上,對殷墟甲骨刻辭類纂甲骨文字編新甲骨文編甲骨文字形表等多種權威工具書中的計 多甲骨文單字及若干異形字逐一核對原片,選擇最佳拓本或照片,結合辭例、相關考釋文章,參考各種著録釋文,對字形詳加核訂,改定和

8、去除誤摹、誤收、重收及衍生字頭與字形,確立每個甲骨文單字與異形的代表字形,確保字形的準確無誤;“殷契文淵”甲骨文字形庫的建設與思考姚孝遂主編:殷墟甲骨刻辭類纂,北京:中華書局 年版。李宗焜:甲骨文字編,北京:中華書局 年版。劉釗主編:新甲骨文編(增訂本),福州:福建人民出版社 年版。沈建華、曹錦炎:甲骨文字形表(增訂版),上海:上海辭書出版社 年版。並參考各書合理設置部首表,調整字形分合與字形歸部,最終形成綜合各家之長又有所修正補訂的獨立的甲骨文字形表。勘誤、增補字形和删除各工具書中的衍生字舉例如下(表表):表“殷契文淵”甲骨文字庫勘誤字形舉例原字類纂字編新編字形表 殷契文淵備注花東 真 目前

9、各工具書該字形均誤,殷契文淵字庫已勘正。合 甲 頁 目前各工具書該字形均誤,殷契文淵字庫已勘正。合 甲 頁 目前各工具書該字形均誤,且單收爲未識字,字實當爲“”,殷契文淵字庫已勘正字形及歸屬。合 頁 此字實爲何組、無名組、歷組、黄組等均出現的田獵地名“”,即等形之異寫,目前各工具書多單立此字爲未識字,字形表釋“獸”,均誤。殷契文淵已關聯爲以上字形之異形。甲骨文與殷商史(新十二輯)此字勘誤情況已收入喬雁群:甲骨文字編校訂 例,甲骨文與殷商史新 輯,上海:上海古籍出版社 年版,頁 。同上注,頁 。同上注,頁 。此字例收入筆者未刊稿甲骨文“未識字”辨正舉例中。表“殷契文淵”甲骨文字庫增補字形舉例字形

10、出處備注甲 合 此爲“專”字之異形,新編頁 收入,但字形處理模糊,其他工具書均未收,殷契文淵字庫已補入。醉古集 組乙 乙補 乙補 “魯”字異體,目前各工具書均未收,殷契文淵字庫據綴合材料補收此形。合 此“萅(春)”字之異體,目前各字書均未收,殷契文淵字庫據蔣玉斌摹本及吉林大學藏甲骨集補入。乙 合 此爲 之異寫,字編 號、新編第 頁均作,誤。殷契文淵字庫已據乙編 勘正後收入。表“殷契文淵”校訂各工具書當删除的衍生字舉例原字類纂字編新編字形表備注英 頁 下部貫穿口形之豎綫粗鈍無力,並非筆畫,且參考合集 ,實係字。爲衍生字,應删除。合 後下 頁 合集字形左側有骨花導致誤摹衍生字,據後下 當如,即字,

11、當删除。合 乙 頁 合集拓片不清導致誤摹衍生字頭,據乙編拓片可知實是()字,該字頭應删除。“殷契文淵”甲骨文字形庫的建設與思考林宏明:甲骨新綴第 例,發表於先秦史研究室網站,年月 日。蔣玉斌:釋甲骨文金文的“蠢”兼論相關問題,復旦學報(社會科學版),年第期,頁 。吴振武主編:吉林大學藏甲骨集第 號,上海:上海古籍出版社 年。喬雁群:甲骨文字編校訂 例,甲骨文與殷商史新 輯,頁 。表原字類纂字編新編字形表備注合 反北圖 反 頁 合集拓片不清,據北圖照片與拓片,應是字之異寫,各工具書中衍生字頭當删除。限於篇幅,以上只是簡單列舉“殷契文淵”字形整理研究中針對現存一些工具書進行勘誤、增補、删除衍生字形

12、的字例。甲骨文字形的通盤整理是一項系統工程,涉及目前所發現的全部甲骨文圖像材料,以及考釋、綴合等研究資料,需要大量精力投入。目前已對各類工具書勘誤 餘處,並擇取 多個字例撰成文章發表,所訂正字形有些已體現在“殷契文淵”字庫中;其餘勘誤情況,將陸續整理成文,其中未在“殷契文淵”上發布的也將逐步在網站上更新。同時對字庫中已發布的字形也一直在不斷進行核查、修訂。部首的設立,是爲了將複雜繁多的字形歸類處理。作爲大數據平臺的甲骨文部首表,更重要的功能則是爲了方便、快捷地找到字形,是統轄全部甲骨字形的一個“綱領”。“殷契文淵”采用自然分類法,綜合吸取各家優長,補其不足,制定了包含 個部首的部首表。部首設置

13、遵循以下原則:第一,盡可能統領所有甲骨字形;第二,“字理”爲主,兼顧“形似”;第三,按類排列,形近相鄰。甲骨文與殷商史(新十二輯)袁倫强碩士論文中已指出新甲骨文編該字形當處理作,見袁倫强:新甲骨文編(增訂本)校補,西南大學碩士論文(指導教師:李發),年,頁 。見喬雁群:甲骨文字編校讀札記 則,甲骨文與殷商史新輯,上海:上海古籍出版社 年版,頁 ;合集釋文校補兩則,甲骨文與殷商史新 輯,上海:上海古籍出版社 年版,頁 ;甲骨文字編校訂 例,甲骨文與殷商史新 輯,頁 。表 “殷契文淵”甲骨文字形庫的建設與思考表 難檢字 數字 干支 祖先 爲“殷契文淵”製定的部首表藝術性從現有少數的甲骨文字庫來看,

14、以電腦字爲特徵的甲骨文字形缺少甲骨文韻味,以拓片原字反轉處理字形的方式,雖然字形大體接近原始字形面貌,但由於出土的甲骨文字形大小、外觀比例、組類風格等差異較大,整體上難以統一。“殷契文淵”甲骨文字庫的字形爲筆者結合多年書法篆刻的理論研究與實踐經驗,運用毛筆書寫。以所整理甲骨文字形表爲依據,選取清晰優美、表現構字理據的字形,嚴格采用原片字形臨寫,以盡可能再現甲骨文字形所具有的原始姿態與契刻特色,同時兼顧全部字形風格上的統一。“殷契文淵”甲骨文字的書體(部分)技術性“殷契文淵”甲骨文字形庫的技術性體現在字體的製作、字庫的多級架構與字庫整體的多功能、集成性。甲骨文與殷商史(新十二輯)字體的製作,是以

15、狼毫毛筆書寫字形,用方正字庫專用紙,單字字徑 ;掃描後,通過h h 軟件進行一定程度的加工處理,使得字形大小比例等在整體上更趨統一,細節、氣韻則與原拓更爲接近。然後用 軟件處理製作爲字體。字庫的整體構架爲“部首單字異形”三級字形系統。字庫首頁置有甲骨文部首表,可以通過部首表查閲所有字形,同時可選擇查看全部單字或全部字形,或通過輸入漢字、拼音或手寫實現字形檢索。字庫的功能,一方面體現在字形多種檢索方式,另一方面體現在字形相關信息的載入,包括字形自身信息如部首信息、釋字信息,字際關係如異體字形的關聯,字形與研究材料的關係,如著録、文獻以及相關工具書的鏈接等(詳見後文)。“殷契文淵”字形庫以字形編碼

16、爲核心,通過多維度的信息標注,形成超大信息量、三庫貫通的資源系統,體現其整體的多功能、集成性。二、“殷契文淵”甲骨文字形庫的結構與功能甲骨文字形庫的三級結構“殷契文淵”的甲骨文字形庫,含三級字形,即部首單字異形,從頁面顯示來看則是“部首字形單字詳情彈窗(關聯異形字)”。“殷契文淵”甲骨文字形庫三級結構:部首字形單字詳情彈窗(關聯異形字)“殷契文淵”甲骨文字形庫的建設與思考爲甲骨文字量身定做的多種檢索法鑒於甲骨文字的特點與檢索之困難,殷契文淵的字形庫已研發多種甲骨文字形的檢索方式:部首檢索法(單個部首選擇或多部首組合檢索法)、漢字檢索法、拼音檢索法、手寫檢索法等(待完善)。()部首檢索法部首檢索

17、法是字形庫默認的檢索法,首頁置有部首表,點擊部首表中任何一個部首,字形窗會出現含有該部首的全部字形;也可以同時選擇二或三個部首,字形窗中則出現同時含有所選的二或三個部首的字形。點擊想要檢索的字,便會檢索到著録庫中含有該字形的全部拓片。部首檢索法的優點是可以檢索到全部字形。部首組合法檢索“好”字不足之處是有些字由於構件不够確定,或者用户認知有異,而不容易準確判斷置於哪個部首下。有的部首,其部屬字較多,如人、大、女等較大的部首,會有數百個部屬字,此時可以加選一到兩個部首組合選擇,例如“好”字,可以如上圖所示同時選擇“女”和“子”兩個部首,縮小選擇範圍,使檢索更加快捷、便利。()漢字檢索法漢字檢索法

18、是給甲骨文字形標注釋文,使用者選中“漢字檢索”,於檢索框中輸入想要查閲的漢字,便可以檢索到對應該漢字的甲骨文字形。漢字檢索法的優點是,漢字輸入是漢語言用户最熟悉、最直接的反映習慣,快捷方便。甲骨文與殷商史(新十二輯)漢字檢索法檢索“春”字不足之處是,只能檢索到可釋字或用户能輸入的通用漢字。目前學界考釋有争議的字,則具有不確定性,會影響到檢索的設置和使用效果。()拼音檢索法拼音檢索法是將可釋字予以標音,使用者選中“拼音檢索”,於檢索框中輸入想要查閲漢字的拼音,候選窗中出現符合該拼音的全部字形,供使用者從中擇取。拼音檢索法的優點是,省去了現代漢字一個環節,是由拼音直接對應甲骨字形,檢索省時方便。不

19、足之處是只能檢索到可釋字或用户瞭解其讀音的字。有的字目前學界對考釋尚有争議,該字讀音應該是什麽,存在不確定性,這也不可避免地會影響到拼音檢索的設置和使用效果。爲解決這一矛盾,本字形庫的讀音設置對某些考釋有較大争議的字,其字音的標注會寬泛一些,以便於用户檢索。拼音檢索法檢索“耳”字 “殷契文淵”甲骨文字形庫的建設與思考()手寫檢索法在著録庫檢索頁面置有書寫區,通過操作鼠標或者觸屏寫出想要檢索的甲骨字形,候選區會出現一定相似度的字形,供使用者選擇。此法優點是避開了“不易判斷屬於哪個部首”和“不了解釋字”、“不確定讀音”的困難,直接用“照貓畫虎”的方式將想要找的甲骨字形寫出來,從而實現檢索。可釋字也

20、可以用手寫現代漢字的方式來實現檢索。不足之處是辨識易混字形、複雜字形可能會存在一定困難(各類工具書有同樣困難)。甲骨文字形庫的多維關聯甲骨文字形庫的功能與意義不僅在於字形本身,與每個字形相關聯的信息,如著録出處、字書收録情況、各家考釋情況、相關研究文獻、釋字、讀音、異形關係等,需要通過前期研究和後期的信息標注,來實現網絡上的關聯與功能的實現。字形信息中,“字形編碼”爲該字形的“身份證”,即其在字體庫中的唯一碼位;通過編碼與編碼、編碼與其他信息關係的建立,實現字形相關各種信息的多維關聯。()甲骨文字形屬性的標注字形編碼、部首編碼、拼音、釋文等,屬於字形自身的屬性,需要在學術研究基礎上做整理與信息

21、標注。()甲骨文異形字的雙向關聯甲骨文字的特點之一是異形衆多,如何處理異形字之間的關係,是網絡字形庫需要解決的重要問題。“殷契文淵”字形庫的解決辦法是,將異形字之間相互關聯,使得異形字的雙向關聯通過一組異形字中的任何一個字形可以找到其他異形。字形庫中,點擊每個字形可顯示該字形詳情彈窗。例如字形的詳情彈窗内,處於左上方“主字形”位置,如 甲骨文與殷商史(新十二輯)“宁”字字形詳情彈窗字形有異形字,則其詳情彈窗下方顯示其異形字。點擊該異形字,即進入的詳情彈窗,此時處於主字形位置,字形居於下方“異形字”位置。是爲異形字之間的雙向關聯。如、三個字形互爲異形,則每個字形均與另外兩個字形相關聯,以此類推。

22、()紙質工具書的關聯計劃將字形庫每個字形與于省吾主編甲骨文字詁林、何景成編撰甲骨文字詁林補編、姚孝遂主編“宁”字的甲骨文字詁林鏈接頁面殷墟甲骨刻辭類纂、劉釗主編新甲骨文編、李宗焜 “殷契文淵”甲骨文字形庫的建設與思考“宁”字的新甲骨文編鏈接頁面編著甲骨文字編及沈建華、曹錦炎編著甲骨文字形表等重要甲骨文工具書通過字形編號、頁碼等信息建立關聯,目前甲骨文字詁林 新甲骨文編等已實現頁面跳轉链接,链接頁面可點擊“上一頁”“下一頁”翻頁查看。()三庫之間的關聯甲骨文大數據平臺中,甲骨文字形是溝通甲骨著録(包括甲骨照片、拓片、卜辭釋文)和甲骨文獻(即各類甲骨文研究論著)等的橋樑、紐帶,通過字形可以檢索到著

23、録、文獻等相關信息。甲骨文字形庫中的字形,可以是檢索著録或文獻的入口,也可以是中間的轉换環節。由上述字形檢索方式可以進入到字形之第三級,進而由字形檢索到著録、文獻等,其中著録包含甲骨原片(照片、拓片、摹本)和原文(由字形庫字形所 甲骨文與殷商史(新十二輯)顯示的卜辭原文内容)與釋文,文獻則包含研究文章、專著等。由原文、釋文中的甲骨字與現代漢字也可以進入到著録與文獻,這三種甲骨字形檢索方式和搜索條中輸入現代漢字的功能一樣,即都可以檢索到相關著録與文獻。此項檢索的擴展功能是多字詞(包括連續與不連續)的合併模糊檢索,這也是用户極其期待、非常實用的甲骨文資源檢索功能。三、“殷契文渊”甲骨文字庫的探索與

24、思考甲骨文的發現迄今只有 多年,甲骨文的研究還是一個較爲年輕的學科。甲骨文字無定形、異體繁多的特點,不但給甲骨文的識讀造成困難,對於甲骨文字的信息化處理也帶來難度,甲骨文字體和字庫的研發目前都還很少。“殷契文淵”字體與字庫是一次嶄新的嘗試,其中有許多困難需要逐步解決,自研發以來,雖積累了些許經驗,更多則是有待未來長期的探索與努力。甲骨文字檢索的“模糊邏輯”由於甲骨文的特殊性(例如僅一見又模糊不清的字形、考釋的争議、字與詞的錯綜關係、與後世文字無法匹配的特殊構件等),無論是字形的釋讀、分合(即異形字的歸屬)、歸部,均存在不確定性、理解差異或争議,這使得此類字形在工具書中的收録存在較大差異,造成讀

25、者檢索的難度。爲解決這一問題,“殷契文淵”通過運用“模糊邏輯”,提高檢索效率。例如:()字形檢索方面。在字形檢索中,對於有不確定性或争議的字形,無論是部首檢索、漢字檢索、拼音檢索,都存在客觀模糊性、學術争議和用户認知差異等因素帶來的某些字形的“難檢度”。爲降低檢索難度,“殷契文淵”字形庫在這幾種檢索形式中均增加了“模糊檢索”:部首檢索 部首檢索中,一個字形如包含多個成部首構件,則每個部首下均可檢索到;構件有模糊性者歸入用户可能選擇的多個部首;一些難以歸部的字形,在置於“難檢字”的同時,亦置於用户可能“理解爲”並選擇的部首下。“殷契文淵”甲骨文字形庫的建設與思考漢字檢索 一字多釋或釋字有争議者,

26、增加“或釋”釋文。例如舊釋“書”的(合集 )字,今多釋“君”,字庫正式標注釋文“君”之外,亦於“或釋”欄標注“書”,則檢索“書”字,亦可出現該甲骨文字形,只是字形釋文只顯示“君”,而不顯示“書”。再如(合集 正)、(合集 )、(合集 )、(合集 )、(合集 )等字形今多釋“肩”(裘錫圭據徐寶貴待刊稿石鼓文研究與考釋中意見推論該字釋肩是合理的,其後學者多從之);(合集 正)、(合集 )、(合集 )等字今多釋“憂”,而我們認爲二字分别仍當釋“冎”“禍”更宜,故其字形對應釋字分别在“冎”“禍”之外,增加了“或釋”字“肩”“憂”的模糊檢索(頁面不顯示“或釋”釋文)。拼音檢索 一字多釋或釋字有争議者,其

27、拼音標注增加“或釋”釋文讀音,例如上述釋“冎”“禍”之字,其拼音分别在“”“h ”之外,增加“”“”拼音的模糊檢索。()異形關聯方面。在“異形字”之外提出“相關字”概念,即在異形字的相互關聯之外,增加了“相關字”的雙向關聯。“相關字形”是對異形字的補充,例如某個字與它字疑似異形關係,或嚴格來説不能確斷爲異形字,而以往工具書中或視爲異形,則關聯爲“相關字形”,以使某些字更容易被檢索到,爲研究者提供方便。檢索中的“模糊邏輯”,可以適當拓寬渠道,降低檢索難度,提高效率,更方便用户使用。關於進度“殷契文淵”字形庫計劃收録迄今所發現的甲骨文全部單字及有代表性的異形,甲骨文與殷商史(新十二輯)如甲骨文字編

28、 新甲骨文編均收在“君”字下,甲骨文字形表則仍釋“書”。參見李宗焜:甲骨文字編,字號 ,頁 ;劉釗主編:新甲骨文編,頁;沈建華、曹錦炎編著:甲骨文字形表,字號 ,頁 。參見裘錫圭説“凡有疾”,見裘錫圭學術文集甲骨文卷,上海:復旦大學出版社 年版,頁 。今工具書如甲骨文字編 新甲骨文編均釋“肩”,甲骨文字形表則仍釋“冎”。見李宗焜:甲骨文字編,字號 ,頁 ;劉釗主編:新甲骨文編,頁 ;沈建華、曹錦炎編著:甲骨文字形表,字號 ,頁 。甲骨文字編 新甲骨文編均釋“肩”,甲骨文字形表則仍釋“冎”。見李宗焜:甲骨文字編,字號 ,頁 ;劉釗主編:新甲骨文編,頁 ;沈建華、曹錦炎編著:甲骨文字形表,字號 ,

29、頁 。郭沫若殷契粹編考釋謂兩種字形爲“冎”,讀爲“禍”,見郭沫若全集考古編殷契粹編,北京:科學出版社 年版,頁 。近有張玉金、黄錫全等先後加以補正,見張玉金:説卜辭中的“骨凡有疾”,考古與文物,年第期;黄錫全甲骨文“禍”字新證,漢字漢語研究創刊號,年月。預計至第三、四期完成後將會收録約達 個字形。目前字形庫經過第一、二期工作,已初步完成“部首單字異形”三級字形結構框架的搭建與功能設計,單字收録近 ,異形收録 餘,第三、四期將大量補入已收單字的主要異形,並增補漏單字,包括近年一些新出甲骨文著録中的新見字。由於甲骨文字庫建設可借鑒的成熟經驗還很少,目前的設計方案是在逐步摸索中形成的,加之受限於平臺

30、的總體規劃,過程中走了不少彎路,自然也會影響到整體進程。另外每一階段設計方案在實施過程中需隨時調整,加之人員變動頻繁、考評體制制約等多方面因素,使得前期工作出現多次返工,最終導致筆者不得不獨立完成本該多人共同完成的工作。筆者一人畢竟精力有限,前三年大部分精力用於字形勘定,其次是字形書寫與製作,目前在釋字方面尚未來得及做全面深入的工作,尤其是釋字和著録釋文所需要的隸定字系統,而隸定字庫的製作今年才提到日程,初步打算在下一期開始着手進行隸定字庫的整理與製作。關於檢測與完善由於相關軟件不斷升級,使用者的硬件、流覽器等存在差異,或更新時出現意外等諸多原因,字庫有時會出現字形不顯示,信息不匹配等現象,這

31、些都有待於“殷契文淵”整體上的完善和隨時隨地進行檢測與維護。未來可根據需要聘請第三方進行跟踪體驗,以改善用户使用效果。總之,無論是甲骨文字形庫還是整個“殷契文淵”都是複雜的系統工程,諸多建設、研發工作有待長期進行。三級字形庫内容的全面充實、異形字的補充、隸定字庫的製作、字庫功能的拓展與完善,以及全部著録釋文的整理與數字化、網絡關聯等系統性工作,都有待未來統籌推進。隨着計算機技術的發展與人工智能研究的推進,通過計算機進行甲骨文字的自動檢測與識别等技術得到突破,甲骨文大數據平臺將會開發更多功能,届時可取代更多原本需要甲骨學專家來做的基礎工作,更好地爲專家學者服務,進一步推進甲骨文與相關學科的研究。“殷契文淵”甲骨文字形庫的建設與思考

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服