1、 毛泽东遗物及生平思想研究的数字化 冯 瑛(韶山毛泽东同志纪念馆,湖南湘潭411301)摘要 在信息爆炸的今天,数字化研究方法在毛泽东研究领域的应用仍然可以说是寥寥无几,甚至是盲点,研究方法的创新不但是势在必行,而且也是可能的,如果能够大胆地引入数字化和其它方法,不但我们能够创新方法本身,还能够在理念和结果方面开创全新的局面,在内容上也能挖掘出更多新的、有价值的东西。关键词 毛泽东;数字化;研究方法中图分类号A841 A 1001 - 8999( 2011) 03 - 0078 - 04 毛泽东的生平、思想、精神、文化和遗物等等研究领域不断被拓宽,拓深,甚至有学者已经把毛泽东研究与当代中国软实
2、力的构建联系起来,事实上种种的研究已构成一门方兴未艾的学科,即“毛泽东学”或简称“毛学”。应该说,毛泽东研究虽然还有可开垦的领域,但国内外已经做得相当成熟,只是,尚有一个重大的缺陷,那就是方法研究相对内容研究来说实在是太落后了,或者说,我们的大多数研究者还在用着最原始的或者最传统的方法研究毛泽东,尽管我们早就处在一个信息化、数字化高度发达的时代。本文要重点探讨的就是运用数字化的方法研究“毛学”,或者说,笔者在这里要倡议毛泽东研究学界高举数字化研究这面大旗。一、用数字化方法研究毛泽东遗物毛泽东研究的数字化就是对有高度价值的有关毛泽东的图像、文本、声音、影视和科学数据等信息进行收集,组织规范性的加
3、工,进行高质量保存和管理,实施知识增值,并提供在广域网上高速横向跨库链接的电子存取服务,同时还包括知识产权、存取权限、数据安全管理等范畴。更重要的是研究毛泽东要大胆运用诸多数字化的方法,比如统计、归纳、分类、图表、解析等“高科技”手段。这种研究方法要求研究者超越单向探讨的路径,在立体交叉的多维视角下去解读毛泽东;同时也要求突破单纯的文字研究和表述的方法,更要突破静态的或无声的方法,总之是要把数据处理的所有手段用之于毛泽东研究。引人数字化的方法研究毛泽东,拓展毛泽东思想研究新渠道,是我们急需解决的课题。广义地来说,毛泽东留给后世的所有东西都可以视为毛泽东遗物,也就是说,毛泽东遗物既指毛泽东生前用
4、过的所有物品(可移动的、小件的)和居住过的所有地方(不可移动的、大件的),这是物质层面上的遗物,也可指毛泽东留给我们的思想、精神、文化、作品等非物质的遗物(作品的遗物介于物质与非物质之间),或者,我们称之为“毛泽东遗产”更加合适。毛泽东遗物研究的数字化是指利用计算机技术实现对毛泽东遗物的信息进行数字化存储、管理、利用。毛泽东遗物信息,产生于毛泽东生前用过的所有物品,是所有用来描述遗物特征的信息,包括名称、总登记号、分类号、质地、形状、年代、特征等多种信息,它们形式多样,有文字、图像、视频、音频等,而且不易质变,便于存贮、流通;另外,还可再生,能重复利用。诸多的优点使得毛泽东遗物研究在封闭的管理
5、模式下豁然开朗。遗物信息虽然只是遗物的派生物,但它可以最大限度地满足用户的需求,避免在使用文物过程中的种种不利因素,并大大减少了对文物本身使用的频率。另外,它还可独立于文物本身而发挥重要作用。韶山毛泽东纪念馆共有毛泽东遗物6400件,而展出遗物数为324件,还不到总数的6%,大量的遗物受空间、环境因素的影响,无法与观众见面。利用计算机将遗物信息采集,构筑文物精品的三维展示,不但能很好地拓展遗物研究的空间,而且还能提高研究效率,丰富研究成果。因此,可以建立毛泽东遗物照片、三维、影像等数据库,并建立快速便捷的索引,为研究者提供最全面、最准确的第一手材料。还可利用虚拟和三维技术为那些待挖掘的遗物提供
6、三维展示平台,让研究者集思广益及动态发布、交流。利用三维扫描仪、全方位摄像系统与其他高分辨率数码相机,可以采集到相关的模型数据,并通过虚拟现实与人机交互技术,提供文物以及旧址等实体的全方位展示。故宫的紫禁城天子的宫殿以及敦煌洞窟壁画的漫游,都能较好地实现全方位逼真的漫游、浏览。它们的成功无疑给毛泽东遗物的鉴赏、研究带来了新的启示。利用虚拟技术对文物进行学术研究将成为一种新的趋势。另外,还可以建立专门的毛泽东遗物信息网,集中所有的毛泽东遗物,方便研究者统一交流和共享,各地研究者可以在上面发布最新研究成果,从而便于动态交流。二、建立毛泽东信息资料的数字图书馆毛泽东生前有许多手迹、诗词、文献。他的著
7、作大多来自于中国革命和建设的实践,其中有许多是对马克思主义普遍原理与中国具体实际相结合的经验总结,蕴涵着极其丰富的思想。一直以来,这些著作的出版和发行,为毛泽东思想的研究提供了丰富的第一手资料,为研究毛泽东思想起到了直接的推动作用。另外,数不胜数的毛泽东研究文库,信息可谓海量。据不完全统计,从1993年至2002年,仅研究毛泽东的论文就有7000多篇。据笔者了解,目前国内影响力和利用率很高的综合性研究数据库,如中国期刊网全文数据库、中国知网、维普中文科技期刊数据库和万方数据库资源系统数字化期刊,这几个数据库已经成为大多数高等院校、公共图书馆和科研机构文献信息保障系统的重要组成部分。如果能建立毛
8、泽东思想研究专题数据库群,把所有研究毛泽东的资料信息化,系统地组织起来,便可以让研究者在取得现有的成果上进行更广阔和更深层次的研究。笔者认为,毛泽东研究资料数据库可以包括以下几个分支:毛泽东单行本著作数据库、毛泽东诗词数据库、毛泽东手迹数据库、毛泽东影视资料库、毛泽东生平思想研究论文数据库c当然,毛泽东研究数据库群不可能独立存在,当用户置身于茫茫的网络海洋之中,常常会因分散、无序化、重复率高的信息而感到无所适从,找不到自己需要的信息资源。若利用网络系统,将各种研究资料数据库链接起来,建立网络数据库,即WEB数据库,将会更有效地实现资源共享,更好地促进毛泽东研究事业的发展。WEB数据库是将数据库
9、技术和计算机技术优点相结合的一种技术,它以后台数据库为基础,配以前台应用程序,通过浏览器完成数据存储、查找等操作。当建立好毛泽东研究的网络数据库以后,就仿佛每个人都拥有了一个开放式的数字图书馆。这个数字图书馆与传统图书馆不同,主要表现为:(1)存储介质不同。数字图书馆的存储介质不限于印刷体,它还可能包含有声、光、图像、影视等多种数字信息媒体,通过互联网的多媒体、超文本、超媒体等技术,提供智能化的信息检索手段,向读者提供各种网上服务c(2)信息利用率不同。数字图书馆以互联网为传递手段,把分布在不同地区和单位的各种文献信息数据库系统链接起来,突破了原有的时空局限,使信息量无限增大,提高了信息的利用
10、率。(3)检索的方法和效果不同。传统图书馆的资料查询、检索和借阅全都是手工操作,效率低、速度慢。数字图书馆将图书、期刊、照片、数据库、网页、多媒体资料等各类信息载体有机地组织并链接起来,以动态分布式的方式为用户提供服务,并自动标引、元数据、内容检索、不同数据库的互联等,使之实现网络化、智能化检索,从而为读者开辟了一条获取信息的高速公路,读者可以从海量信息库中迅速找出自己所需的资料。三、用数字化的方法对毛泽东生平、思想进行解析1数字化检索方法数字化的检索方法是毛泽东思想研究的得力助手,它能给毛泽东研究提供一个良好的平台。用户在使用检索方法进行信息搜索时,有时并不十分关注返回结果的多少,而是看检索
11、结果是否符合自己的需求。对于一次普通查询,传统的搜索检索动辄几十万、几百万篇文档,这样的搜索结果是没有太大意义的。如何才能让用户检索到更加有价值的东西,这才是检索的关键。一个良好的数字化检索系统应具有如下优点:检索结果准确;能利用自然语言进行检索;检索界面简洁明了,易学易用;检索结果经过适当加工,格式清晰,内容有条理性;支持多媒体;检索速度快。(1)基本检索,比较直观,只为用户提供一个简单的界面,而且只有一个检索框,按照检索项的分类检索,其检索结果的精度不高,适合于检索经验较少的读者使用。(2)高级检索,又叫复杂检索,这种检索灵活、准确,其检索的条件可以任意组合,例如我们可以在检索项中,把关键
12、词、篇名(题名)、作者、机构(单位名称)等通过逻辑关系的“并且”、“或者”、“不包含”对各个检索项进行逻辑组配,例如我们要研究毛泽东抗战时期的这段军事思想,先把毛泽东的文稿搜索出来,我们便可以在检索项中输入“1935年至1945年”、“毛泽东著作”,选择“并且”的逻辑关系来检索。高级检索对检索需求的表达功能更强,从一定程度上限制了检索的范围,使得检索更为快捷,因此其检索效率和检索结果的精度都比较高。尽管检索在一定程度上提高了研究的效率,但也存在不足,譬如检索结果冗余太多;不能对检索到的信息进行合适的组织与分类,所以如何去粗取精、由表及里,迅速准确地提供用户所需信息,成为下一代查询检索系统着重考
13、虑的问题。近年来,悄然兴起的文本挖掘技术和信息融合技术被应用到检索系统中,但这些新技术将使下一代查询检索系统更具智能化,更符合我们的需要。文本挖掘是一种智能化的工具,能够使人们免于陷入信息汪洋之中,从大量的冗余信息中迅速发现对自己有用的信息,同时在一定程度上揭示信息与信息之间的关联,产生新的用户以前未曾意识到的有用信息。传统信息检索软件所寻找的信息可能仅仅从字面上符合查询要求,并不是人们真正需要的信息;而运用文本挖掘技术则可以查询到人们真正需要的以及与之相关联、有价值、用户以前未曾注意的信息,而不仅仅是用户需求字面所表达的信息。文本挖掘可以对大量的文档集合的内容进行总结、分类、聚类、关联分析,
14、以及利用文档进行趋势预测等。文本挖掘超出了基于关键字和相似度的信息检索的范畴,是数字化研究毛泽东的必然趋势。2数字化统计方法我们可以把研究毛泽东生平、思想方面的论文录入相应的数据库,然后进行数据分析和统计,包括年代、研究主题、论文篇数、作者等方面进行统计,通过曲线图等多种图表形式来及时了解毛泽东研究领域的动态,热点和发展的趋势。例如我们要研究毛泽东军事思想,我们可以统计他各个时期的军事论文:第一阶段为为毛泽东军事思想初步形成阶段,这段时期毛泽东成功解决了中国革命走什么道路、建军、如何作战等问题,他的著作有中国的红色政权为什么能够存在?、井冈山的斗争等等。第二阶段为毛泽东军事思想科学体系的建立,
15、这段时期毛泽东相继发表了抗日游击战争的战略问题、论持久战、论新阶段、战争和战略问题等军事著作,这一时期,毛泽东军事思想已发展成为系统的理论,并经受了战争实践的考验。第三阶段为毛泽东军事思想的丰富和发展时期,这段时期主要包括抗日战争胜利后人民解放战争、抗美援朝战争以及新中国成立以来的和平建设时期,毛泽东的军事思想在抗日战争胜利后的时局和我们的方针、以自卫的战争粉碎蒋介石的进攻、集中优势兵力,各个歼灭敌人、解放战争第二年的战略方针等著作中得到充分体现。我们可以采用柱形图来统计毛泽东的各个时期的军事论文,探寻他军事思想的进程。当然,数字化统计有多种形式:柱状图、饼形图、曲形图、表格等,我们可以从统计
16、数据中分析、整理,从而获得毛泽东研究新方法、新资料,发现新问题、新观点。例如我们可以把数字化统计应用于毛泽东诗词领域,毛泽东的诗作共有69首,共计3997字,其中长短句34首,律诗、绝句26首,古风2首。在毛泽东诗词创作中,毛泽东应用了许多数字。经数字化统计,毛泽东诗词中共出现数字(含几、半)194处,平均每首2.8个。毛泽东诗词中使用“万”34处,“千”34处,“百”16处,“十”9处,“九”7处,“八”6处,“七”2处,“六”2处,“五”13处,“四”3处,“三”15处,“二”3处。另有“亿”2处,“几”7处,“半”3处和“卅”1处。从曲线图中,我们不难看到毛泽东对“百”、“千”、“万”数
17、字的使用频率极高,毛泽东诗词之所以“气魄宏大”,部分得归功于诗词中这些大数字的应用。运用数字化的图表统计能帮助我们更加轻松、快捷地归纳与总结信息,并找出研究的热点、难点。数字化的研究方法还有很多,笔者在此不一一列举。在信息爆炸的今天,数字化研究方法在毛泽东研究领域的应用仍然可以说是寥寥无几,甚至是盲点,研究方法的创新不但是势在必行,而且也是可能的。当代的高新科技手段为我们提供了巨大的发展空间,如果还是拘泥于老的思路和方法,我们研究的路子势必越走越狭窄,甚至走进死胡同;相反,如果能够大胆地引人数字化和其它方法,不但能够创新方法本身,还能够在理念和结果方面开创全新的局面,在内容上也能挖掘出更多新的、有价值的东西。笔者期待着研究同仁在毛泽东研究方法上最大限度地共享数字化的成果。(责任编辑:裴亮亮) -全文完-