1、第 卷 第 期 年 月北华大学学报(社会科学版)().语文现代化:语言技术应用与语言本体研究 与中国语言学的未来吴礼权摘 要 作为一种人工智能技术驱动的自然语言处理工具,目前已经具备一定的理解和学习人类语言的能力,能跟人类互动聊天,甚至还能完成论文写作等复杂任务,因而引发了包括学术界在内的社会各界的广泛关注与热烈讨论。作为一种人工智能技术驱动的自然语言处理工具,不管它目前的技术水平如何,能完成哪些超乎想象的工作;未来将会发展到什么程度,可以肯定的是,它对中国语言学的研究与教学定会产生深刻的影响。就发展前景而言,具有较强应用性,但也不是万能的,有其自身局限性。关键词;人工智能;自然语言处理;中国
2、语言学中图分类号;文献标识码 文章编号()收稿日期 .作者简介 吴礼权,复旦大学中国语言文学研究所教授,博士生导师,博士,日本京都外国语大学客员教授,中国台湾东吴大学客座教授,湖北省政府特聘“楚天学者”讲座教授,中国修辞学会会长,主要从事修辞学、语言学理论及中国古典文学研究。(上海)引 言聊天机器人 一经推出,便掀起了新一轮人工智能的讨论热潮。不同行业的精英、不同领域的学者,甚至不懂技术的普通民众,都参与了这场大讨论。因 关涉自然语言处理的语言技术、语言理论和语言应用(如语法、修辞)等问题,故笔者对 也给予了关注。现从语言学角度来谈一谈 与中国语言学未来的粗浅看法。之所以要谈 与中国语言学的未
3、来,而不是谈 与语言学的未来,是因为笔者粗通的外语有限,仅英语与日语两种,且学艺不精,故不敢基于普通语言学视角来作宏观的讨论。然就中国语言学的视角来谈,笔者因有几十年沉潜于汉语言文字学研究的学术经历,自觉有些底气。更重要的是,笔者认为,如何让 基于汉语视角而为国人服务,是中国语言学界同仁的历史使命。是个新鲜事物,且技术在不断快速更新,所以有关 的介绍内容也在不断更新中。截至 年 月 日 点,百度百科“”词条已经更新到 版,浏览量达 人次。年 月 日 点百度百科“”词条的解释为:(全名:),是 研发的聊天机器人程序,于 年 月 日发布。是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人
4、类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。年 月,中国支付清算协会倡议支付行业从业人员谨慎使用。年 月 日,此前临时禁止使用 的意大利开出了解禁的条件,但 日,西班牙国家数据保护局和法国国家信息自由委员会分别宣布对 展开调查。同日,欧洲数据保护委员会宣布成立专门工作组,以促进各国协同调查,并就各数据保护部可能采取的执法措施交流信息。这个词条提供的最有用的信息是:是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言与人进行对话,还能根据对话的上下文语境,像人类一样与用户进行互动交流,甚
5、至能完成撰写论文、邮件、视频脚本、文案、翻译、代码等任务。其中,神奇的是它“能够通过理解和学习人类的语言”,尤其神奇的是它能够“写论文”。也就是说,一定程度上可以自主地进行学术活动。据互联网上的消息,在美国的一些大学里,已经有学生利用 完成教师布置的论文作业,不仅完成效率高,而且质量还可以。这不禁引人思考:如果 真能写论文,是否意味着今后我们的学术研究就可以交给 了?我们认为,答案应该是否定的。即使 再怎么更新迭代,的工程师们再怎么训练,它都不可能替代人类。尽管如此,但我们也无法否认,是一项非常重要的技术发明,对科学研究,无论是自然科学(特别是实验科学)还是社会科学、人文科学研究,都有巨大的助
6、推作用。它可以使我们的科学研究基于大数据而效率更高,结论更准确。与语言学密切相关。是人工智能技术驱动的自然语言处理工具,所以它的诞生离不开语言学研究成果的支撑,它的发展又会助推语言学研究不断深化。基于汉语视角的,一定会促进中国语言学的发展,甚至影响中国语言学研究的方向和方法。基于这一认识,本文拟从语音学、词汇学、语法学、方言学、修辞学以及汉语史等几个方面对 之于中国语言学的未来发展前景作一畅想。一、将使语音学研究与教学现状大为改观语音学研究与教学涉及的内容很多,就汉语语音学而言,要研究的内容有:汉语普通话的声母、韵母、声调的构成及其配合,轻音、重音的特点及其作用,元音、辅音的变异与协同,语流音
7、变的规律,普通话语音(北京语音)的音位与音位变体,等等。这些内容,既是以往汉语语音学研究的重要方面,也是汉语语音教学的重要支点。的出现,将促使汉语语音学研究与教学发生重大变化。作为一种人工智能技术驱动的自然语言处理工具,对人类语音感知的灵敏度要远远胜过人的听觉感知,那么基于 工具对汉语语音的分析就会更加精准。如果将 运用于汉语语音研究,凭借 对人类语音灵敏、准确的感应力,以及 在人机对话中不断进化的理解与学习能力,汉语语音研究一定会有出人意料的成果。相对于 世纪初开始的实验语音学(,早期又称仪器语音学)利用各种实验仪器来研究、分析语音,在技术上不知跃升了多少倍。因此,我们相信 在汉语语音学研究
8、方面一定会有新的作为,不会像实验语音学那样长期局限于音长、音高、音强、音色及音位等特征的描写与分析的狭小天地中,而会基于人机对话的语音大数据在汉语语音研究领域有新的发现,进而拓展出汉语语音研究的新天地。在汉语语音教学方面,也大有用武之地。传统的汉语语音教学主要凭口耳,教学效果参差不齐。这既与教学者有关,也与学习者有关。就教学者而言,不是所有的教学者在普通话教学中都能做到发音绝对标准;就学习者而言,不是所有学习者的听力水平都一样,不同人在听觉敏感度上存在差异。因此,很难保证这种语音教学的效果能够达到理想满意度。如果在汉语(包括普通话和汉语方言)语音教学中引入,只要输入的发音是标准的,吴礼权 与中
9、国语言学的未来在执行语音教学任务时输出的发音就是标准的,学习者跟随 模仿学习,学到的发音也一定是标准的。更重要的是,这样的学习跟传统的语音教学必须借助课堂条件,只能在特定的时间、地点进行完全不同,学习者只要在手机等移动终端上安装 软件,就可以随时随地学习,不仅可以大幅提升学习效率,还会提升学习兴趣和学习质量。因为 “能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流”,学习者就等于拥有一个全天候的高级陪练。人机对话跟人际对话不同。人际对话中,如果学习者在学习过程中不断犯错,进展不大,会影响其学习积极性;若教学者表现出不满意或不耐烦,甚至批评几句,还会
10、挫伤学习者的自尊心与学习兴趣,进而影响学习效率和效果。但是,人机对话则不然,学习者不会因为学习过程中不断犯错而有丢面子的感觉,没有各种心理负担,而且可以随时打开软件温习巩固,学习效率会更高,自尊心和学习积极性不会受到打击。具有理解能力与聊天功能的,既能比人更敏锐地发现学习者发音上的错误,又会比人更有耐心地纠正学习者的发音错误,甚至可以模仿学习者发音的错误,跟自己正确的发音进行对比,让学习者在比较中发现问题,进而有针对性地改正自己的发音,提高发音的准确性。这种做法还可应用于普通话的普及推广,尤其是少数民族地区或港澳地区民众的普通话培训。在对外汉语语音教学方面,能够发挥的作用更值得期待。来华求学的
11、外国留学生,或是在海外接受国际中文教育的外国学生,在学习汉语普通话发音时遇到的问题较多,有的是声母问题,有的是韵母问题,更多的是声调问题。因为作为目的语的汉语与他们的母语在语音系统上有很大差异,有的音是他们母语中所没有的,所以要他们动用他们根本不曾动用过的发音器官发出汉语中的某些音,说出地道的汉语,是非常困难的。就像中国人学习俄语或意大利语,怎么练习都发不好小舌颤音一样,他们的发音总让中国人听来有一种怪怪的味道,即所谓的洋腔洋调。为了解决这些问题,我们在对外汉语教学中要花费大量时间纠正外国学生的发音错误,包括声、韵、调三个方面。然而,即使我们最终帮助他们纠正了这三个方面的错误,他们读单个汉字时
12、都能做到发音标准,但是读一句话或说一句话时,因为不懂“语流音变”规律,就又“洋腔洋调”了。外国学生学习汉语,有别于他们的母语习得。汉语作为他们的第二语言或第三语言,既无从小跟随大人在日常生活中自然习得的方便,也无终生学习的可能。他们对汉语的学习需要在一定的时间内完成,并且要达到一定的熟练程度。因此,教授、训练、纠正他们发音的教学时间不可能太多。为了弥补汉语发音训练时间的不足,外国学生必须在课后想办法强化训练,不然,就难以解决汉语发音方面的问题。如果借助 这一“人工智能技术驱动的自然语言处理工具”,利用 具有“根据聊天的上下文进行互动”的能力,创造一种类似人际交流的会话场景,那么外国学生学习汉语
13、发音方面的问题就会在寓教于乐的轻松氛围中解决了。作为一种先进的科学技术发明,对年轻学生肯定具有足够的吸引力,能够激发出他们强烈的好奇心与学习热情。二、将使词汇学研究与教学更有效率相比于语音学,词汇学研究与教学所涉内容更为丰富,可以助力的方面也更多。比如,词义的历时发展变化,包括词义扩大、词义缩小、词义转移,一直是词汇学领域研究的重要问题。以前考察某个词的词义发展演变,主要是通过大量历史文献的阅读分析,从中找出足够的例证,用材料说话,以证明某个词的词义是如何发展演变的。然而,汉语是世界上历史最北华大学学报(社会科学版)年第 期为悠久的语言之一,“汉语有文献的历史长达三千多年,自古以来方言就很复杂
14、,历代累积下来的词汇以数十万计。”面对如此丰富发达的词汇,要探索汉语词义古今发展演变的历史轨迹及其规律,就需要阅读浩如烟海的历史文献,并从中披沙沥金,找到词义发展演变的语言事实(语料),才能得出信而有征的结论。尽管这方面的研究成果已在 辞源汉语大词典 等大型辞书的许多词条中有所体现,但 辞源 汉语大词典 或其他语文辞书所提供的词语的词义发展演变的结论是否都可靠,学术界的意见并不一致。比如,某个词在什么时代发展出一个新义,辞书中虽然会举出相关的例证,看起来是基于历史文献中的语言事实,是信而有征的,但这个结论也许并不可靠。因为可能还有更早的、更多的语言事实研究者没有找到,或者所举相关例证恰恰是非主
15、流用法的个案。事实上,任何一位汉语词汇学研究者无论怎么努力,无论多么博学,都会有时间、精力的局限,以及所掌握的材料的局限。也就是说,其相关研究并不是基于穷尽性的语言事实。这就是“手工作坊”式的人工研究的局限性所在。正因为如此,这些辞书会不断根据学者们发现的新材料、新例证和得出的新结论,对相关词条的释文予以修正。因此,只要有学者找到了新的不同的语言事实为证据,原来的结论就必须推翻而代之以新的说法。但是,如果我们借助 这一“人工智能技术驱动的自然语言处理工具”,像 的工程师们那样对 进行相关能力的训练,并将相关汉语历史文献全部数据化,那么,就可以依托大规模的语料库,让具有理解与学习能力的 基于大数
16、据模型自主开展搜集、整理、分析工作,对汉语词义的发展演变做一个全面的、穷尽性的研究,进而得出比“人工作坊”式的研究更可靠的结论。如果将 基于大数据模型得出的结论写入 辞源 汉语大词典 等汉语辞书的词条,就会大大提升语文辞书的权威性。又比如,基本词汇与一般词汇都是汉语词汇学研究的对象,学者们既关注基本词汇的稳固性与可延续性,也关注一般词汇的非稳固性与可转变性。汉语词汇史研究需要通过考察不同历史时期汉语基本词的数量变化来分析汉语基本词的发展演变规律,从而了解哪些基本词是稳固的,从上古到中古,从近代到现代,始终活跃于汉语表达中;哪些基本词又是如何逐渐失去了“常用性”,进而失去了“全民性”,最终变成一
17、般词的。同时,汉语词汇史研究也要通过对不同历史时期词汇发展演变情况的全面考察,探究一般词是如何随着社会的发展变化而逐渐具有“常用性”与“全民性”,进而由一般词晋级为基本词的。这两个方面的研究,是过往汉语词汇学研究者用力最多的,但也是研究结论最不一致而争议最多的。究其原因,是研究者们所依据的历史语料不同,或是在历史语料的占有数量上存在差异所致。语言学研究,其结论是建立在语言事实基础之上的,语言事实的调查获取越是扎实丰富,结论就越令人信服。传统的汉语词汇学研究,都是依靠研究者大量搜集、阅读汉语历史文献,从中爬梳语料,最终得出结论的。但人的时间、精力与视野是有限的,故这样的研究既辛苦又效率不高,还很
18、难保证结论的可靠性。的出现,情况可能就完全不一样了。只要做好基础工作,即将相关的汉语历史文献进行数据化处理,具有自主理解与学习能力的 就能基于大数据模型,按照我们设定的研究目标而对大规模语料进行“提取分析”的自主研究。这样的研究,得出的结论肯定比“人工作坊”式的研究要可靠,而且效率要高得多。参与的汉语词汇学教学,也会更有吸引力,效果会更好。外来词是汉语词汇的有益补充,也是观察中国社会历史发展的重要窗口,还是研究中国与世界其他民族政治、经济、文化等交往历史的活化石,因此外来词的研究一向都是备受学者们重视的。但是,由于汉语吸收外来词历史悠久,且引入途径复杂,有的是“直接进入民族共同吴礼权 与中国语
19、言学的未来语”,有的是“先进入方言区,然后吸收进民族共同语”,要系统研究汉语外来词,梳理各种外来词的来龙去脉,不仅工作量大,而且还不能保证研究结论的准确可靠。因为外来词是伴随着不同历史时期的中国跟世界其他民族主动或被动交往而逐渐进入汉语的,它们或见之于中国古代的各种正史或野史,或见之于诗、词、曲、赋等文学作品,或是见之于文人笔记、散文、小说(如敦煌变文,宋元话本小说)等。由于外来词进入汉语非一朝一代之事,也非来自一两个外民族的语言,加上外来词的语言事实多是零碎而分散的,不像汉语词汇系统中其他成分那样较为集中地呈现于特定的某类历史文献中,搜集、查阅、整理、分析语料的工作特别繁重,因而研究汉语外来
20、词的历史演变就相当困难。现在有了 的加持,只要我们做好前期历史文献的数据化工作,那么汉语外来词的研究工作就可以设定不同的课题,让 基于大数据模型展开“自主”研究。如要对现代汉语中诸如“警察”“积极”“消极”“自由”“民主”“化学”“科学”等来自日语的“借形外来词”的身份进行鉴别,清理现代汉语词汇的“家底”,只要将数据化的 现代汉语词典 辞源 辞海 等语文辞书中的全部词目与数据化的日语辞书中的全部词目进行对比分析,就能清理出现代汉语词汇中哪些词是中国的“本土制造”,哪些是源于日本人以汉字为“原材料”进行“加工制造”而成的“东洋制造品”,也就是“来料加工品”。这样的工作,恐怕很难凭一己之力或少数人
21、的合作,采用传统的“人工作坊”式的研究在短期内完成。但借助,这样的工作就能在很短时间内轻松完成,而且结论一定会相对可靠。如果以此研究成果运用于教学中,无论是中国学生学习日语,还是日本学生学习汉语,都会大有助益,最起码可以提升其学习积极性与学习效率。三、将使语法学研究与教学更具科学性语法学可谓是汉语语言学的“显学”,不仅研究者人数最多,而且门派众多。自 马氏文通 以来,汉语语法研究大多都是追尘西方语法理论,真正基于汉语语言事实,看清汉语语法本质及其特点,能够提出自主语法理论的学者很少。正因如此,长期以来汉语语法研究者多陷于对个别语法现象理解的分歧、争论之泥潭而不能自拔。汉语语法跟印欧语系诸语言的
22、语法相比,有着自己鲜明的特点。只是我们的语法研究者长期囿于自己的学术视野与思维惯性,看不清汉语语法鲜明的特点,倒是一些非语言学专业背景的学者,如著名美学家朱光潜和著名文学批评理论家郭绍虞等人,反而是“旁观者清”,对于“横看成岭侧成峰,远近高低各不同”的汉语语法现象有着清醒而独到的认识,能够一针见血地道出汉语语法的特点。如朱光潜在探讨中国诗歌何以走上“律”之路时曾经说过:“西文的文法严密,不如中文字句构造可自由伸缩颠倒,使两句对得很工整。比如 红豆啄余鹦鹉粒,碧梧栖老凤凰枝 两句诗,若依原文构造直译为英文或法文,即漫无意义,而中文里却不失其为精练,就由于中文文法构造比较疏简有弹性。再如 疏影横斜
23、水清浅,暗香浮动月黄昏 两句诗没有一个虚字,每个字都实指一种景象,若译为西文,就要加上许多虚字,如冠词前置词之类。中文不但冠词和前置词可以不用,即主词动词亦可略去。单就文法论,中文比西文较易于诗,因为它比较容易做得工整简练。”朱光潜所言的“西文的文法严密”、“中文字句构造可自由伸缩颠倒”、“中文文法构造比较疏简有弹性”,就是汉语语法之鲜明特点。郭绍虞跟朱光潜不同,他对汉语语法特点的认识不是在谈文学时顺便提出来的,而是专门撰写了一部近六十万字的 汉语语法修辞新探,以文学批评家对母语汉语的直觉,指出了汉语语法的三个特点:简易性、灵活性、复杂性。其中,前两个特点就是朱光潜所说的“疏简有弹性”。可见,
24、两位文学北华大学学报(社会科学版)年第 期理论家对汉语语法特点的认识是“英雄所见略同”。然而这两位“英雄所见略同”的文学理论家教育背景是迥然不同的。朱光潜先后求学于中国香港大学、英国爱丁堡大学、法国斯特拉斯堡大学,并获哲学博士学位,是一位西学教育背景深厚的学者;而郭绍虞则仅在蒙养义塾读过几年书,受的是中国传统旧式教育。他们之所以在教育背景不同而且都不从事语言学专业研究的情况下,却在汉语语法特点的认知上达成了异乎寻常的一致,是因为他们都没有受西方语法学观点的影响,而是从汉语语言事实出发,基于对汉语语法的直觉,故他们对汉语语法特点的认识是较为准确的,概括得颇为精当。相反,自马建忠之后,中国的很多语
25、法学家都是先学西方语法理论,然后再研究汉语语法,这就难免会受先入为主的西方语法理论的影响,结果在面对汉语语言事实时就显得迷茫而失去自我。汉语语法研究(包括对外汉语教学领域)常见一种现象:对于同一个汉语语法现象,学者们往往有完全不同的理解和解释。原因在于,除了他们各自掌握的语言事实有所不同(有的全面些,有的不全面)以外,就是他们各自所接受的西方语法理论不同。如果他们不受西方语法理论影响,对汉语语法现象的认识是基于自己的独立思考,而且是建立在全面、真实的汉语语言事实的基础之上,就不会有那么多认识上的分歧,结论就会趋于客观科学而“英雄所见略同”。的出现,将有助于汉语语法研究与教学,使之更具科学性。早
26、先的汉语语法研究与教学,所持语言事实即语料都取材于诸如鲁迅、老舍、茅盾等现代著名作家的经典文学作品,因为他们的作品被视为“典范的现代白话文著作”,是现代汉语的“语法规范”。其实,这些著名作家或是留学日本(如鲁迅、茅盾),或是有在欧美生活与学习的经历(如老舍),受西洋语法与东洋语法的影响至为深刻。比如鲁迅,其文学语言在语法上受日语的影响非常大,他在译介外国文学作品时主张“硬译”(即照外文语法结构直译)。因此,他们的汉语表达是否能代表本色的汉语,是要打个大大的问号的。如果他们的文学语言不是本色的汉语,而是受西洋语法或东洋语法影响的“改造版汉语”,那么以之为研究现代汉语语法的语料,得出的结论恐怕就不
27、是科学的结论。如果现代汉语语法研究所据语料取材不局限于鲁迅、老舍、茅盾等少数著名作家的经典作品,而是范围扩及更多作家乃至普通大众的书面或口语作品,通过建立库容足够大的语料库,然后再借助,结果肯定不一样,得出的结论也更经得起检验。汉语语料库的建设,始于 世纪 年代,是受西方语言学影响的结果。最初是用于汉语词汇的统计分析,后来慢慢拓展至语法等其他方面的研究。由于中国的语料库建设起步晚,加上绝大多数学者对此并不熟悉,更不善于运用,所以直到今日,还有很多学者研究汉语语法仍然采用“人工作坊”式的语料收集方式。如此,他们观察汉语语法现象的视野难免受到局限,掌握的语言事实有所不足,因而影响到结论的可靠性,乃
28、至于同一语法问题不同的学者在几十年内做出不同的结论,甚至同一学者也会得出前后不一的结论。如汉语副词“都”,很多人一直在研究,发表的论文难以计数。为什么会不断地研究与讨论呢?就是因为大家的研究都不到位,还有完善的空间。之所以研究不到位,其中一个重要原因是研究者们掌握的语料都不充分,如果相关研究是基于较为完备的语料库,是基于大数据模型而得出的结论,那么这个结论就比较接近事实,更多学者也会认同,一段时间内讨论的空间和意义就不大了。经过数十年的努力,目前我国的语料库(如北大语料库、北语语料库等)建设越来越趋于完备了,在 的协助下,今后对某一汉语语法现象的研究就要轻松得多,汉语语法研究会有飞跃式发展。如
29、此一来,包括国际中文教育在内的汉语语法教学,也会更具客观性和科学性,教学效果与效率也会大幅提升。同样,如果能够做好相应的基础数据工作,再借助 这一新工具,将来汉语语法史吴礼权 与中国语言学的未来研究也会大有可为,并更具科学性。既往的汉语语法史研究,都是基于人工收集语料,然后排比分析,最后得出结论的。比方说,汉语系词的产生及其发展、汉语使成式的产生及其发展、汉语处置式的产生及其发展、汉语被动式的发展、汉语递系式的发展等,在王力的 汉语史稿 及其他学者的汉语史著作中都有论述,但结论不尽相同,而且随着时代的推移,不同的结论越来越多,分歧越来越大。主要原因就是大家所据以得出结论的语料有所不同。一般说来
30、,占有相关语料更为完备的学者,其得出的结论可能就更接近事实;反之,其得出的结论在可靠性和科学性上就相对弱一些。因此,我们认为,借助 这一新兴工具,汉语语法史研究将会大有改观,研究结论的科学性与教学的有效性,一定有较大提升,只要我们前期的基础数据处理工作做得好。四、将使方言学研究与教学如虎添翼方言学研究和教学的内容也很丰富,这里仅以方言调查为例。方言调查是方言学研究必备的重要的一环,包括调查了解对象方言的语音、词汇、语法等。语音调查方面,既要选好方言调查点,更要选好不同年龄与文化层次的方言发音人,同时要利用国际音标做好方音记录,然后整理所调查方言的声、韵、调系统。词汇与语法调查方面,需要做的工作
31、更多,既要有文献调查,了解所调查方言的词汇、语法的历史变迁,又要有田野调查,了解所调查方言的词汇、语法的面貌实况,分析其结构特征。可见,方言学的研究仅在方言调查这一环节,就有许多繁重的工作要做。而汉语有七大方言区(或曰十大方言区),每个方言大区又包含很多方言小区,情况非常复杂。所以,汉语方言调查需要做的工作很多,工作量是巨大的。由于方言研究的特殊性,尤其是方言田野调查工作的艰巨性,相比于 世纪五六十年代,现在的年轻学子愿意从事这方面工作的人越来越少了,未来这一学科是否后继有人都要打一个大大的问号。若汉语方言研究真的难以为继,未来的汉语方言教学也会存在很大问题。不过,随着 这一新工具的横空出世,
32、这种情况将会出现转机。将使汉语方言学的研究与教学如虎添翼,未来大有可期。仅就方言田野调查而言,就是一个极好的辅助工具。凭借现有的技术储备,完全可以让其代替人去执行传统的人工记音与音系分析等工作。只要实现了这一目标,就完全可以扩大工作范围,拓展研究的深度。众所周知,以往的方言田野调查,限于人手和经费的不足,调查点的数量非常有限,选取的被调查对象人数也是很有限的,这无疑会影响调查结果的真实性准确性,进而影响到音系分析归纳的准确性。汉语方言的分区问题在汉语方言学界之所以存在很大分歧,主要是方言田野调查不够全面深入造成的。如果调查足够全面、细致,大家的数据就会是相近或相同的,结论自然就不会有那么大分歧
33、,甚至可以避免不必要的重复劳动。有了 这一功能强大的工具,今后在方言田野调查时,完全可以把方言调查工作做得更加充分完满,包括选定足量的方言调查点,增加被调查人的数量,并按照年龄、文化层次、行业领域等细化被调查人群等。这样,就能掌握所调查的对象方言更为准确的语音状况,分析归纳出一个尽可能准确的方言音系。此外,还可以结合目前业已完成的各种方言音档,以及已经出版的 汉语方言大词典 东北方言词典 北京方言词典 上海方言词典南京方言词典贵阳方言词典温州方言词典宁波方言词典忻州方言词典 等各区域范围的方言词典的材料,对之进行数据化处理,然后以此为依托,借助 进行大数据模型研究,对汉语不同方言的声韵调系统、
34、词汇系统、语法系统的发展演变规律作出一个全面准确的描写。这样不仅可以大大提升汉语方言北华大学学报(社会科学版)年第 期研究的效率,也会大大提升汉语方言研究结论的科学性,从而为汉语方言教学提供保证。五、将使修辞学研究与教学别开生面在中国,修辞学虽然是语言学的一个分支,但相较于语音学、词汇学、语法学,还是有着较大的特殊性。语音学、词汇学、语法学研究,都是基于各自的内部结构规则和使用规则而探讨其间的规律,修辞学则不然。修辞学研究的对象是修辞现象,而修辞现象往往不是基于语言自身的结构规则和使用规则,相反,修辞者为了取得某种特殊的表达效果,往往会力图突破语言自身的结构规则和使用规则。因此,从某种意义上说
35、,修辞是一种语言的艺术,是一种创造性的语言活动。正因为如此,修辞的规律事实上是很难把握的,并不像语音、词汇、语法那样通过分析归纳就可以得出一些基本使用规则或发展规律。因此,在以往的修辞学研究中,任何试图将修辞研究纳入科学范畴的努力都未能成功,相反,将其纳入艺术的范畴则得到了更多人的认同。如“霜皮溜雨四十围,黛色参天二千尺。”杜甫 古柏行 中的这两句诗是修辞上的夸张,意在通过对成都武侯祠古柏高大形象的描写,表达对武侯诸葛亮丰功伟绩与高尚人格的崇敬之意。但是,北宋科学家沈括在 梦溪笔谈(卷二十三)中却对杜甫这两句诗提出了批评:“杜甫 武侯庙柏 诗云:霜皮溜雨四十围,黛色参天二千尺。四十围乃是径七尺
36、,无乃太细长乎?”很明显,沈括的批评是基于其科学家的立场和科学态度,而不是基于文学鉴赏的视角,超出了艺术范畴,因此不为文学家所认同。可见,修辞现象不同于一般的语言现象,研究修辞现象的修辞学也不同于研究一般语言现象的其他语言学分支学科。尽管修辞学有其自身的特殊性,但是同样可以借助 充分发掘其发展潜力,尤其是在修辞学研究与教学的科学化方面,有了 这一工具,未来可做的事会更多。比如,语言风格的研究与教学,以往一直是汉语修辞学的薄弱环节。究其原因,就是语言风格比较抽象,研究者与教学者都很难把握。在很多修辞学著作或教科书中,虽然都会讲到柔婉风格与刚健风格、简约风格与繁丰风格、平淡风格与绚烂风格、明快风格
37、与含蓄风格、庄重风格与幽默风格,但都说得模糊笼统。之所以如此,是因为研究者们对于这些语言风格具体特征的认识都是凭其整体印象而得出的,并不是基于具体的语言要素的统计分析,因而不具有科学性。虽然后来有学者采用了定量统计分析的方法,对上述五组十种语言风格进行了重新总结归纳,但是对具体语言要素进行统计分析时,在文本选择的“量”上明显有所不足,这不免使结论的权威性打了折扣。有了,未来的语言风格研究就完全会是另一番景象:先期做好相关文本的数据化处理,然后设定要具体分析的语言要素项目,其余工作就交给 处理,最后一定会得出科学而权威的统计结果。这样得出的研究结论就会令人信服,在进行语言风格的教学时就能以更丰富
38、的用例和科学数据说话,将某种语言风格的特征讲得具体而确切,不至于模糊笼统,语焉不详,令人无所适从。又比如,语体的研究与教学一直也是个薄弱环节。过去的修辞学著作或教科书虽然也讲口语语体和书面语语体各有什么样的特征,以及书面语语体中的事务语体、科学语体、文艺语体三者之间在语言特征上又各有什么不同,讲得也是头头是道,但是都没有具体数据的统计与分析,只是说到有什么特征时会举几个例子,这种整体印象式的结论,明显不具有科学性,结论很难令人信服,当有人提出“例外”用例的时候,就难以自圆其说,解释不清了。出现后,再进行汉语语体研究,就完全可以像语言风格研究那样,先做好相关文本的数据化前期处理工作,然后设定要具
39、体分析的某一语体的相关语言要素项目,接下来就将工作任务交给吴礼权 与中国语言学的未来,最后一定能得出一个科学而权威的结论。持这样的结论进行语体教学,就能基于相关数据和大量用例将某种语体的语言特征讲得具体而确切,使学生易于理解和应用。再比如,修辞格一直是修辞学研究的重要内容,也是学者们用力最勤的方面。但是,长期以来,修辞格的研究很难科学化。汉语修辞格的研究情况亦然。究其原因,是因为很多修辞格的描写很难做到形式化。如“双关”“折绕”“讳饰”“留白”“藏词”“倒反”“镶嵌”“推避”“飞白”“讽喻”“别解”“旁逸”“互文”等,都非常依赖特定的语境,从语言形式上很难识别它们的属性。要借助 工具来对这些汉
40、语修辞格进行研究,恐怕还有很大难度,因为这些修辞格作为人类复杂运思过程的产物,既无形式上的标记,又无固定的语义生成模式,虽有一定的“理解和学习人类语言”的能力,但要仅凭文本上下文提供的语境就能了解这些特定修辞格表达的“微言大义”,除非其自主理解能力达到人类思维的高度。不过,还是有一些汉语修辞格是可以从形式上加以识别的,如“比喻”(“本体”与“喻体”之间有“喻词”作为纽带),“歇后”(“谜面”与“喻解”之间有“”号作标志),“对偶”(两句相对,字数相等,句法结构相同),“排比”(三句或三句以上连续铺排,结构相同或相似),“回环”(字句头尾衔接,顺读倒读都能成文),“反复”(前后词句相同,或连续反
41、复,或间隔反复),“设问”(无论是为提醒下文的“提问”,还是为激发本意的“激问”,书面上都有“?”号为标志,口语中都有高升的语调),“同异”(毗邻的句子前后有字词的同异对比),“同语”(或是“主表同辞”,或是“定中同辞”),“易序”(前后句中的某些词在语序上发生了变化,前后对照一目了然)等,都有一定的形式标记,不太依赖语境,很容易分辨出来。如果对这些汉语修辞格进行研究,就大有用武之地。特别是辞格史研究,只要前期文本数据化工作做得好,针对上述有形式标记的汉语修辞格进行历史演进的系统研究,的作用将会发挥得淋漓尽致。我们相信,基于大数据运算得出的结论,肯定会比目前所见汉语辞格史的研究结论要准确科学得
42、多。因为既有的汉语辞格史著作所描写的汉语辞格的演变史,都是基于少数人或个别人根据有限的历史文献资料所作的调查而写出的,研究结论建立在非常不完备的语料基础之上,结论就不可能准确;而未来借助,就可以突破人力与语料上的局限,基于大数据运算进行的研究,既可大大提高效率,又能提高准确度。因此,我们乐观地预测,有 的加持,将来汉语辞格史的研究将会别开生面。结语:有用但并非万能以上,我们就一种新面世的人工智能技术驱动的自然语言处理工具 未来对汉语语音学、词汇学、语法学、方言学、修辞学的研究与学科发展可能产生的影响进行了大胆预测与畅想,认为 对中国语言学的未来发展有重要的助推作用。值得注意的是,作为一种人工智
43、能技术驱动的自然语言处理工具,虽然对中国语言学各分支学科的研究与教学都有重要作用,但它并不是万能的。尤其是对汉语修辞学研究与教学,其局限性恐怕要比汉语语音学、词汇学、语法学、方言学等分支学科明显得多。因为汉语修辞学研究的对象是汉语表达中的种种修辞现象,而修辞现象跟一般的语言现象是有所不同的,修辞更强调创造,强调对现有的语言结构规则与表达规范的突破。因此 要想准确地理解人类创造的修辞文本,破译修辞文本建构者达意传情的“微言大义”,恐怕并不那么容易。比如,在上海有这样一个场景:两位上海的好友在街边站着聊天,有一个男子从他们身边走过,甲不经意间看了那男子一眼,突然瞪大了眼睛,望着那远去的男子,久久没
44、有说话。乙不明就北华大学学报(社会科学版)年第 期里,问道:“你怎么了?”甲说:“我刚看到了一个熟人。”乙笑道:“看到个熟人有什么稀奇的,至于眼睛瞪那么大吗?”甲回答道:“前几天我听人说,他从山上下来了,我还不相信呢?没想到今天就看到他了。这可是位”乙点了点头:“原来如此。”作为一种人工智能技术驱动的自然语言处理工具,虽然具有一定的理解和学习人类语言的能力,但肯定不能理解上述两个上海人对话中“他从山上下来了”这句话真实意思。因为“从山上下来”是一句上海隐语,意指“刑满释放”。理解学习能力纵然再强,仅凭对话的上下文语境,恐怕难以理解“从山上下来”这句话的真正含义。除非它深入学习了上海地方文化的方
45、方面面,对上海旧时隐语的修辞含义都能掌握,否则,不可能短期内达到人类对相关隐语修辞含义的理解水平。至于对修辞文本建构规律的认识与把握,能够达到的水平层级恐怕还要低一些。作为一种人工智能技术驱动的自然语言处理工具,虽然目前已经“能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务”,但它毕竟只是人类智慧的产物,是人类创造出的智能工具,目前还远远达不到与人类比肩的思维和智力水平,未来其自主学习与理解的能力究竟能发展到什么水平,目前还难以预料。虽然现在有不少科幻作品表达了人类对人工智能机器超越或控
46、制人类的恐惧,但机器就是机器,毕竟不是人,只不过是人创造的产物,其思维和“创造力”永远无法超越人类。作为一种新兴的人工智能产品,自然深受人们关注。不过,现阶段人们对 的认知还是有限的,对于 的真实能力,未来会发展到什么程度,以及未来对中国语言学发展实际产生的影响到底如何,相信大多数人都难以预料。但我们可以肯定地认为:对未来中国语言学的研究与教学大有助益,但它并不是万能的,一定有其局限性。参考文献 百度百科:?汪维辉汉语词汇史上海:中西书局,冯海霞英源食品类外来词形式称名的变异 基于新华外来词词典的研究北华大学学报(社会科学版),():朱光潜朱光潜美学文学论文集长沙:湖南人民出版社,郭绍虞汉语语法修辞新探北京:商务印书馆,胡裕树现代汉语重订本上海:上海教育出版社,王力汉语史稿重排本北京:中华书局,黄伯荣,廖序东现代汉语增订第六版北京:高等教育出版社,倪宝元大学修辞上海:上海教育出版社,吴礼权现代汉语修辞学第 版上海:复旦大学出版社,【责任编辑 李开拓】吴礼权 与中国语言学的未来 ():,:;():,“”,“”,“”,“”,:;