收藏 分销(赏)

中国台湾南岛语的定量分类及其横向交流探析.pdf

上传人:自信****多点 文档编号:608330 上传时间:2024-01-12 格式:PDF 页数:11 大小:1.82MB
下载 相关 举报
中国台湾南岛语的定量分类及其横向交流探析.pdf_第1页
第1页 / 共11页
中国台湾南岛语的定量分类及其横向交流探析.pdf_第2页
第2页 / 共11页
中国台湾南岛语的定量分类及其横向交流探析.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第3卷 第2期 海峡人文学刊海峡人文学刊 Vol.3,No.2(2023 年 6 月)Journal of Humanities across the Straits (Jun.2023)84 台湾南岛语的定量分类及其横向交流探析 范志泉1,2(1.福建师范大学 闽台区域研究中心、文学院,福建 福州 350007;2.福建工程学院 南岛语族研究院,福建 福州 350118)摘 要:主要分布在我国台湾地区的高山族,所操语言归属于南岛语系。由于保留较多原始南岛语言特征,台湾南岛语在整个南岛语的谱系中占有重要地位。然而其内部分类研究在学术界一直是比较有争议的课题。在定量分析的基础上,从跨学科协作视角

2、,采用语言学的词源统计分析法,结合新进生物学的演化网络生成理论和方法,重新对其分类进行研究,将更为全面、系统地了解台湾南岛语及其人群的演化历史面貌。关键词:台湾南岛语;数理分类;演化网络;Delta 值 中图分类号:H2 文献标识码:A 文章编号:2096-9767(2023)02-0084-10 收稿日期:2022-10-03 基金项目:国家社科基金青年项目“台湾南岛语的语音对应规律数据库建设与研究”(22CYY047)作者简介:范志泉,民族学博士,福建师范大学闽台区域研究中心、文学院,民族与语言研究所讲师、硕士生导师;福建工程学院南岛语族研究院客座研究员。主要研究方向:南岛语言学,演化语言

3、学。高山族是我国境内使用南岛语的主要人群,分布在台湾岛、兰屿等地,据调查共有 579,446人(2020 年 11 月),其中台湾地区 575,967 人;其他地区 3,479 人。作为中央政府对台湾地区的少数民族的统一族称,“高山族”一词自 20 世纪 50 年代起一直沿用至今。历史上高山族曾有过“夷”“番”“山胞”等不同称呼。日本殖民统治台湾时期,高山族还被称为“蕃”“高砂族”。高山族语言诸语,亦被称为“台湾南岛语或台湾南岛语族”,主要包括泰雅语(Atayal)、赛德克语(Seediq)、邹语(Tsou)、卡那卡那富语(Kanakanavu)、沙阿鲁阿语(Saaroa)或拉阿鲁哇语(Hla

4、alua)、布农语(Bunun)、鲁凯语(Rukai)、排湾语(Paiwan)、阿美语(Amis)、卑南语(Puyuma)、雅美语(Yami)或达悟语(Tao)、噶玛兰语(Kuvalan)、赛夏语(Saisiyat)、巴则海语或巴宰语(Pazih)、邵语(Thao),以及业已消失的凯达格兰语(Ketagalan)、道卡斯语(Taokas)、巴布拉语(Papora)、巴布扎语(Babuza)、洪雅语(Hoanya)、西拉雅语(Siraya)、猴猴语(Qauqaut)、龟崙语(Kulon)等 20 来种。为行文方便,本文将包括兰屿雅美语在内的高山族诸语言概称为“台湾南岛语”。海南省三亚市回辉、回新

5、两村的回族,其主要交际用语被称为“回辉语”,属于南岛语系占语支。数据来源:台湾地区“原民委”官网 www.cip.gov.tw/portal/index.html 数据来源:国家统计局官网 李壬癸:台湾南岛语言,台湾南岛语言论文选集(第一册),台北:“中研院”语言学研究所,2004 年,第1-48 页。范志泉:台湾南岛语的定量分类及其横向交流探析 85 一、台湾南岛语的内部分类研究概况 关于台湾南岛语的内部分类研究一直是学术界讨论的课题。自 20 世纪 50 年代起,经过几代人系统而又全面的田野调查,台湾南岛语面貌已基本清晰明了。由于台湾南岛语及其下位分支语言的多样性、复杂性,加上学者囿于自身

6、所采用的分类理论、方法和材料的不同,导致在有关台湾南岛语的内部分类研究上仍然争议不断,如表 1。表 1 台湾南岛语的内部分类 浅井惠伦(1936 年)北部语群;布农语;邹语-排湾语群;阿美语;雅美语 戴恩(1963 年,1971 年等)泰雅语群;邹语群;第三语群(后改为“排湾语群”)Ferrell(1969 年)泰雅语群;邹语群;排湾语群(其下再分两个分支)土田滋(1998 年)西北语群;南台湾语群 Starosta(1995 年)原始南岛语最先分化的是台湾地区的鲁凯语,其后依次一一分化 何大安(1998 年)“台湾类型”语言;“非台湾类型”语言 Blust(1999 年)泰雅语群;西北语群;

7、西部平埔诸语;邹语群;鲁凯语;排湾语;卑南语;布农语;东台湾语群 李壬癸(2006 年)北部台湾语群;中部台湾语群;南部台湾语群;东部台湾语群 Sagart(2004 年)雷朗语;赛夏语;巴则海语;Pituish 语群 Ross(2009 年)卑南语;邹语;鲁凯语;核心南岛语 吴安其(2009 年)泰雅-赛夏语群;邹-卑南语群 在上表中,浅井惠伦、Blust、何大安、土田滋、李壬癸、吴安其等人采用传统的分类标类标准,即主要是依据建立语音特征和演变规则,例如辅音、元音的音变类型等不同特点来划分的定性分类。小川尚义、浅井惠伦发现台湾地区的南岛语保留有原始南岛语(Proto-Austronesian

8、,PAN)的两个区分,*t1(后戴恩改写为*t)和*t2(后戴恩改写为*C)以及*n1(后戴恩改写为*n)和*n2(后戴恩改写为*N),而台湾地区以外的南岛语都合并。何大安将南岛语中具有保留原始南岛语语 PAN 舌尖塞音*t 与舌尖塞擦音*C的分别、舌尖鼻音*n 与舌尖边擦音*N的分别这类特征的语言,称为“台湾类型”语言;而不具有这些特征的语言,即都经历过*Ct 与*Nn 的语言,称为“非台湾类型”语言。吴安其则是根据原始南岛语 PAN*、*、*和*等的语音演变情况。除基于语音特征的分类标准外,Starosta 和 Ross 等则是基于构词特征,如 Starosta 主张原始台湾南岛语在谱系树

9、上基本和原始南岛语相等,所有台湾地区以外的南岛语在整个南岛语谱系上,都属 雷朗语(Luilang)属于凯达格兰语,已消失,仅有若干单词存世。沙加尔一文中“Pituish”是由 PAN*pitu“7”派生而来,指蕴含数字 7 的一组语群。转引自潘英:台湾“原住民族”的历史源流,台北:台原出版社,1998 年,第 83-85 页。R.Blust,“Subgrouping,Circularity and Extinction:Some Issues in Austronesian Comparative Linguistics,”in Elizabeth Zeitoun,Paul Jen-kuei

10、Li(eds),Selected Papers From the Eighth International Conference on Austronesian Linguistics,Taipei:Institute of Linguistics,“Academia Sinica”,1999,pp.31-94.何大安:台湾南岛语的语言关系,汉学研究1998 年第 2 期。土田滋:言語研究誘.台湾“原住民”研究招待.日本順益台湾“原住民”研究会編.東京:風響社.1998 年.第 137-139.李壬癸:从本土到国际:台湾南岛语言研究的契机,四分溪论学集:庆祝李远哲先生七十寿辰,刘翠溶编,台北:

11、允晨文化实业股份有限公司,2006 年,第 737-738 页。吴安其:南岛语分类研究,北京:商务印书馆,2009 年,第 267-273 页。李壬癸:日本学者对于台湾南岛语言研究的贡献,台湾语文研究2009 年第 4 期。海峡人文学刊 2023 年第 2 期 86 于较低的层次。不过 Ross 则认为迄今为止重建的原始南岛语实际上应该位于南岛语谱系树中较低层级的一个位置,反映它的语言属于一个不包括卑南语、邹语和鲁凯语的分群,即“核心南岛语”。核心南岛语有一个复杂的共同创新,即原始南岛语作为名物化的一些标记,在这些语言中演变成动词的标记。此外,也有基于词汇特征的分类,Sagart 基于数词 5

12、 到 10 所蕴含的词汇创新层级分类,即 7“*pitu”5“*lima”6“*enem”8“*walu”9“*Siwa”10“*puluq”。除定性分类研究外,也有学者采用词汇统计的定量方法。如:戴恩以斯瓦迪士 200 词,对 14种台湾南岛语作词汇学统计;Ferrell大体沿用戴恩的三分法,不同的是,他将戴恩的第三语群称为“排湾语群”,并以原始南岛语的舌尖塞音*t 与舌尖塞擦音*C在排湾语群中是否区别为依据,把排湾语群继续下分为 2 支,保留*t 与*C 分别的语言为“排湾语群第一分支”;发生合并的,即*Ct的语言为“排湾语群第二分支”。此后,在中国大陆出版的两部涉及台湾南岛语相关介绍的台

13、湾高山族语言和中国的语言,二者的分类基本直接沿用前述戴恩的三分法。Gray 和 Jordan 以及 Gray、Drummond、Greenhill 等人在国际权威期刊 Nature、Science 上也陆续发表了几篇有关南岛语言谱系树模型的研究,文中有涉及台湾南岛语在谱系树的位阶。他们尝试将生物学中研究人群分类及其时间深度而发明的计算程序及其系统发育树的构建和生成方法应用于南岛语的研究。他们的研究结果显示:新产生的南岛语言谱系树拓扑结构与“快车模型(Express-train)”高度兼容,快车模型可以转换为有序的地理特征,并映射到语言树中,台湾地区的阿美语和排湾语处于谱系树的根部(Root)。

14、谱系树模型还将南岛语的起源定位在距今大约 5230 年前的我国台湾地区,并显示其与太平洋南岛移民起源假说“扩张-停顿(Pulse-Pause)”的情形相一致,表明南岛语的多样化与地理的扩张密切相关。上述分类结果中,除位于兰屿上的雅美语争议不大之外,诸家分类的争议点主要集中在台湾南岛语下位分支数量的多寡,其实际具体表现在对“排湾语群”认定的差异上。总的来说,前人及时贤在探讨台湾南岛语诸语的内部分类研究方面取得了诸多成果,然而囿于不同的分类理论、方法以及材料,是其分类研究依旧存在诸多分歧与争议的主要原因。具体表现在:S.Starosta,“A Grammatical Subgrouping of

15、Formosan Languages(present-day languages in Taiwan,China),”in Paul Jen-kuei Li,Cheng-hwa Tsang,Ying-kuei Huang,Dah-an Ho and Chiu-yu Tseng(eds),Austronesian Studies Relating to Taiwan,Taipei:Institute of History and Philology,“Academia Sinica”,1995,pp.683-726.M.Ross,“Proto Austronesian Verbal Morpho

16、logy:A Reappraisal,”in Alexander K.Adelaar,Andrew Pawley(eds),Austronesian Historical Linguistics and Culture History:a Festschrift for Robert Blust,Canberra:Pacific Linguistics,2009,pp.295-326.M.Ross,“In Defense of Nuclear Austronesian(and against Tsouic),”Language and Linguistics,Vol.13,No.6,2012,

17、pp.1253-1330.L.Sagart,“In Defense of the Numeral-based Model of Austronesian Phylogeny,and of Tsouic,”Language and Linguistics,Vol.15,No.6,2014,pp.859-882.戴恩伊赛多:台湾高山族语言,民族语文研究情报资料集(第三集),陈康译,北京:中国社会科 学院民族研究所语言室,1984 年,第 81-83 页。R.Ferrell,Taiwan Aboriginal Groups:problems in Cultural and Linguistic Cl

18、assfication,Taipei:Institute of Ethnology,“Academia Sinica,”1969,pp.25.陈康:台湾高山族语言,北京:中央民族学院出版社,1992 年,第 3 页。孙宏开、胡增益、黄行:中国的语言,北京:商务印书馆,2007 年,第 2111 页。R.D.Gray,F.M.Jordan,“Language Trees Support the Express-train Sequence of Austronesian Expansion,”Nature,Vol.405,No.6790,2000,pp.1052-1055.R.D.Gray,A.

19、J.Drummond,S.J.Greenhill,“Language Phylogenies Reveal Expansion Pulses and Pauses in Pacific Settlement,”Science,Vol.323,No.5913,2009,pp.479-483.范志泉:台湾南岛语的定量分类及其横向交流探析 87 首先,在分类标准上,传统的分类标准语音特征的择对完全有依赖于研究者主观的个人经验与学术积累,即使针对同一研究主体,不同学者选取不同的语音特征,其分类结果往往也有所差异,甚至截然相反。何大安以原始南岛语 PAN*n 和*N的合并为分类特征,将布农语划入由阿美语

20、、噶玛兰语、西拉雅语等组成的语支中,而李壬癸则以 PAN*j 和*n 的合并为分类特征,将阿美语、噶玛兰语、西拉雅语归于一群,不包括布农语。其次,除传统的做法外,也有学者采用词汇统计的定量方法。如戴恩依据斯瓦迪士 200 词作同源词百分比统计;还有 Gray 和 Jordan 等人依据 5185 个词项以及 Gray、Drummond 和 Greenhill 等人依据 210 个词所做的聚类分析。戴恩的研究结果显示泰雅语群诸语之间以及邹语群诸语之间较高的同源词比例显示两个语群内部诸语言的关系是比较密切的,所以各自组成了语群。但是排湾语群诸语之间的同源词百分比标准却参差不齐,那么是否还可归入一个

21、语群?事实上,“排湾语群不是一个发生学上同源的分支,这个语群的内容需要重新界定”。根据陈保亚划分词阶的方法,斯瓦迪士200 核心词可一分为二:前 100 词称为高阶词;余下的 100 词为低阶词,高阶词比低阶词更稳定,更难以借用。因此,本文的做法虽然也是根据语言学的数理统计方法做聚类分析,但使用的材料有所不同。主要依据斯瓦迪士 100 词作同源词的数理分析。用作比较的基本词的词目数量越大,就越难排除语言之间相互借用的成分。“斯瓦迪士 100 基本词是经过许多语言检验过的一组能反映语言纵向分化的词表,这组词不容易受到借用的影响,词义有较高的稳定性。所以做统计时可以保证因借用而造成统计的干扰很小。

22、”最后,历史语言学表明,谱系树形图总归只是一种理想化的描述语言演化历史进程的理论模型。因为它容易忽略了语言之间除了纵向分化外的横向接触与交流历史。同样地,历史语言学的研究也显示,语言的横向传递接触与接触势必会有更多的瓜葛牵连,不可能完全整齐干净地表现为不同的树枝。也就是说,语言的谱系树模型实际上也只能反映语言自身的纵向式演变,却无法传递出因语言由于接触而在内部语言结构和核心词中所造成的横向式演变。语言作为人群的社会性产物,人群的接触势必导致语言的接触,其往往带来不同语言之间从语音、词汇和语法等方面的借用现象。为此,我们迫切地需要一个能够同时解释和描述纵向传递和横向接触的模型。生物学中新提出的生

23、种系网络(Phylogentic Network)模型或许就是一个可资借鉴的方案。因为相较于传统的树形结构,生物学新近提出的种系演化网络模型,其网状结构不仅能描述物种之间的纵向传递,又能兼容横向传递。该特性其实同样也符合描述与阐释有关语言关系的研究。目前,国内外有不少语言学学者已经开始尝试将这一理论模型及其生成方法运用于语言的演化研究。Paul J.K.Li,“Origins of the East Formosans(present-day people in Taiwan,China):Basay,Kavalan,Amis,and Siraya,”Language and Linguist

24、ics,Vol.5,No.2,2004,pp.363-376.何大安:论原始南岛语同源词,中国语言学的新拓展庆祝王士元教授六十五岁华诞,石锋、潘悟云 编,香港:香港城市大学出版社,1999 年,第 75-84 页。陈保亚:论语言接触与语言联盟汉越(侗台)语源关系的解释,北京:语文出版社,1996 年,第 85 页。邓晓华、王士元:中国的语言及方言的分类,北京:中华书局,2009 年,第 25 页。徐通锵:历史语言学,北京:商务印书馆,1991 年,第 44 页。徐丹:中国境内的混合语及语言混合的机制,语言战略研究2018 年第 2 期。邓晓华、杨晓霞、高天俊:试论语言演化网络以藏缅语为例,语言

25、研究2015 年第 3 期。海峡人文学刊 2023 年第 2 期 88 二、基于词源统计分析法的台湾南岛语的亲缘关系(一)材料与方法 由于凯达格兰语、西拉雅语、龟崙语、猴猴语、道卡斯语、巴布扎语、巴布拉语、洪雅语等 8种语言业已消失,因此未纳入本文讨论范围。本文以台湾地区“原民委”公告发布的 16 种台湾南岛语的基本常用词汇千词表以及李壬癸、土田滋编著的巴则海语词典,合计 17 种台湾南岛语为研究材料。并在此基础上,整理出 17 种台湾南岛语的斯瓦迪士 100 基本词表。(二)有关同源词数量统计的分析 南岛语言基本词汇数据库的 210 个基本词汇表,共收入 87 个基本核心词,缺“多、种子、树

26、皮、角、爪子、膝盖、心、给、太阳、山、热、满、圆”等 13 个;李壬癸台湾南岛语(不含雅美语)211 个基本词汇表,共收入 86 个基本核心词,缺“多、人、种子、树皮、角、爪子、膝盖、心、躺、给、太阳、山、满、圆”等 14 个。结合已发布的基本常用词汇千词表,将“圆”从表中删除,斯瓦迪士 100 基本词表实则为 99 个。另外,在斯瓦迪士 100 基本词表中,包括台湾南岛语在内的南岛语存在着 5 组同根词或同族词,为避免重复计算使权重失衡需要对其进行整理。具体如下:词目第 27“树皮”与词目第 28“皮(肤)”。在南岛语言中,“皮”可以泛指,如:巴则海语 rapay。而“树皮”则由“皮”与“树

27、”复合而成,如:沙阿鲁阿语 kulicikulici kiuu;噶玛兰语 lubunglubung na paRin;雅美语 kolitkolit no kayo;马来语/印尼语 kulitkulit kaju。词目第 36“毛”与词目第 37“头发”。在南岛语言中,“毛”可指“羽毛”“体毛”“阴毛”“须毛”“毛发”,是一组语义有关联且交叉纠葛的词,分别表示动物和人的身体不同部位的毛发。如:泰雅语 kumis“毛;阴毛”;马来语 kumis“胡须”;太鲁阁语 ubal“羽毛;毛(发)”;鲁凯语 ubale“毛,体毛”;排湾语uval“泛指毛发”;雅美语 ovan“白头发”;卑南语 gumul“

28、体毛;羽毛”;赛夏语 komol“阴毛”。词目第 61“死”与词目第 62“杀”。在南岛语言中,这两个词也往往多为同根词或派生词,即“死”是由“杀”派生而出,或者说“死”可以是伴随着动作“杀”所产生的结果。如:泰雅语mhuqilphuqil;赛德克语 mhuqilphuqil;邹语 mcoiopcoi;卡那卡那富语 mamacaimiapacai;沙阿鲁阿语 maciipapaci;鲁凯语雾台wapacaypapacay;布农语 matazmapataz;卑南语 matraypatray;邵语 mathaykmaipathay。词目第 65“走”与词目第 85“路”。在南岛语言中,这两个词同样

29、也是一组同根词,“路”是“走”动作执行的场所,如:邹语 ceoncoecon;卡那卡那富语 cacanmu-cacan;沙阿鲁阿语salaamu-sasala;布农语 daanmu-dadaan;赛夏语 ra:anpan-ra:an;马来语/印尼语 jalanber-jalan。词目第 60“睡”与词目第 67“躺”。从词义上来说,“躺”是“睡”的伴随动作,或者说“睡”“原住民族”语言发展中心官网:ilrdc.tw/reserch/athousand/atea16.php Paul J.K.Li,S.Tsuchida,Pazih Dictionary,Taipei:Institute of L

30、inguistics(preparatory Office),“Academia Sinica”,2001,pp.59-336.南岛语言基本词汇数据库:abvd.shh.mpg.de/austronesian/李壬癸:台湾南岛语言及其方言基本词汇,台湾南岛语言论文选集(第二册),台北:“中研院”语言学研究所,2004 年,第 1483-1530 页。范志泉:台湾南岛语的定量分类及其横向交流探析 89 是“躺”可能产生的结果存续。如:鲁凯语 apece“睡,睡觉,躺睡”;排湾语 qemreng“睡觉,躺着”;马来语/印尼语 tidur“睡;躺”。在上述的基础之上,我们通过合并与剔除原词目,并根据

31、南岛语的特点,对选词进行了修改调整,为方便计算一共增加 6 条,具体有:蛇,PAN*SulaR“蛇”应是早期台湾高山族人群的信仰图腾来源。风,PAN*bali“风”是海洋人群常见的自然事象。穿山甲。猪,原始南岛语用*babuy表示“野猪”;*beRek 表示“猪;家猪”。生物的地理分布资料以及台湾出现化石遗留的证据显示,台湾极早便有野猪分布。稻和米,原始南岛语以*pajay 表示“稻谷”;*beRas 表示“米”。米,去壳的稻谷;也可泛指去掉壳或皮的植物的籽实以及小粒像米的食物。在南岛语中这是一对语义可以相互交叉使用的一组词。(三)演化网络图的构建与分析 1.相似矩阵与距离矩阵 通过识别同源词

32、,编制同源词表,从而计算每对语言之间的同源百分比。最终生成同源百分比的相似矩阵。相似矩阵反映的是同源词的数目多少,而数理统计生成的演化模型是通过分支线段的长度来反映语言之间的距离远近。所以,需要将相似矩阵通过负对数公式 d=-logs(d 代表距离;s代表同源词相似数字)转换成能反映语言间亲缘关系的距离矩阵,见表 2。距离矩阵将作为生成语言演化网络模型的基本输入数据材料。表 2 距离矩阵 Ata Sed Tru Tso Kan Hla RukBunPaiPuyThaSaiPazKuv Sak Ami YamAta 0 Sed 29 0 Tru 27 05 0 Tso 64 60 62 0 Ka

33、n 64 60 60 31 0 Hla 62 60 64 30 26 0 Ruk 68 64 68 51 55 50 0 Bun 66 64 64 51 55 47 500 Pai 60 54 57 47 48 47 37420 Puy 72 66 64 54 57 50 5248400 Tha 64 60 60 52 51 54 513639520 Sai 54 52 52 48 54 47 51443650390 Paz 48 52 48 55 60 54 6255475448440 Kuv 68 68 70 57 57 57 515143545246620 Sak 57 55 57 51

34、 52 48 5040404847445242 0 Ami 59 60 60 52 54 48 4740374447445443 19 0 Yam 72 64 60 59 59 54 6462485555556259 60 59 0(表中英文缩写对应的台湾南岛语诸语名称如下所示:Ata,泰雅语;Sed,赛德克语;Tru,太鲁阁语;Tso,邹语;Kan,卡那卡那富语;Hla,沙阿鲁阿语;Ruk,鲁凯语;Bun,布农语;Pai,排湾语;Puy,卑南语;Tha,邵语;Sai,赛夏语;Paz,巴则海语;Kuv,噶玛兰语;Sak,撒奇莱雅语;Ami,阿美语;Yam,雅美语)海峡人文学刊 2023 年第

35、2 期 90 2.演化网络的生成与分析 基于表 2 距离矩阵的材料,我们采用 SplitsTree 4 软件包中的 Neighbor-Net 法生成了 17 种台湾南岛语的演化网络图(图 1-A)。图示说明:演化网络图中有许多的网状结构,网状结构反映出一定的盒状信号,而盒状信号是语言间横向接触交流的表现特征;盒状信号越大,意味着其曾有广泛的语言接触历史。其次,为了更好地描述台湾南岛语与其他地区南岛语以及壮侗语族的关系,本文在画图时分别加入马来-波利尼西亚语群马来语和壮侗语族壮语的语料。加入马来语后所生成的演化网络图的聚类结果大体相同(图 1-B),即便是以壮侗语族的壮语为外群(图 2-A),其

36、内部聚类结构关系依然变化不大,较为稳定。此外,本文还基于 Neighbor-Joining 法生成了 17 种台湾南岛语的演化树形图(图2-B)。值得注意的是,通过将两者进行比较后可知:由 Neighbor-Net 法生成的演化网图所显示的语言聚类与通过 Neighbor-Joining 法生成的演化树形图所得到的聚类几乎呈现一致的分类结果。图 1 17 种台湾南岛语的 Neighbor-Net 演化网络图 图 2 以壮语为外群所构建的演化图 三、台湾南岛语内部的亲缘关系分析(一)与传统分类的比较 如前文表 1 所示,本文已列出迄今为止诸家有关台湾南岛语的分类结果,为比较方便,本文选取其中有代

37、表性的进行讨论下面以 1999 年的 Blust 和 2006 年的李壬癸两者来作比较。大多数的学者认为台湾地区以外的南岛语均可归至“马来-波利尼西亚语群”一支之下。Blust 的分类是目前在国际南岛语言学术界,常被用于强调台湾南岛语彼此之间分歧大,论述台湾是南岛语的原乡(Out of Taiwan),南岛语起源于台湾,并经菲律宾、印度尼西亚等岛屿,扩散至太平洋地区的经典理论。李壬癸是我国台湾南岛语言研究的权威和集大成者,他的分类已经综合了土田滋、Blust 等人的研究成果。需要说明的是,Blust 和李壬癸的分类树形图,其树枝长短并无任何意义,不代表语言间距离的远近,或仅仅反映语言的聚类情况

38、而已。D.H.Huson,D.Bryant,“Application of Phylogenetic Networks in Evolutionary Studies,”Molecular Biology and Evolution,Vol.23,No.2,2006,pp.254-267.D.Bryant,V.Moulton,“Neighbor-Net:An Agglomerative Method for the Construction of Phylogenetic Networks,”Molecular Biology and Evolution,Vol.21,No.2,2004,pp

39、.255-265.B 范志泉:台湾南岛语的定量分类及其横向交流探析 91 图 3 Blust 的分类 图 4 李壬癸的分类 1.在本文新生成的演化网络图中,除雅美语与马来语聚类在一起外,其他台湾南岛语大体呈现出三个不同的聚类,即:(1)泰雅语、赛德克语、太鲁阁语、巴则海语、赛夏语和邵语。(2)邹语、卡那卡那富语和沙阿鲁阿语。(3)阿美语、撒奇莱雅语、噶玛兰语;鲁凯语、排湾语、卑南语;布农语。本文的第 1 语支和第 2 语支跟李壬癸的相同,与 Blust 的不同。Blust 的 9 个分支并列,其中,鲁凯语、排湾语、卑南语、布农语及其方言各自为独立分支,反映 9 个平行分化的演化历史。语言是否能

40、够同时分化成多个不同的分支,尚有待进一步验证。2.台湾省“原民委”将太鲁阁语和撒奇莱雅语作为新语言,与其原先归属语言赛德克语和阿美语并列设置。目前,在台湾少数民族中被认定的有 16 支,即传统的泰雅、邹、鲁凯、布农、排湾、卑南、赛夏、阿美、雅美等 9 支,以及自 2001 年以来陆续新认定的邵(2001 年)、噶玛兰(2002 年)、太鲁阁(2004 年)、撒奇莱雅(2007 年)、赛德克(2008 年)、卡那卡那富(2014 年)、沙阿鲁阿(2014年)等 7 支。在这 16 支中,除太鲁阁和撒奇莱雅外,其余大都并无问题。人群的起源与形成本身就是漫长的“文化意识”与“自我表现”相互产生作用的

41、结果。若从语言亲缘关系视角来看,所谓“太鲁阁”和“撒奇莱雅”是否能构成独立分支?所谓太鲁阁语与赛德克语德固路方言的同源词百分比为 99%,撒奇莱雅语与阿美语的同源词百分比为 69%。将本是赛德克方言之一的太鲁阁语、阿美语方言之一的撒奇莱雅语独立分支的做法,这背后人为地制造多族的“异味”实在与台湾历史上的人群变迁相去甚远。3.关于邵语的系属地位问题。关于邵语的系属地位,大体有两类看法,一划入排湾语群;二划入西部平埔语群。(1)戴恩依据词汇统计学证据,邵语与布农语的相同词汇百分比为 34.8%,而划入排湾语群;Ferrell 则依据 PAN*C 与*t 分别,进一步将邵语划入排湾语群第一分支。(2

42、)Blust 指出音韵上邵语与西部平埔诸语有三个共享创新,即*n,*lr,*-aw 与-ay 的辅音尾倾向消失,由此认为它们有较接近的亲缘关系。李壬癸基本认同 Blust 的看法,并部分修改了其语言证据,他指出邵语与西部平埔诸语有两个共享创新,即*n,在字首及字听位置时*st。不过目前尚未有证据显示邵语和西部平埔诸语之间因为接触而产生的语言借用,即便邵语人群历史上的传统领 R.Blust,Some Remarks on the Linguistic Position of Thao,Oceanic Linguistics,Vol.35,No.2,1996,pp.272-294.李壬癸:邵族的地

43、位兼评白乐思(Blust 1996)的邵族地位说,台湾南岛语言论文选集(第二册),台北:“中研院”语言学研究所,2004 年,第 891-906 页。海峡人文学刊 2023 年第 2 期 92 域已与西部平埔诸语人群有所相邻。邵语系属地位的分歧的实质归根到底是纵向分化的同源关系和横向融合的接触关系的断定问题。相较于树形图只关心聚类问题,本文的演化网络图还显示邵语不仅与泰雅语群等聚类在一起。同时,与布农语也明显偏向聚类于一簇。邵语与泰雅语群、布农语两者之间所聚类的盒状结构都比较大,网络结构的边长也较长,这显然说明邵语与布农语、泰雅等语的语言特征所蕴含的冲突信号较多,反映了邵语不仅与布农语,同样与

44、位于台湾中北部地区的泰雅、赛德克、巴则海等语之间的横向接触交流也很频繁。总的来说,这种分类结果暗示着高山族语言在台湾南部地区纵向分化和接触交流并不仅仅是单一事件,或是不同人群之间在不同层次的复杂交叉信号的反映。这也符合邵语人群与布农语人群之间的接触历史。近百年来,邵语人群与布农语人群之间的密集接触与通婚往来,导致邵语也在一定程度上深受布农语的影响,这不仅仅表现在语音上,而且在词汇上尤为明显。邵语还吸收布农语大量词汇,这些词汇甚至已深入基本核心词,如:“脚”,布农语 bantas,邵语 bantath;“脖子”,布农语 buthul,邵语 buqtur;“大”,布农语 ma-daing,邵语 m

45、a-rain;“走”,布农语mu-dadaan,邵语 mu-dadaan;“角”,布农语 vaha,邵语 waqa;“坐”,布农语 ma-lunghu,邵语mi-lhungqu;“山”,布农语 ludun,邵语 hudun;“皮”,布农语 sapa,邵语 shapa;“全部”,布农语 azaz,邵语 azaz;“树,木”,布农语 libus,邵语 ribush;“烟”,布农语卓社方言qumbu,邵语 qumbu;“女人”,布农语卓社方言binanauaz,邵语 binanauaz 等。(二)台湾南岛语的横向交流度量 在演化网络图中,我们可以用 Delta 值(Delta Score)来衡量每一

46、个语言点与其他语言点的交流程度。Delta 值的定义为:如果在网状结构中存在一个由任意四个分类点(Taxon)形成的封闭四边形结构,那么 Delta 值便可以衡量这一网状结构。Delta 值的范围在 0 到 1 之间,如果数值是 0 则说明该网状结构为树形结构,数值越接近于 1 则说明该网状结构无法回归到树形结构,同时也能说明该网状结构中的横向交流事件多。表 3 17 种南岛语演化网络图的 Delta 值 序号 语言图 1-A 图 1-B 图 2 1 Ata 0.286 0.284 0.307 2 Sed 0.277 0.283 0.295 3 Tru 0.259 0.267 0.287 4

47、Tso 0.31 0.314 0.327 5 Kan 0.304 0.305 0.317 6 Hla 0.33 0.334 0.342 7 Ruk 0.38 0.387 0.392 8 Bun 0.364 0.371 0.372 9 Pai 0.397 0.396 0.407 简史朗:邵语语法概论(第二版),新北:“原民委”,2018 年,第 5 页。范志泉:高山族邵语在高山族诸语中的地位,民族语文第十五届学术研讨会会议论文,云南昆明,2022年 9 月 30 日-10 月 1 日。Paul J.K.Li,“Thao Loans From Bunun,”Bulletin of Chinese

48、Linguistics,Vol.7,No.2,2013,pp.225-241.B.R.Holland,K.T.Huber,A.Dress,V.Moulton,“Plots:a Tool for Analyzing Phylogenetic Distance Data,”Molecular Biology and Evolution,Vol.19,No.12,2002,pp.2051-2059.R.D.Gray,D.Bryant,S.J.Greenhill,“On the Shape and Fabric of Human History,”Philosophical Transactions

49、of the Royal Society B:biological Sciences,Vol.365,No.1559,2010,pp.3923-3933.范志泉:台湾南岛语的定量分类及其横向交流探析 93(续表)序号 语言图 1-A 图 1-B 图 2 10 Puy 0.405 0.41 0.421 11 Tha 0.395 0.396 0.409 12 Sai 0.402 0.406 0.417 13 Paz 0.326 0.35 0.359 14 Kuv 0.392 0.386 0.395 15 Sak 0.352 0.365 0.37 16 Ami0.308 0.321 0.332 17

50、 Yam0.427 0.41 0.426 本文根据 Delta 值计算公式得出了图 1 和图 2 中 17 种台湾南岛语的 Delta 值(见表 3)。在以往的研究中,不少学者已采用计算 Delta 值对印欧语、波利尼西亚语、藏缅语、壮侗语的台语支的演化网络图进行了分析。印欧语、壮侗语台语支、藏缅语以及波利尼西亚语群的 Delta 值分别为 0.22、0.25、0.31、0.41,研究结果显示印欧语、藏缅语、壮侗语台语支的发生学关系模型整体倾向于树形结构,而波利尼西亚语群内部则有更多的横向接触交流。在图 1 和图 2 的演化网络图中,其整体的 Delta 值依次为 0.348、0.353、0.

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服