成人国产精品电影|年轻嫂子视频|午夜丰满熟妇xxx欧美|超碰77777|欧美一区二区三区性感性电影|blackedsex|亚洲精品丝袜|天美影视传媒有限公司官网|最美av萝莉|暗黑系女生头像,欧美日韩亚洲一区二区三区在线观看,啊啊啊啊好疼视频,欧美一区二区精品性色,3d国漫同人,星河传媒是正规公司吗,日韩av免费片

首頁(yè)>科研>學(xué)術(shù)動(dòng)態(tài)

江荻:西藏的語(yǔ)言多樣性及其分類(lèi)

中國(guó)藏學(xué)編輯部 中國(guó)藏學(xué) 2023-03-17

西藏的語(yǔ)言多樣性及其分類(lèi)

江  荻

  【內(nèi)容摘要】文章一方面敘述西藏的多樣性語(yǔ)言現(xiàn)象,,另一方面嘗試用一種計(jì)算機(jī)自動(dòng)聚類(lèi)方法對(duì)西藏的語(yǔ)言進(jìn)行分類(lèi),。文章采用編輯距離計(jì)算方法的編碼和賦值,以及聚類(lèi)算法和樹(shù)形圖呈現(xiàn),。實(shí)驗(yàn)采集了西藏的藏語(yǔ)及其方言,,還有門(mén)巴,、珞巴、僜人等族群的非藏語(yǔ)語(yǔ)言共計(jì)49種,,包括目前尚未識(shí)別的一些地方話,。實(shí)驗(yàn)結(jié)果表明:西藏地區(qū)分布著藏語(yǔ)和非藏語(yǔ)的藏緬語(yǔ),藏語(yǔ)包括傳統(tǒng)分類(lèi)的衛(wèi)藏和康方言,,衛(wèi)藏又可分為前藏,、后藏、阿里和南部次方言,;非藏語(yǔ)的藏緬語(yǔ)有門(mén)巴族語(yǔ)言,、珞巴族語(yǔ)言、義都系語(yǔ)言,,以及藏東和藏東南語(yǔ)言系屬不明的地方話,。與傳統(tǒng)分類(lèi)相比,文章中所用機(jī)器語(yǔ)言或方言自動(dòng)分類(lèi)相當(dāng)合理,,可信度很高,。

  【關(guān)鍵詞】西藏;語(yǔ)言多樣性,;編輯距離,;自動(dòng)分類(lèi)

  【作者簡(jiǎn)介】江荻,,江蘇師范大學(xué)語(yǔ)言科學(xué)與藝術(shù)學(xué)院漢語(yǔ)和漢藏語(yǔ)研究中心特聘教授、中國(guó)社會(huì)科學(xué)院民族學(xué)與人類(lèi)學(xué)研究所研究員,。

  【文章來(lái)源】《中國(guó)藏學(xué)》2022年第6期,。

  【中圖分類(lèi)號(hào)】H429

  【文獻(xiàn)標(biāo)識(shí)碼】A

  【文章編號(hào)】1002-557(A)(2022)06-0150-11

  一、引言

  藏語(yǔ)在中國(guó)分為三大方言,,衛(wèi)藏方言,、康方言和安多方言,其中衛(wèi)藏方言和相當(dāng)多的康方言分布在西藏自治區(qū),。西藏東南部連接著中國(guó)民族走廊的南端,,除藏語(yǔ)外,還有多語(yǔ)言分布,。費(fèi)孝通先生提出:“把北自甘肅,,南到西藏東南的察隅、洛渝這一帶地區(qū)全面聯(lián)系起來(lái),,分析研究靠近藏族地區(qū)這個(gè)走廊的歷史、地理,、語(yǔ)言并和已經(jīng)陸續(xù)暴露出來(lái)的民族識(shí)別問(wèn)題結(jié)合起來(lái)……洛渝各民族集團(tuán)的語(yǔ)言據(jù)初步了解不屬藏語(yǔ)支而與景頗語(yǔ)支相近,。如果聯(lián)系到上述甘南、川西的一些近于羌語(yǔ)和獨(dú)龍語(yǔ)的民族集團(tuán)來(lái)看,,這一條夾在藏彝之間的走廊,,其南端可能一直繞到察隅和洛渝。”這種見(jiàn)解之深刻,,對(duì)我們深入了解藏語(yǔ)跟周邊藏緬語(yǔ)言之間關(guān)系具有重要價(jià)值,。

  地理上,大致在林芝市工布江達(dá)縣及以東區(qū)域,,特別是藏東南地區(qū)還有數(shù)量不明的非藏語(yǔ)語(yǔ)言,,有些已經(jīng)甄別,例如錯(cuò)那縣的門(mén)巴語(yǔ),,墨脫縣的倉(cāng)洛語(yǔ),,米林縣的博嘎?tīng)栒Z(yǔ),隆子縣的蘇龍語(yǔ),,察隅縣的義都語(yǔ),、達(dá)讓語(yǔ)、格曼語(yǔ)等,。但是還有一些地方話尚需進(jìn)一步甄別,,例如工布江達(dá)縣錯(cuò)高鄉(xiāng)巴松話、芒康縣如美鎮(zhèn)的如美話,、左貢縣東壩鄉(xiāng)的東壩話,、察隅縣的扎話和素苦話等,。這些說(shuō)話人有些是藏族人,有些人長(zhǎng)期與藏族人民生活在同一區(qū)域,,從小習(xí)得母語(yǔ)和藏語(yǔ),,他們基本都是雙語(yǔ)人或多語(yǔ)人,因?yàn)槭懿卣Z(yǔ)影響,,即使他們?cè)诩依镎f(shuō)母語(yǔ)的時(shí)候也使用大量藏語(yǔ)借詞,。

  除了藏語(yǔ)和漢語(yǔ)有傳統(tǒng)文字記載,西藏地區(qū)其他各種語(yǔ)言都沒(méi)有書(shū)面文字,。判定這些語(yǔ)言是否為獨(dú)立語(yǔ)言及這些語(yǔ)言的語(yǔ)系歸屬是很專(zhuān)業(yè)的事情,,通常需要投入很大的人力和物力資源才能有所判斷。判斷新發(fā)現(xiàn)語(yǔ)言的語(yǔ)系地位一般采用歷史語(yǔ)言學(xué)的比較方法,,通過(guò)詞匯語(yǔ)音和形態(tài)比較找出語(yǔ)音對(duì)應(yīng)規(guī)律,,確定同源詞,再進(jìn)一步確定語(yǔ)言之間的關(guān)系,。這其中的一個(gè)難點(diǎn)是排除各個(gè)語(yǔ)言中的外來(lái)語(yǔ)借詞,,具體說(shuō),藏語(yǔ)是西藏通行的地方通用語(yǔ)言,,其他語(yǔ)言都受到藏語(yǔ)的影響,,甚至是深度影響,借入了大量藏語(yǔ)詞匯和句法結(jié)構(gòu),。鑒于這一現(xiàn)狀,,本文采用一種計(jì)算機(jī)新的算法技術(shù)對(duì)西藏各地語(yǔ)言和方言進(jìn)行自動(dòng)聚類(lèi)分析,嘗試快速準(zhǔn)確地對(duì)這些語(yǔ)言和方言進(jìn)行分類(lèi),。然后,,借助歷史比較方法進(jìn)一步考察和驗(yàn)證本文聚類(lèi)算法的結(jié)果,判斷其是否與語(yǔ)言學(xué)分類(lèi)結(jié)果一致,,是否與人們習(xí)慣的分類(lèi)認(rèn)知一致,。 

  二、語(yǔ)言和方言材料

  語(yǔ)言聚類(lèi)分析以采集的語(yǔ)言材料為實(shí)驗(yàn)對(duì)象,,一般是詞匯數(shù)據(jù),,又可分為聲音材料和記音材料。前者是詞語(yǔ)的錄音聲學(xué)參數(shù),,例如音值(音素),、音高(音頻)、音長(zhǎng)(時(shí)長(zhǎng))等,,后者是音標(biāo)符號(hào)記錄的書(shū)面形式,。本文以音標(biāo)記錄的語(yǔ)音形式為實(shí)驗(yàn)對(duì)象。

  本文依據(jù)語(yǔ)言研究的常規(guī)經(jīng)驗(yàn)和所采用的數(shù)學(xué)方法和算法模型,,確定采用斯瓦迪士基本核心詞表,,該表收納客觀世界基本概念義100項(xiàng),,即100個(gè)核心詞。經(jīng)過(guò)世界各國(guó)語(yǔ)言學(xué)家和心理學(xué)家實(shí)踐和驗(yàn)證,,該詞表在有效性和可信度等各方面經(jīng)證明是可靠和可用的,。

  本文運(yùn)用多種方法開(kāi)展實(shí)際語(yǔ)料的采集,一部分是實(shí)地記音和錄音,;一部分選自出版的書(shū)刊,;還有一部分采自中國(guó)語(yǔ)言資源保護(hù)工程(網(wǎng)絡(luò)平臺(tái))。具體語(yǔ)言分布地點(diǎn)如下(括號(hào)內(nèi)為方言調(diào)查點(diǎn)數(shù)量),。

  前藏(6):拉薩,、墨竹工卡、林周,、尼木,、澤當(dāng)、乃東,;

  后藏(8):日喀則,、浪卡子、亞?wèn)|,、吉隆,、定結(jié)、洛扎,、樟木、夏爾巴,;

  阿里(7):噶爾,、日土、普蘭,、札達(dá),、革吉、措勤,、改則,;

  藏東(10):昌都、丁青,、那曲,、安多(帕那)、工布江達(dá),、八宿,、索縣、墨脫(達(dá)木),、錯(cuò)那,、察隅,。

  以上藏語(yǔ)方言點(diǎn)已經(jīng)按照傳統(tǒng)分類(lèi)觀點(diǎn)進(jìn)行了預(yù)分類(lèi),包含地理分布分類(lèi)思想,,共有31個(gè)方言點(diǎn),,又分出前藏、后藏,、阿里,、藏東4個(gè)地理區(qū)域。

  非藏語(yǔ)語(yǔ)言主要分布在藏東和藏東南區(qū)域,,以下僅按照語(yǔ)言名或地理位置加語(yǔ)言名羅列,。又分為已識(shí)別為獨(dú)立語(yǔ)言的和尚需甄別是否為獨(dú)立語(yǔ)言的。

  識(shí)別為獨(dú)立語(yǔ)言或方言的有11種:門(mén)巴語(yǔ)麻瑪話,、門(mén)巴語(yǔ)文浪話,、倉(cāng)洛語(yǔ)地東話、義都語(yǔ)上察隅話,、達(dá)讓語(yǔ)夏尼話,、格曼語(yǔ)薩穹話、混合語(yǔ)察隅扎話,、崩尼語(yǔ)斗玉話,、崩如語(yǔ)三安曲林話、博嘎?tīng)栒Z(yǔ)南伊話,、蘇龍語(yǔ),。

  待識(shí)別的語(yǔ)言有7種:工布江達(dá)錯(cuò)高鄉(xiāng)巴松話、左貢縣拉茸話,、芒康縣如美話,、察隅縣素苦話、左貢縣東壩話,、察隅縣松林話,、察雅縣芒話和瑪吉話。

  三,、數(shù)據(jù)編碼和賦值

  前文已經(jīng)指出,,本文以音標(biāo)記錄的斯瓦迪士核心詞為實(shí)驗(yàn)材料,借助計(jì)算機(jī)算法開(kāi)展不同語(yǔ)言或方言之間親疏遠(yuǎn)近關(guān)系及其自動(dòng)分類(lèi)研究,,本節(jié)討論擬采用的數(shù)學(xué)模型及編碼和賦值操作,。

  字符或音標(biāo)符號(hào)記錄的詞語(yǔ)形式自然而然反映出人類(lèi)聲音的線性序列特征,例如拉薩話[?i11ma55],、日喀則話[ni11ma53]都表示“太陽(yáng)”的意思,,呈現(xiàn)出兩個(gè)音節(jié),每個(gè)音節(jié)都是輔音—元音序列和結(jié)構(gòu),,這種結(jié)構(gòu)十分適合采用編輯距離(edit distance)模型計(jì)算,。由于這個(gè)算法是俄羅斯數(shù)學(xué)家弗拉基米爾·萊文斯坦(Vladimir Levenshtein)提出的,,因此多稱(chēng)萊文斯坦距離(Levenshtein Distance)。一般的定義是:萊文斯坦距離是測(cè)量?jī)蓚€(gè)字符串之間差異的數(shù)學(xué)模型,。從應(yīng)用上說(shuō),,人們可以利用萊文斯坦距離比較兩個(gè)字符串的相似度。如果承認(rèn)語(yǔ)言和方言之間存在歷史演變關(guān)系,,則可以將不同語(yǔ)言或方言之間詞語(yǔ)的相似度理解為語(yǔ)言演變的親緣遠(yuǎn)近關(guān)系,。具體操作上,人們假設(shè)兩個(gè)詞語(yǔ)之間的萊文斯坦距離是將一個(gè)詞形更改為另一個(gè)詞所需要的最小操作步驟,。不妨舉例說(shuō)明,。

  以英語(yǔ)方言為例,afternoon在Savannah鎮(zhèn)(美國(guó)佐治亞州)發(fā)音是[?æ?ft?n?n],,而在Lancaster鎮(zhèn)(美國(guó)賓夕法尼亞州)發(fā)音是[?æft?r?nu?n],。如果把Savannah發(fā)音轉(zhuǎn)換為L(zhǎng)ancaster一樣的發(fā)音,這中間的操作就是二者的相似度差別,。萊文斯坦距離測(cè)算的方法是以處理符號(hào)的操作次數(shù)作為量化數(shù)值,,它規(guī)定了3種操作:插入、刪除和替換,,每次操作數(shù)值記為1,。本文操作不納入韻律要素,例如重音,、次重音和半長(zhǎng)音(“u?”,,Lancaster鎮(zhèn))。

  萊文斯坦距離采用最大字符對(duì)齊方法,,表1是最佳的最小操作次數(shù),,賦值3。表2未采用最大對(duì)齊方法,,賦值6,顯然不是可選的方案,。

  萊文斯坦距離計(jì)算公式如下:

   其中,,a、b分別代表兩個(gè)字符串(詞),,字符串的萊文斯坦距離表示為leva,,b(i,j),,即a字符串中前i個(gè)字符與b串中前j個(gè)字符之間的距離,。如果計(jì)算完整字符串,即i=|a|,,j=|b|,,則leva,,b(|a|,|b|),。Min(i,,j)=0意味著i,j某個(gè)值為0,,即a和b有一個(gè)字符串為空串,,兩個(gè)字符之間的距離就是其中一個(gè)字符串全部轉(zhuǎn)換為另一個(gè),是最大距離,,即max(i,,j)。如果Min(i,,j)≠0,,萊文斯坦距離leva,b(i,,j)有3種狀態(tài),,分別是刪除、插入和替換,。

  限于篇幅,,本文不討論萊文斯坦距離的運(yùn)算過(guò)程和算法,感興趣的讀者可參考Holman等學(xué)者的文章,。下面我們討論聚類(lèi)方法,。

  四、聚類(lèi)算法和樹(shù)形圖

  聚類(lèi)跟分類(lèi)有不同的前提條件,。所謂分類(lèi)是指人們對(duì)事物有一定認(rèn)識(shí),,積累了相關(guān)經(jīng)驗(yàn),可以依據(jù)事物的某些特征類(lèi)別建立分類(lèi)標(biāo)準(zhǔn)或者分類(lèi)條件,,從而對(duì)事物加以分類(lèi),。聚類(lèi)則完全不同,人們還未研究事物,,只能依賴(lài)事物本身的內(nèi)在結(jié)構(gòu)和特征層次,,對(duì)比多個(gè)事物之間的相似程度而實(shí)現(xiàn)歸類(lèi)。在這個(gè)意義上,,聚類(lèi)分析特別適用于語(yǔ)言或方言的關(guān)系判斷,,通過(guò)對(duì)不同語(yǔ)言詞形和結(jié)構(gòu)的相似性進(jìn)行聚類(lèi)分析,相似數(shù)據(jù)的數(shù)量越多,,兩種語(yǔ)言之間相似的程度越高,,于是獲得相似程度不等的語(yǔ)言集合簇(類(lèi)),每個(gè)簇內(nèi)的語(yǔ)言在屬性特征上具有最大程度的相似性,不同簇的語(yǔ)言則有最大程度的不同屬性,。

  數(shù)學(xué)上的聚類(lèi)方法很多,,本文不作詳細(xì)闡述。但在理論上,,就語(yǔ)言或方言來(lái)說(shuō),,聚類(lèi)方法的基本原理是將每?jī)煞N語(yǔ)言或方言的成對(duì)詞語(yǔ)相似系數(shù)最大或相異系數(shù)最小的集合聚成一類(lèi),形成相似程度不等的多個(gè)集合類(lèi),,形成隊(duì)列,。譬如,如果A語(yǔ)言與X語(yǔ)言相似集合類(lèi)的數(shù)量多于B語(yǔ)言,,則A語(yǔ)言與X語(yǔ)言歸為一類(lèi),,B語(yǔ)言為另一類(lèi)。這個(gè)分析過(guò)程擴(kuò)展至C語(yǔ)言和更多語(yǔ)言,,包括B語(yǔ)言跟C語(yǔ)言的相似數(shù)據(jù)數(shù)量比較,,乃至更多語(yǔ)言比較,比較過(guò)程循環(huán)至全部參與語(yǔ)言為止,,則獲得所有語(yǔ)言相似程度關(guān)系,,其結(jié)果可以繪成樹(shù)狀關(guān)系圖,稱(chēng)為語(yǔ)言關(guān)系樹(shù)形圖,。又由于歷史語(yǔ)言學(xué)提出人類(lèi)語(yǔ)言是一種自然傳承和演化的現(xiàn)象,,因此人們借鑒生物分類(lèi)學(xué)之種系發(fā)生樹(shù)(phyligenetic tree)概念,或稱(chēng)進(jìn)化樹(shù)或演化樹(shù)(evolutionary tree),,把語(yǔ)言之間相似程度計(jì)量關(guān)系樹(shù)看作語(yǔ)言演化的淵源關(guān)系樹(shù),,并以此觀察和判斷語(yǔ)言之間的親緣關(guān)系,它們的分群和分類(lèi),。

  目前構(gòu)建生物種系發(fā)生樹(shù)或基因進(jìn)化系統(tǒng)樹(shù)的方法一般采用計(jì)算機(jī)來(lái)完成,。構(gòu)建進(jìn)化樹(shù)的軟件較多,本文采用的是國(guó)際上運(yùn)用較廣的Mega軟件,,該軟件是一款功能較為強(qiáng)大的分子進(jìn)化遺傳分析軟件,,全稱(chēng)是Molecular Evolutionary Genetics Analysis,特別適用于生物或基因計(jì)算遺傳距離,、構(gòu)建分子系統(tǒng)樹(shù),。Mega算法軟件還提供了設(shè)置“樹(shù)根”操作,可以幫助人們更進(jìn)一步了解語(yǔ)言或方言之間在歷史演化中的淵源關(guān)系,。這有利于我們對(duì)西藏的語(yǔ)言和方言之間的關(guān)系進(jìn)行推斷。在下面的討論中,,我們會(huì)看到在根語(yǔ)言設(shè)定條件下西藏語(yǔ)言和方言呈現(xiàn)出的面貌,。

  五、自動(dòng)分類(lèi)實(shí)驗(yàn)與藏語(yǔ)方言的分布

  (一)西藏語(yǔ)言和方言自動(dòng)聚類(lèi)樹(shù)

  在第二節(jié)采集的西藏語(yǔ)言和方言材料基礎(chǔ)上,,本文實(shí)驗(yàn)結(jié)果(聚類(lèi)圖形)如圖1所示,。此處先對(duì)其中約定的符號(hào)或代碼加以說(shuō)明。代碼ZZ_W表示藏語(yǔ)衛(wèi)藏方言,,ZZ_K表示藏語(yǔ)康方言,,ZZ_Q表示語(yǔ)言系屬不明,ZS_和ZG_分別表示藏緬語(yǔ)蘇龍系語(yǔ)言和義都系語(yǔ)言,。代碼之后用漢語(yǔ)拼音拼寫(xiě)語(yǔ)言或方言名稱(chēng),,例如ZZ_Wnimu表示藏語(yǔ)衛(wèi)藏方言尼木話;ZS_bogaer,,表示藏緬語(yǔ)蘇龍系博嘎?tīng)栒Z(yǔ),;ZG_darang表示義都系語(yǔ)言達(dá)讓語(yǔ);ZZ_Qmangkangrumei表示芒康縣系屬不明的如美話,。有時(shí)候,,“ZZ_+拼音”直接表示藏緬語(yǔ)某語(yǔ)言,例如ZZ_cangladidong,,藏緬語(yǔ)族倉(cāng)洛語(yǔ)地東話,。最后的數(shù)字表示該詞屬于斯瓦迪士第100詞。

  本次實(shí)驗(yàn)結(jié)果有多方面價(jià)值,。觀察圖1,,在不設(shè)立根語(yǔ)言(或者外類(lèi)群)條件下,衛(wèi)藏方言跟康方言清晰地分開(kāi)來(lái),,而且衛(wèi)藏方言?xún)?nèi)部十分明確又分出3個(gè)次級(jí)方言片:阿里次方言,、后藏次方言、前藏次方言,。根據(jù)《中國(guó)語(yǔ)言地圖集·少數(shù)民族語(yǔ)言卷》,,西藏語(yǔ)言地理上呈現(xiàn)二分狀態(tài),以林芝市工布江達(dá)縣為過(guò)渡地帶,,往西是衛(wèi)藏方言分布區(qū)域,,往東則是康方言和其他非藏語(yǔ)區(qū)域。本文聚類(lèi)圖(圖1)跟這幅語(yǔ)言分布地圖十分吻合,,順時(shí)針?lè)较?,衛(wèi)藏方言之后緊接著是藏東康方言片,然后有幾個(gè)單列的方言,,分別是察隅話,、亞?wèn)|話、墨脫話和巴松話,。再之后就是其他語(yǔ)言:墨脫,、錯(cuò)那,、林芝等縣的門(mén)巴語(yǔ)、倉(cāng)洛語(yǔ),,察隅縣的義都語(yǔ),、達(dá)讓語(yǔ)、格曼語(yǔ),、扎話,,以及墨脫、林芝,、米林,、隆子等縣的博嘎?tīng)栒Z(yǔ)、崩尼語(yǔ),、蘇龍語(yǔ)和崩如語(yǔ),。最后還有地理上沿金沙江西岸而下的察雅縣、左貢縣,、芒康縣直到察隅縣等地的部分村鄉(xiāng)土話,,目前語(yǔ)言系屬暫時(shí)不明,需要進(jìn)一步甄別,。

  圖1是完全沒(méi)有人為干預(yù)的數(shù)學(xué)模型自動(dòng)聚類(lèi)結(jié)果,,也就是單純以語(yǔ)言自身屬性特征的相似性為基礎(chǔ)構(gòu)建的算法結(jié)果。凡是形式,、結(jié)構(gòu)和特征相近的語(yǔ)言或者方言會(huì)自動(dòng)形成聚類(lèi),,因此我們也可以把這樣的聚類(lèi)結(jié)果理解為分類(lèi)。如果結(jié)合前賢時(shí)彥的經(jīng)驗(yàn)分類(lèi),,例如瞿靄堂,、格桑居冕、金鵬,、張濟(jì)川,、布萊德利、尼古拉·圖納德?tīng)?,可以判斷這項(xiàng)自動(dòng)分類(lèi)是相當(dāng)可信的,。我們?cè)谶@里需要補(bǔ)充的只是對(duì)個(gè)別不一致的方言點(diǎn)作出新的解讀,,闡明不一致的原因。

 ?。ǘ┰~匯借用改變方言歸屬

  讀者應(yīng)該注意到本實(shí)驗(yàn)結(jié)果中衛(wèi)藏方言阿里次方言聚類(lèi)中包括了改則和那曲兩個(gè)康方言,,它們的位置處于阿里方言聚類(lèi)樹(shù)的最外側(cè),。改則傳統(tǒng)分類(lèi)上劃歸康方言是有一定理?yè)?jù)的,。他們提出的理由有13條之多,,其中語(yǔ)音層面的理?yè)?jù)是:改則話有濁音(或帶前置鼻音)、有清化鼻音[??]和清擦音[ç ],、無(wú)鼻化復(fù)元音,、無(wú)l和n輔音韻尾,、聲調(diào)調(diào)值跟其他阿里話有差別,也就是說(shuō),,改則話具有康方言的一般特征。我們認(rèn)為這些特征也適用于那曲話,。下面以改則話為例進(jìn)行討論,。

  瞿靄堂、譚克讓的敘述是正確的,,一定有其他原因?qū)е赂膭t和那曲在本文自動(dòng)聚類(lèi)中歸屬于阿里次方言和更大范圍的衛(wèi)藏方言,。地理上,改則和那曲兩地處在昌都往西的藏北邊沿康方言延伸地帶,,南面是衛(wèi)藏方言,。更具體地說(shuō),改則算是康方言延展的盡頭,,西面和南面的革吉縣和措勤縣均為阿里藏語(yǔ),,那曲南面林周、當(dāng)雄和拉薩是前藏次方言,。換句話說(shuō),,這兩個(gè)康方言點(diǎn)受到衛(wèi)藏方言的嚴(yán)重影響。請(qǐng)觀察表3呈現(xiàn)的詞匯,。

  從這部分詞語(yǔ)的讀音來(lái)看(黑體詞或語(yǔ)素),,改則話與措勤話基本一致,通過(guò)比較衛(wèi)藏方言的拉薩和措勤話,、康方言的昌都話和八宿話可知,,改則話有些詞顯然借用了措勤等地的詞匯,跟康方言差別較大,,不可能是語(yǔ)音演化導(dǎo)致的差異,。例如,鳥(niǎo)兒,,措勤為t?a¹²,,改則為t?a³¹,昌都為?ɑ¹³,,該例“措勤(衛(wèi)藏):改則:昌都(康)”的聲母對(duì)比模式是[t?:t?:?],,塞擦音與擦音對(duì)立。再觀察一例,,鼻子,,措勤作na?³,改則作na?³,,昌都作n?ɑ?¹,,改則與措勤一致,,都是鼻音聲母,而昌都是清鼻音聲母,。“耳朵”這個(gè)詞,,拉薩作am?? t?o?³,措勤作a?m??t?o??³,,改則作a?m??t?o??³,,昌都為nɑ??t??o?³,波密為na³?t??o?³,,衛(wèi)藏的拉薩,、措勤與康方言的昌都、波密不同處甚多,,但改則與措勤一致,,應(yīng)該不是語(yǔ)音演變導(dǎo)致的,而是改則直接借用了措勤的詞匯,。由此我們知道,,詞匯借用,特別是常用詞匯借用是判斷語(yǔ)言或者方言之間關(guān)系的一個(gè)重要標(biāo)準(zhǔn),。

 ?。ㄈ┓窖蚤g的斷點(diǎn)致使歸屬不確定

  圖1有幾個(gè)調(diào)查點(diǎn)數(shù)據(jù)在聚類(lèi)中出現(xiàn)孤立單列狀況:察隅、墨脫,、錯(cuò)那,、亞?wèn)|、巴松,。經(jīng)反復(fù)考察,,有兩方面原因,一是這些方言處在多語(yǔ)言或多方言交匯地域,,語(yǔ)音詞匯受到影響,,同時(shí)包含了兩種不同語(yǔ)言或方言的特征;二是本文收集的調(diào)查點(diǎn)數(shù)量稍顯稀疏,,它們跟其他方言點(diǎn)中間缺少鏈接環(huán)節(jié),。不過(guò),各個(gè)調(diào)查點(diǎn)又有不同情況,。察隅,、墨脫、錯(cuò)那這3個(gè)藏語(yǔ)方言都處在藏語(yǔ)分布的邊緣位置,,其中察隅話與周邊義都,、達(dá)讓、格曼等幾種非藏語(yǔ)語(yǔ)言相互接觸,,墨脫話,、錯(cuò)那話與門(mén)巴語(yǔ),、倉(cāng)洛語(yǔ)、博嘎?tīng)栒Z(yǔ)等也相互影響,,這樣的語(yǔ)言接觸有可能給藏語(yǔ)方言帶來(lái)異類(lèi)詞匯語(yǔ)音,,值得細(xì)化研究。

  亞?wèn)|話情況略有不同,,格桑居冕,、瞿靄堂、勁松將其歸入后藏次方言,,但是我們也注意到西義郎將之劃歸南部方言。南部方言是國(guó)外部分學(xué)者提出的,,特指不丹王國(guó)等境外某些語(yǔ)言或者藏語(yǔ)方言,。張濟(jì)川提出:“亞?wèn)|位于衛(wèi)藏方言區(qū)的邊沿,與不丹,、錫金相鄰,。跟衛(wèi)藏方言的前后藏土語(yǔ)和南部方言宗喀話(不丹)比較,既與后藏土語(yǔ)有一些共同點(diǎn),,也與宗喀話有一些共同之處,。從現(xiàn)有材料來(lái)看,亞?wèn)|藏語(yǔ)似處于衛(wèi)藏方言和南部方言的過(guò)渡帶,。”為了判斷亞?wèn)|方言的歸屬,,我們將境外的宗喀語(yǔ)(Dzong kha)和德容炯語(yǔ)(Dreng jong)數(shù)據(jù)放入實(shí)驗(yàn),結(jié)果如圖2所示,,構(gòu)成南部方言群,。圖1亞?wèn)|話只是因?yàn)槿笔渌喜糠窖渣c(diǎn)造成地理分布的斷點(diǎn)而單列。如果結(jié)合西藏和不丹王國(guó)歷史來(lái)看,,這項(xiàng)實(shí)驗(yàn)證明,,南部方言以及境外一些藏系語(yǔ)言是逐步從西藏?cái)U(kuò)散開(kāi)來(lái)的。

 ?。ㄋ模┱Z(yǔ)言置換作為歸屬的深層原因

  上文明確指出,,巴松話、察隅話,、墨脫話,、錯(cuò)那話的單列與語(yǔ)言的相互接觸有關(guān),現(xiàn)在來(lái)具體分析,。

  巴松話是瞿靄堂等調(diào)查記錄,,認(rèn)為是藏語(yǔ)衛(wèi)藏方言次級(jí)方言(土語(yǔ))。與此同時(shí),,瞿靄堂提出,,為什么衛(wèi)藏方言其他方言點(diǎn)的人,,甚至鄰近說(shuō)工布話的人也聽(tīng)不懂巴松話呢?他認(rèn)為是詞匯差異造成的,。詞匯差異背后更深層的原因則是:巴松話“是原來(lái)使用一種可能與門(mén)巴語(yǔ)接近的語(yǔ)言的人,,受衛(wèi)藏方言影響,換用語(yǔ)言的結(jié)果,,只是保留了一個(gè)非藏語(yǔ)的詞匯底層”,。我們同意瞿靄堂的分析,只是按照他的分析,,巴松話(100多個(gè)詞匯與川藏其他語(yǔ)言比較)“大部分非同源詞,,限于條件還沒(méi)有找到來(lái)源,需要進(jìn)一步研究”,。這意味著巴松話的歸屬還需要作進(jìn)一步探索,。巴松話在本實(shí)驗(yàn)中處在與其他藏語(yǔ)方言相關(guān)又未進(jìn)入已確定系屬組群狀態(tài),這正反映了瞿靄堂分析之精準(zhǔn),。

  察隅話,、墨脫話、錯(cuò)那話所處位置都是與非藏語(yǔ)語(yǔ)言共存區(qū)域,,察隅話主要與義都語(yǔ),、達(dá)讓語(yǔ)和格曼語(yǔ)相互接觸,墨脫(達(dá)木)話和錯(cuò)那話與門(mén)巴語(yǔ)和倉(cāng)洛語(yǔ)交錯(cuò),。這3個(gè)調(diào)查點(diǎn)有兩種系屬歸類(lèi)的可能,,一是跟巴松話一樣來(lái)自早期其他語(yǔ)言的轉(zhuǎn)換,二是原屬藏語(yǔ),,借用了周邊其他語(yǔ)言的詞匯,。結(jié)果,它們?cè)谧詣?dòng)聚類(lèi)圖中處于單列狀態(tài),。但從語(yǔ)言的社會(huì)功能來(lái)說(shuō),,藏語(yǔ)作為當(dāng)?shù)貜?qiáng)勢(shì)語(yǔ)言,第一種解釋更可信一些,。我們暫時(shí)認(rèn)為這幾個(gè)調(diào)查點(diǎn)的歸屬存疑,。

  六、西藏的非藏語(yǔ)及其分類(lèi)

  上文指出,,聚類(lèi)方法蘊(yùn)含了系統(tǒng)發(fā)生樹(shù)理論,,可以模擬語(yǔ)言演化距離和層級(jí)。所以,,本文進(jìn)一步實(shí)驗(yàn)添加了“樹(shù)根”或外類(lèi)群,。經(jīng)我們測(cè)試,選擇泰米爾語(yǔ)(Tamil)為根語(yǔ)言比較穩(wěn)定。實(shí)驗(yàn)結(jié)果如圖3所示:

  觀察圖3聚類(lèi)樹(shù),,首先就發(fā)現(xiàn)蘇龍語(yǔ)和崩如語(yǔ)遠(yuǎn)離藏語(yǔ)及其方言(參看第五節(jié)),,它與藏語(yǔ)之間層級(jí)和距離上還隔著義都系、博嘎?tīng)栂?、門(mén)巴和洛巴族的語(yǔ)言,,以及一些系屬不明的語(yǔ)言。據(jù)研究者介紹,,蘇龍語(yǔ)和崩如語(yǔ)主要分布在西藏山南地區(qū)隆子縣以南比夏一帶的村莊,,分別有3000—4500人和約2000人,但基本處于印度實(shí)際控制區(qū)內(nèi),,在筆者調(diào)查的村寨只居住極少數(shù)個(gè)體,。為此,本文收集了西方學(xué)者有關(guān)蘇龍語(yǔ)和崩如語(yǔ)的資料,,并納入本系統(tǒng)測(cè)試,,參見(jiàn)圖4。

  測(cè)試結(jié)果不出意料,,增加西方學(xué)者采集的蘇龍系語(yǔ)言(稱(chēng)為Puroik,3個(gè)方言點(diǎn):Kojo-Rojo,、Bulu,、Chayangtajo)和崩如系語(yǔ)言(兩個(gè)方言點(diǎn):westMiji、Bangru),,發(fā)現(xiàn)它們的確與本文數(shù)據(jù)形成聚類(lèi),,跟藏語(yǔ)沒(méi)有直接親緣關(guān)系,聚類(lèi)的節(jié)點(diǎn)處在根語(yǔ)言之下一個(gè)兩分鏈接點(diǎn)的非藏語(yǔ)方(圖5),,可能是藏緬語(yǔ)族的一種語(yǔ)言,。

  回到圖3,我們知道,,聚類(lèi)樹(shù)圖一定意義上遞進(jìn)反映各組或各個(gè)語(yǔ)言之間的親疏關(guān)系(此圖由下而上),,越往上距離根語(yǔ)言關(guān)系越遠(yuǎn),換言之,,越靠近根的語(yǔ)言或語(yǔ)群,,相互間關(guān)系越近,越靠近頂部的語(yǔ)言分化越晚,。不過(guò),,此時(shí)討論的“親疏”尚未排除語(yǔ)言接觸和詞語(yǔ)借用造成的關(guān)系。

  圖3中與藏語(yǔ)最靠近的語(yǔ)言是門(mén)巴族語(yǔ)言,。20世紀(jì)80年代初,,學(xué)術(shù)界發(fā)布了《門(mén)巴、珞巴,、僜人的語(yǔ)言》,。主要涉及藏東南區(qū)域的非藏語(yǔ)語(yǔ)言,。之后,語(yǔ)言簡(jiǎn)志叢書(shū)陸續(xù)出版,,初步呈現(xiàn)出西藏的語(yǔ)言多樣性狀況,。進(jìn)入21世紀(jì)后,孫宏開(kāi)教授主編的中國(guó)新發(fā)現(xiàn)語(yǔ)言研究叢書(shū)出版了格曼語(yǔ),、義都語(yǔ),、達(dá)讓語(yǔ)、蘇龍語(yǔ)等專(zhuān)著,,還發(fā)表了扎話(語(yǔ)),、崩如語(yǔ)等描寫(xiě)性文章,當(dāng)時(shí)還發(fā)現(xiàn)了松林語(yǔ)等未曾描述的語(yǔ)言,,成果并于近年出版,。從新發(fā)現(xiàn)語(yǔ)言陸續(xù)出版角度來(lái)看,人們逐步了解到西藏地方,,特別是藏東南區(qū)域是很典型的語(yǔ)言多樣性區(qū)域,。

  實(shí)際上,西藏的部分非藏語(yǔ)語(yǔ)言由來(lái)已久,,最知名的是門(mén)巴族語(yǔ)言,。門(mén)巴族主要居住在墨脫縣、錯(cuò)那縣以及錯(cuò)那縣以南的邦金和門(mén)達(dá)旺地區(qū)(這部分目前處在印度非法實(shí)控區(qū)),,說(shuō)兩種不同的語(yǔ)言,,錯(cuò)那縣勒布區(qū)和墨脫縣文浪鄉(xiāng)說(shuō)門(mén)巴語(yǔ),墨脫縣和林芝縣東久區(qū)說(shuō)倉(cāng)洛語(yǔ),。門(mén)巴族與藏族的歷史淵源悠久,,早在吐蕃時(shí)期就已往來(lái)。著名的唐蕃會(huì)盟碑(或稱(chēng)長(zhǎng)慶會(huì)盟碑,,公元823年)記載曰:“此威德無(wú)比雍仲之王威嚴(yán)煊赫,,是故,南若門(mén)巴,、天竺,,西若大食,北若突厥拔悉蜜等雖均可爭(zhēng)勝于疆場(chǎng),,然對(duì)圣神贊普之強(qiáng)盛威勢(shì)及公正法令,,莫不畏服俯首,彼此歡忭而聽(tīng)命差遣也,。”一千余年來(lái),,門(mén)巴族與藏族交錯(cuò)居住,相互通婚,文化相融,,甚至17世紀(jì)在門(mén)巴地區(qū)出生的倉(cāng)央嘉措被認(rèn)定為五世達(dá)賴(lài)?yán)锏霓D(zhuǎn)世靈童,。語(yǔ)言上,門(mén)巴族人基本會(huì)說(shuō)藏語(yǔ),,可見(jiàn)門(mén)巴語(yǔ)受藏語(yǔ)影響非同一般,,藏語(yǔ)借詞極為豐富,因此在本實(shí)驗(yàn)聚類(lèi)圖上相當(dāng)靠近當(dāng)?shù)夭卣Z(yǔ)方言,。再以實(shí)例來(lái)說(shuō),,“嘴”,倉(cāng)洛語(yǔ)地東話說(shuō)[no¹³wa?¹³],,門(mén)巴語(yǔ)文浪話說(shuō)[k?ɑ??],,后者應(yīng)來(lái)自藏語(yǔ)借詞;比較:昌都卡若話說(shuō)[k?ɑ?¹],,拉薩話說(shuō)[k?a??],。再如“多”,倉(cāng)洛語(yǔ)說(shuō)[sak¹³po??]或[ca??ma¹³],,門(mén)巴語(yǔ)麻瑪話說(shuō)[ma?³?po?³],,后者明顯來(lái)自藏語(yǔ);比較:昌都話說(shuō)[mon³³po?¹],,拉薩話說(shuō)[ma?¹³ko??],。門(mén)巴語(yǔ)借用藏語(yǔ)詞匯是最典型的語(yǔ)言接觸現(xiàn)象。

  門(mén)巴族語(yǔ)言之外,,西藏東南部的察隅和珞隅地區(qū)還有多種非藏語(yǔ)的其他藏緬語(yǔ)言。正如費(fèi)孝通先生所說(shuō),,中國(guó)民族走廊的南端可能一直繞到察隅和珞隅,。目前已經(jīng)探明,察隅縣主要有義都語(yǔ),、達(dá)讓語(yǔ),、格曼語(yǔ)和扎話。前三者在早期文獻(xiàn)中被稱(chēng)為“米什米”,,這也有歷史記載,。據(jù)藏族歷史文獻(xiàn)《賢者喜宴》所錄,“如是,,東方之咱米興米(?????????????),、南方之洛(???)與門(mén)(???)、西方之香雄(??????)及突厥(??????),、北方之霍爾(???)及回紇(??????)等均被收為屬民,。遂統(tǒng)治半個(gè)世界”。其中,“米興米”指的就是達(dá)讓,、格曼,、義都語(yǔ)言群體,而“咱”(???)應(yīng)該特指扎話語(yǔ)言群體,。

  據(jù)上述研究,,義都語(yǔ)和達(dá)讓語(yǔ)關(guān)系十分緊密,具有同一來(lái)源,。格曼語(yǔ)則屬于另一支系語(yǔ)言,,扎話也可能底層是格曼語(yǔ),借用了大量藏語(yǔ)詞匯,,已是藏語(yǔ)化的格曼語(yǔ),。不過(guò),在藏緬語(yǔ)層次上,,這幾種語(yǔ)言目前系屬不確定,,本文暫時(shí)建立一個(gè)分支,統(tǒng)稱(chēng)義都系語(yǔ)言,。據(jù)研究,,義都語(yǔ)母語(yǔ)人屬于珞巴族,而珞巴人分布廣泛,,從察隅往西至隆子縣,,北鄰雅魯藏布江,南至整個(gè)珞隅地區(qū)分布著十?dāng)?shù)個(gè)珞巴族部落,,包括操崩尼語(yǔ)和博嘎?tīng)栒Z(yǔ)人,。崩尼語(yǔ)和博嘎?tīng)栒Z(yǔ)也是藏緬語(yǔ)族語(yǔ)言,它們與藏語(yǔ)關(guān)系十分密切,,在圖3聚類(lèi)圖中位置處于門(mén)巴語(yǔ)言和義都系語(yǔ)言之間,。

  最后需要討論的是目前歸屬完全不明的一批地方話。主要有:左貢縣東壩話,、拉茸話,,芒康縣如美話,察隅縣素苦話,、松林話,、芒話。這些分布在藏東和藏東南的地方話是使用者的母語(yǔ),,一般只在家庭和村寨使用,。他們是藏族,因此使用者一般都是雙語(yǔ)人,,外出使用當(dāng)?shù)乜捣窖?。在本?xiàng)實(shí)驗(yàn)中,,這些地方話處在藏語(yǔ)衛(wèi)藏方言和康方言聚類(lèi)之外,是否為獨(dú)立語(yǔ)言尚需甄別,。期待學(xué)術(shù)界持續(xù)開(kāi)展研究,。

  七、結(jié)語(yǔ)

  本文對(duì)西藏語(yǔ)言多樣性的描述,,一方面是一種回顧和梳理,,另一方面則是借助數(shù)學(xué)模型和現(xiàn)代計(jì)算機(jī)算法技術(shù)提出問(wèn)題,讓人們了解西藏文明的悠久和語(yǔ)言的多樣性與復(fù)雜性,,以便更深入地開(kāi)展調(diào)查和研究,。

  就技術(shù)角度來(lái)說(shuō),本文的討論還可以進(jìn)一步深化,,特別應(yīng)在以下幾方面取得突破:

  第一,,為克服斷點(diǎn)導(dǎo)致的地理分布不連續(xù)現(xiàn)象,應(yīng)擴(kuò)充語(yǔ)言或方言調(diào)查點(diǎn),,最好能完整地覆蓋西藏自治區(qū)各地(市),、縣(區(qū)),尤其是東部和東南部區(qū)域,。

  第二,,鑒于西藏自治區(qū)語(yǔ)言和方言相互之間廣泛存在詞匯借用情況,可以嘗試在基本詞匯之外增加一批常用性或一般性詞匯,。

  第三,,藏族語(yǔ)言文化歷史悠久,對(duì)整個(gè)喜馬拉雅山區(qū)域族群和語(yǔ)言都有重要影響,。為此,,對(duì)西藏語(yǔ)言多樣性的調(diào)查可以擴(kuò)展到整個(gè)喜馬拉雅區(qū)域。

  原文載于《中國(guó)藏學(xué)》2022年第6期

  為便于微信閱讀,,腳注從略

  引文請(qǐng)以原刊為準(zhǔn),,并注明出處。

Copyright?2020 西藏文化博物館 All Rights Reserved   京ICP備20018463號(hào)-2