|
|
|
|
 |
 |
| ·E-mail:51lw@vip.163.com |
| QQ:976633618 |
 | |
|
|
|
| |
|
|
 |
| |
零 看法的界定 (一)词段:从话语语流中抽取出来的语言单元,是词的音段体现情势,包罗一个声母和一个韵母,不包罗超音段的声调。虽然在统一语音体系中不能辨义,但在差异语音体系的比力中,在似义词确定的条件下,语义已经确定。 (二)词的相干度:词的相干指统一个似义词在差异地域说法异同的水平:全部的词段都类似则说这个词在这些地域的说法类似,相干度为1;完全差异的,相干度为0;部门词段类似或某些词段在语音上有相干的对应,则说这个词在这些地域有相干性,相干度可以议决肯定的盘算要领求出。 (三)词的读法:指一条似义词在某地的语音体现情势,包罗全部语素的语音体现情势。纪录时,用国际音标体现,不用汉字体现。 一 词汇相干度计量研究述评 对方言间和差异语言间词汇靠近率的计量研究,曾有过下述六种要领: 1.1 语言年月学(glottochronology) 日本学者王育德1960年发表用语言年月学要领研究汉语五大方言靠近率及其剖析年月的效果。该研究主要相比词的翰墨体现情势的异同,不涉及语音的相比。王育德所使用的统计事情包罗两部门。第一部门是比力二百个基本词汇在各方言中的异同数,所用的要领是算术统计法。第二部门凭据M.Swadesh提出的盘算公式,盘算五大方言剖析的年月。 1.2 相干连数统计法 这种要领由郑锦全于1973年最早提出。他用“皮尔逊相干”和“非加权匀称系联法”盘算差异方言的字音和词汇翰墨体现情势的亲疏水平,同时提供方言分区的方案。加入比力的似义词共905条。在相干连数统计效果的基础上,再做聚类阐发。 郑锦全的相干连数统计法使用盘算机处理巨大的方言资料,用树形图对18种方言间的亲疏水平作出直观而细密的形貌。显然,相干连数统计法比算术统计法要细密、公正得多。不外它有两个主要缺点:一是没有思量词频这个紧张因素;二是比力词汇异同,只思量词形异同,并掉臂及词内部词根或中心语素的异同。如“太阳”和“日头”词形差异,两者的类似率为0;“太阳”和“太阳佛”词形差异,两者的类似率也为0。现实上“太阳佛”的中心语素跟“太阳”完全类似,将两者的类似率看成0来处理是分歧理的。1.1中所述的算术统计法也有这两个缺点。 王士元和沈钟伟于1992年撰文品评郑锦全的要领在语言学上和盘算上的分歧理性,提出在汉语方言分类上,盘算的基本单元应该是语素,而不是词。他们进一步完满了相干连数统计法和聚类阐发法,而且对吴语内部三十三个点的方言词汇的亲疏关连举行了计量研究。 1.3 算术统计法 这种要领将差异方言的词汇的同或异,用加减法举行统计,然后以百分比盘算靠近率。詹伯慧和张日升曾凭据他们所编《珠江三角洲方言词汇比力》(1988)的质料,比力北京话和粤语词汇的靠近率。加入比力的词汇有1001个,两者类似的只有140多个,仅占10.4%。 王育德和詹伯慧等人使用的要领都是算术统计法,但是所得效果相差甚远。缘故原由显然是两者加入比力的词汇的数目差异,王育德所用是两百个基本词汇(效果70.77%),詹伯慧等人所用的词汇则有一千个至八千个。可见基本词汇类似率较高,一样平常词汇类似率较低。 1.4 概率法 借词和同源词向来是比力难区分的。陈保亚在《论语言打仗与语言同盟》(1996)中试图用概率的要领管理这个题目。陈保亚以为,语音对应规律不能作为确定同源关连的充实条件,这是由于语音对应规律自己不能说明最早时间条理的关连词是同源词照旧借词。但语音对应规律的另一个紧张作用是扫除偶然相似。当两种语言的一系列词在语音上有对适时,很难用偶然偶合加以评释。于是,他凭据声母、韵母和声调的对应规矩,用卡方散布和泊松散布,盘算出某词在两地属于同源词的概率。陈保亚接纳M.Swadesh1952年从印欧语言中挑选出的人类语言中最稳固的200个词和1955年从这200个焦点词中筛选出的100个更稳固的焦点词作为阐发质料,并把100个最稳固的焦点词称为第一阶词,把第二个100词称为第二阶词。议决概率盘算,陈得出结论:侗台语和南岛语的关连词第100词高于第200词,应当认可侗台语和南岛语有同源关连。 这种计量法将词汇和语音的因素团结在一起思量,从音类的一定厘革和音素的偶然厘革入手,运用概率将这两种厘革区脱离,将同源词在语音上的厘革归为音类的一定厘革;借词则归为偶然厘革,有肯定的创意。但是它把声调看成和声韵母同样紧张的因素思量却值得探究。我们以为思量“有配合语义的词段”这个因素比力公正。 1.5 矩阵剖析(matrix decomposition) 这是Sanzheng Qiao和William Shi-Yuan Wang于1998年提出的要领。这种要领是用一对矩阵剖析任何的无根双叉树。这个要领也可以用矩阵天生树。作者以欧洲语言基本词汇的靠近率盘算为例,叙述了这一研究要领。矩阵剖析是应用盘算机,在全部的合成大概中探求一种最佳的树行合成图。这与早先的聚类阐发差异。 1.6 加权匀称法 游汝杰、杨蓓在《广州话、上海话和平凡话词汇靠近率的计量研究》(1999)一文提出了加权匀称法。这种要领革新了上述统计要领,以广州话、上海话和平凡话为例,提出方言间词汇靠近率计量研究的新要领。这个新要领有三个特点:(1)用加权法统计差异方言词汇的异同,以词频作为权数。(2)以中心语素为基准比力词汇的异同,分级加权统计。(3)多人次考试方言词汇的口语可懂度。所用词频数据参考北京语言学院语言教学研究所编的《今世汉语词频辞书》(1986)。 1.7 小结 综上所述,可以归纳出以下几点:(1)搪塞语言的计量来说,质料是至关紧张的。一样平常来说,选用词作为计量的质料比力多,而且也比力妥当。由于词是语言最基本的载体,讨论着语音和语法,在整个语言体系中占据举足轻重的职位地方。但是,选择什么样的词,选用几多数目的词,这对计量的效果会孕育发生很大影响。现在,用语言年月学的200个基本词汇作研究的比力多,但题目的要害在于这二百个词是否适当汉语?除了语义上的评释,还有什么其它证据可以证明这些词的稳固性?上述各家的研究评释,选择的词汇数目和相干度成反比,以是在研究相干度时,词汇的数目必须适中。(2)要是研究的质料被确定为某些词后,接下来的题目即是从哪个角度举行计量研究。就一个词而言,词段是相当紧张的。一样平常来说,一个词有翰墨体现情势和语音体现情势两种。对印欧语来说,这两种体现情势的差异并不大,由于它是拼音翰墨,翰墨直接讨论语音。但汉语就差异了,汉字和汉语词的语音没有直接的关连。一个词在两地的翰墨体现情势类似或相似(这里的相似指的是一个词中部门字类似),说明语素类似或相似。但这并不评释其在语音上一定类似或相似,两地要是相差很远,或其语言已经剖析了很永劫间,那么在语音上很大概已经截然差异,而这种差异在翰墨上是无法体现的。同样,一个词在两地的翰墨体现情势差异,并不能说明语素差异,大概它们在语音上会有讨论。以是,在研究汉语词汇的相干度时
共4页: 上一页 1 [2] [3] [4] 下一页
上一篇:家庭语言外交款式的动态研究 下一篇:双音动词作定语时“的”隐显的制约条件 |
|