返回列表 发帖

[转帖]汉语韵律切分的语音学和语言学线索

 

按:最近在写一篇论文:“形式化音步是新诗格律成熟的必要条件”

先发几篇参考文献給大家垫个底

 

 

汉语韵律切分的语音学和语言学线索
曹剑芬

http://www。zoowen。com/Infos/YYX6237Q7
 
-
 
1 汉语韵律切分的语音学和语言学线索曹剑芬中国社会科学院语言研究所中国科学院心理研究所摘要本文通过感知试验、声学语音学实验和文本分析,考察韵律边界前后的语音学和语言学信息特征、为韵律短语切分提供更加科学可靠的,可以自动预测的标志。全文重点讨论

以下三个方面的问题:第一、关于韵律词和韵律短语的界定;第二、停顿分布与句法结构和词性特点的关系;第三、实际言语中的韵律词组词规律。

1。引言

韵律切分本质上是个话语韵律层次结构问题。当前、有关这个问题的研究已经成为语音学界和言语工程学界普遍关注的焦点。就以计算机文-语转换(TTS)语音合成为例,其基本任务就是把输入的文字材料转换为自然的话音输出。目前、虽然已经能够合成连续的语句,但是,自然度不理想。 具体地说,就是节奏感较差,缺少轻重缓急和抑扬顿挫、还不能为公众所接受。因此,提高自然度是目前TTS 合成的主要任务,而恰当的韵律切分,正确地把握话语的韵律结构,是加强合成语音节奏感,提高其自然度的关键。确定话语的韵律层次,是一个相当艰巨的工程,尤其是要想做到自动切分,确实不容易。针对这个问题,国内外的语音学界和言语工程界已经从各个方面进行探索,提出了许多不同的方法。不过,还没有很好地把语音,语法和语义等很好地结合起来考察,对语音学和语言学信息的运用还不够充分,尚有许多问题亟待解决。本研究拟通过感知试验、声学语音学实验和文本分析,考察韵律边界前后的语音学和语言学信息特征、研究语言的表层表达跟深层结构以及语法中介之间的复杂关系,寻找各种跟口语的韵律结构对应的语音学和语言学线索,探讨实行自动韵律切分的策略。重点讨论关于韵律词和韵律短语的界定,停顿分布与句法结构和词性的关系以及实际言语中的韵律词组词规则,力求为自然语音处理时的韵律切分提供更加科学可靠的,可以自动预测的语音学和语言学信息。以便在计算机语音处理时,不但知道怎样利用各种超音段特征来实施不同层级的韵律切分,而且知道在什么地方对输入的文本自动进行韵律切分,从而构建恰当的韵律结构模型。

2。测试语料及实验概况本研究的实验考察对象是从一个语篇语音库里抽取出来的57 个自然语句,句子的长度一般为9-20 个音节, 最长的一个句子包含了41 个音节。
实验分析主要包括三个方面:第一、 通过文本分析,标注了这部分语料的分词、词性和句法结构;第二、通过听辨测试,标注了不同等级的停顿,确定了各句的韵律切分;第
三、根据文本信息和韵律信息,分析归纳汉语的韵律结构特点。
3。实验结果和讨论
3。1 韵律词及韵律短语的界定在音系学里、韵律层级(Prosodic Hierarchy)从小到大本层级: 韵律词、韵律短语和语调短语。但是,对于这些韵律单元、各家的概念不尽一致,为了满足自然语音处理的需要、这里根据我们的实验研究结果,并参照相关文献,从便于操作的角度,对韵律词和韵律短语加以界定。

3。1 律词:1) 三音节以下的语法词或词组;2) 其它凡是属于一个音步的结构。音步是指音系学中的基本节奏单位。一般由两个或三个音节构成。根据冯胜利[1,汉语普通话里的基本音步,或者叫标准音步,是由两个正常重音音节构成的,三个音节的音步叫做超音步,一个音节构成的叫做蜕化音步,还有一种叫做残音步,指两个音节中有一个是无调音节(atonic)的音步,即一重一轻的两音节结构,例如轻声词。为简化起见、这里把残音步并入基本音步。因此,韵律词也就是语法上凝固的,节律上稳定的单音步[2] ;3) 跨度为1-3 个音节,极大多数为2-3 个音节, 少数为单音节。单音节的韵律词一般是由单音节词延长而构成的所谓蜕化音步,多数为功能词、 例如连词、介词等、也有少数是单音节的动词;4) 具有类似语法词的连调模式和词重音模式。

3。1。2 韵律短语:1) 由一个或几个韵律词组成,即可能多音步[2;2) 跨度为7? 个音节[3;3) 内部各个韵律词间可能出现韵律上的节奏分界、主要表现为韵律词末尾音节的延长(或伴有较短的无声停顿)和韵律词之间的音高(包括音阈和音域)重新设置[4;4) 具有相对稳定的短语调模式,即音阶的declination 及其resetting;5) 具有相对稳定的短语重音配置模式,即与句法结构相关的常规重音模式。例如,偏正结构一般是偏重、主谓结构一般是谓重、述宾结构一般为宾重、述补结构一般为补重[5;

2 较紧密,总是一起说。对于这部分结构,在韵律上究竟怎样处理是个有争议的问题。根据王洪君关于韵律词和韵律短语的区分标准[2,这类结构分为两大部分:一部分纳入韵律词、一部分纳入韵律短语。属于韵律词的有暗亮叠变式的霹里啪啦,稀里糊涂,哆嗦嗦,絮叨叨,漂亮亮,暗亮复合式的乱七八糟,等亮叠变式的噼啪,啪啦,干净净、等亮复合式的取长补短、眉开眼笑,远走高飞,一衣带水。纳入韵律短语的有类词短语格镍合金,全程旁听,认真学习和自由短语又唱又跳,天气晴朗,心情愉快等。据本文的实验分析结果,这里倾向于把四音节结构处理为mini 韵律短语。主要理由是,区分韵律词和韵律短语、固然需要考虑语法结构的特点;但是,更主要的,恐怕应当着眼于它们在实际言语中的语音特点。通常、一个韵律词相当于一个音步,它是音系规则作用的最小辖域,具有相对凝固的语音形式,例如相对稳定的连调模式和基于词重音对立的时长结构模式,内部不出现节奏上的分界现象而韵律短语则不同、它往往由不止一个音步构成,是更高层次上音系规则作用的辖域,具有高于词层面的语调模式和重音配置模式,内部一般都会出现节奏上的分界现象,例如标志性音高运动模式和时长停延伸缩模式。假如从这个角度看,汉语里的四音节结构,不管是稀里糊涂,乱七八糟,干净净、取长补短、还是全程旁听,认真学习,天气晴朗,心情愉快、尽管他们在语法结构上存在种种区别、但有一个共同的特点、就是都包含不止一个音步。这就超越了作为韵律词的音系规则作用的辖域。如果说像稀里糊涂,絮叨叨等几个有限的特殊结构还可以用一种特殊的连调模式来概括的话、那么,像取长补短、眉开眼笑,一衣带水,全程旁听,天气晴朗等、则明明包含两个不同的双音节连调模式,因而在语音上就必然既涉及音步之间的轻重配置问题,又涉及不同的连调模式之间的关系问题,而这些正是韵律短语所具有的层次结构特点。同时,我们在这里谈论韵律词跟韵律短语的界定,恐怕还不得不考虑语音处理上的可操作性。目前、自然语音处理的实践已经发现,如果把四音节结构作为一个韵律词来整体处理,不但操作上比较困难,而且效果往往不理想,许多词语听起来别扭、主要就是由于这种韵律上的失调引起的。因为这些结构的音高和时长模式非常多变,它不仅涉及不同音节声调之间的彼此影响、而且还涉及不同层面上重音和语调的影响、因而很难建立有限的,能够适应不同语境的,相对稳定的音高和时长变化模式而如果把四音节结构按韵律短语来处理,就可以根据这类单元所包含的音步数目及其类型(如:基本音步,超音步或蜕化音步), 运用有限的韵律词模式和有限的高层调节规则,来实施跟短语调和轻重配置相关的音高和时长调节,从而比较方便地达到改善语音自然度的目的。

3。2 停顿插入与句法结构话语的韵律切分问题,实质上就是言语过程中的组词断句问题, 它既涉及听话时知觉上的停顿分布、又涉及说话时语音上的组块分合。从对自然话语的分析来看,韵律的结构层次跟停顿的等级层次大体一致。因此,寻找韵律切分的规律也就是寻找停顿出现的规律。一般的感知试验表明,对于通常的听者来说,能够觉察到的语句中的停顿一般只有三级;而进一步的心理知觉实验表明,语句中可以知觉到的停顿起码可以分为四级。而且、初步的合成试验也发现,对于这第四级知觉上的停顿的适当应用,会对改善合成语音的自然度具有极大的贡献。于是,人们便自然会问,这些停顿的出现都有什么规律能不能利用我们已经掌握的语法和词汇知识自动预测停顿的位置及其等级这就涉及人们普遍关注的韵律跟语法的关系问题。迄今为止,国内外都已经投入了不少力量来探索这个问题,已有的研究已经证明,韵律跟句法不完全一致,这种不一致主要表现在它们的层级结构上。因此,我们不可能完全依靠句法的层级来预测韵律的层级。然而、已有的研究同时也表明[6,7,韵律跟句法又是密切相关的,韵律的结构是以句法结构为基础的,例如,句法上不允许停顿的地方(如词内音节之间),韵律上就不可能停顿;而句法上的高层结构之间,特别是那些用标点符号标记的地方、韵律上就必定会出现停顿。不过,仅仅有这些还不够。现在人们最急切需要了解的是句子内部的韵律结构,希望通过研究句内的停顿跟句法结构和词性的关系,实施自动韵律切分。因为在书面文本上,句子内部通常没有标点符号;而在实际的话语中、语句内部,特别是较长的句子或短语内部,不但有停顿,而且具有不同的等级,正是这些不同等级的停顿标示着语句的韵律结构和层次。因此,我们必须着力研究语句内部的韵律停顿跟句法以及词性的关系,以便充分利用文本上具有的语言学信息本研究就是以此为主要目标的。本研究有关语句内部停顿与句法结构的实验分析结果详见文末附表。总的说来, 语句内部停顿分布与句法结构之间没有始终一致的相关关系,这可以从上表的数据比较离散这个现象得到说明。不过,相对说来, 各级停顿的分布还是具有一定的倾向性。兹概括如下,以供有关方面参考。

3。2。1 一级停顿出现规律一级停顿绝大多数出现在主语跟谓语之间,这在比较平衡的句子里尤为典型。在不平衡的句子里、一级停顿的分布比较离散,跟二级和三级停顿都有较多的交叉、较多出在:1)前置状语跟主语之间;2)复合句的小句之间;3)复杂偏正结构的不同修饰语之间。
3。2 二级停顿出现规律二级停顿分布相对离散,跟一级和三级停顿都有较多的
3。2。3 三级停顿出现规律三级停顿跟二级停顿的分布存在一定的交叉、但主要集
中在:1) 修饰语与中心语之间;2) 动宾之间,介宾之间或系表之间。
3。2。4 四级停顿出现规律
四级停顿的分布范围也很广,但主要集中在:1) 不带的或地短语或词组的两词之间;2) 带的名词短语或词组的的字之后,以四字格为最常见。
3

3。4 实际言语中的韵律词组词规律如前所说,话语的韵律切分问题实质上就是言语过程中的组词断句问题, 既涉及知觉上的停顿分布、又涉及说话时语音上的组块分合。因此,寻找韵律切分的规律,同时也是寻找组字成词的规律。根据本实验获得的文本信息和语音信息,我们发现, 在实际的话语中、 为了满足韵律上的需要、 单音节的语法词都会或者通过延长该音节, 或者前附或后附到另一个标准音步上, 或者跟前后其它的单音节词组合, 设法凑足一个音步,从而构成一个韵律词。不过,这种韵律词的组词并不是任意的,而是遵循一定的原则,具有一定的规律(不计那些跟句法词一致的韵律词)。

实际言语中的韵律词组词的主要原则是:第一、单音节词处于重读地位、或者因为左邻右舍已经是完整的音步而无所依附时,就通过延长而构成独立的音步;第二、单音节词彼此粘附或与其它双音节词组合成音步时,虽然具有很大的自由度,但仍然要受各自词性的制约,根据不完全的统计,大致规律可以概括如下:
比、从),副词(如:近,已),连词(如:因,但,而、与,可,)通过延长而构成韵律词(一个音步);
5) 双音节动名词单音节名词(如:抵押人、收押期,中介人、生意人、制造商);
7) 双音节动名词时间词(如:开拍前、到达后);
8) 双音节动名词动词(如:预言道,挥手说);
15) 单音节的副词介词人称代词(如:就把我,也以他,又将你);
动)(如:一定能,必定要、或许会,特别是,尤其要、可以凭);
26) 单音节疑问代词动词(如:谁知,哪有、怎想到);

30) 单音节连词双音节名词代词(如:与内地,和父母、同军队,跟他们,跟那些)。上述研究结果既可以为提高TTS 合成语音自然度提供实践对策,又可为提高自动识别的正确率提供理论依据。参考文献[1]冯胜利,《汉语的韵律,词法与句法》,北京大学出版社,1997 年;

[6]叶军、停顿的声学征兆,《第三届全国语音学研讨会论文集》,北京,1996 年;
4

 


 孙逐明按:韵律词往往对应一个音步,而韵律短语则对应几个音步组合的短语,在实际朗读中,韵律短语内部的音步后面并非一定有停顿。换言之,两个甚至是三个音步连读是常见的现象。

[此贴子已经被作者于2009-10-30 14:07:47编辑过]

一则通信:

 

 

 

 

 

许教授,您好:
  有一事请教。我似乎记得,不知是您哪一篇文章还是您在常熟讨论发言中,提到过你们倾听了大量诗歌朗诵家的朗诵,发现大量诗句并非严格按照音步的划分停顿,更多的是在几个音步组成的词组后面停顿,你们因此而把这种词组命名为“意顿”。不知是不是有这回事?如果有,您能不能把上述内容的原始文字和出处告诉我。我在写一篇关于音步的论文,特别需要这样的论据。
  拜托了。

此祝

文安,并祝新年愉快! 孙则鸣

   

孙则鸣老师好,来信收到。上次会议论文我校学报和蒋登科那边的《中外诗歌研究》都会发一些,您的文章将在我校学校明年第一期发出。上次会议纪要也将在同期刊出。我们的会议文汇报、文学报等发过报道。
 
 来信说到的事是这样的;90年代初,我和鲁德俊老师合作写作《新格律诗研究》,在分析了别人的格律主张以后,我们想提出自己的理论,于是我们借来了一些中央电台著名主持人的朗诵牒片听,结果发现在实际的朗读过程中没有谁是按着形式节拍来朗读的,而是按自然停顿的词或词组来停顿的。而按照这种朗读法,在朗读对称形式的诗,如郭小川的新辞赋体、纪宇的朗诵诗时,给人的节奏感尤其是节律的冲击力是非常明显的。再进一步说,如果我们完全按照传统的音组方式去读徐志摩的一些诗,读朱湘的一些诗(如《采莲曲》),那就全部变味了。因此,在此基础上,我们在肯定普通的形式化节奏基础上,又提出了另一种新诗的节奏,即口语化的意群对称节奏体系,而且从理论上分析了这种节奏形成的根据,这就是要把节奏的基础视为“时间段落的规律排列”。事实上,只要抓这一点,新诗的节奏就包含多个层次,如诗行也是个节奏单位,甚至诗节也可以是个节奏单位。关于这方面的理论,我们在《新格律诗研究》,在《中外诗歌研究》上发表的《论两种节奏体系》,在这次会议材料中都说到了,仅供参考。研究新诗节奏不能只是从理论到理论,要从创作实践中来,要从实际朗读中来,要研究其理论?
 ?   祝新年好。许霆2月3日

   

逐明按:许教授信中所提及的形式节拍,就是音步分析出来的停顿。许教授在研讨会上口头发言,多次提到诗句的朗诵,决不是每个音步停一下,而是以词组之后停顿的情况最多,也就是说大多数情况下是几个音步才停顿一次。

许教授他们根据朗诵名家的实际朗诵所发现的现象,与我的诗论里面的分析基本相同。

[此贴子已经被作者于2009-10-30 17:05:19编辑过]

TOP

霍凯特在《现代语言学教程》第179页指出:“词是句子中以前后两个可能的停顿为界的任何片段。……词是按可能的停顿定的,而不是按发出时的实际停顿订的。”

TOP

期待老师新论,问好!

欢迎光临“中国格律体新诗网”!http://www.gltxs.com

TOP

来读,问好孙老师。 [em27]
容淡华伫,材不材间。

TOP

孙兄,远握!

TOP

特别强调一下:那种以为在实际朗诵里,音步后面必定有停顿的看法是错误的。

[此贴子已经被作者于2009-10-29 16:16:33编辑过]

TOP

又按:

 

请注意,从曹剑芬的分析可以得知:

 

四音节短语组成的韵律短语,与两个音步组合成的韵律短语,在实际朗诵中的节奏效果是相同的,也就是说,它们内部都没有停顿,仅仅是时长〔四个音节〕相等。

TOP

普通话节律组织中的局部语法约束和长度约束

 

(初敏   王韫佳   包明真《语言学论丛》第30辑〕http://www.docin.com/p-8391115.html

 

通过分析比较1000个句子的多遍发音的节律结构,发现语句的节律组织在没有特殊语义表达需要的情况下存在一定自由度,这种自由度随着节律单元的增大而增大。

 

其中,音步组织里有27%的音节被组合到不同的韵律词里面。所谓“这种自由度随着节律单元的增大而增大”,

TOP

返回列表