# 3.7. 长短 再次需要强调的是: > 所有语言都一样,自然语音实际上以**音节**为最基础单位。 所以,说话的过程就是**把每个音节安排好**的过程。 传统外语教学对自然语音中**韵律**(*prosody*)和**节奏**(*rhythm*)的重视程度并不足够,重视得也不够全面。韵律节奏长期以来一直是母语教学中所谓最高级的部分才会深入讲解的领域:诗词创作。 曾经,传统外语教学只会泛泛提及**声调**的**起伏**,并且,基本上仅限于祈使句与疑问句之中那些处于句末以词汇为单位的明显声调变化。 其实,语言学领域并不是不重视韵律和奏,只不过,那些语言学领域的科研成果总是需要更多的时间或注意力才能被语言教学领域采用 —— 不知道还要等多久才能进入普及教育的课堂…… 计算机科学家们等不及。他们需要 —— 其实是整个世界需要 —— 机器能够完美地模拟人声。他们发现,音素级别的准确并不能解决问题;真正可以使机器生成的语音无限接近真实人声的,甚至可以以假乱真的,在音素的基础上,是韵律节奏。韵律节奏的重要性,占比上来看,远远超过音素。 现在,反过来,我们可以用计算机科学家们用来生成自然语音的原理反过来指导我们自己重塑语言: > 当然要重视音素的清晰准确,但,要**更加重视**韵律节奏。 **韵律**包括音高的高低,声调的起伏,单个音节的轻重;**节奏**来自于临近音节的缓急,音节之间的停顿…… 但,还需要一个重点补充: > **节奏**的构成还包括音节的**长短**。 即便是理论上每个韵母都等长的中文(或者机理上类似的亚洲语言,比如日文或者韩文),在自然语音的发声过程中,每个韵母的长短都有所变化。 > 没有很爱你,只是在大街上拼命追逐,和你背影很像的人。[^1] 英语的元音天然有**长短**之分,短元音当然短,长元音和双元音相对于短元音更长。如果韵律节奏相对更重要,那么,若是某个或者某些音节的**长短**搞错了的话,整个语音的节奏都会乱掉。 ::: tip 总是需要格外提醒的是, `æ` 是长元音([2.1.3](06-e)),虽然这个音标并没有长元音符号 `ː`…… ::: 对于**韵律节奏**,需要在脑子里生成一个简单清晰却又记忆深刻的框架: > * 韵律 > * 高低([3.3](32-high-low)) > * 起伏([3.4](33-up-down)) > * 轻重([3.5](34-strong-weak)) > * 节奏 > * 停顿([3.2](31-pause)) > * 长短([3.7](36-long-short)) > * 缓急([3.6](35-fast-slow)) 当我们模仿跟读的时候,需要逐个分析的基础单位是**音节**。 首先是对每个音节中的**音素**(元音与辅音)的分析。 又因为**元音是音节的核心**([1.2](02-syllables)),所以**韵律节奏主要在元音上体现**:高低、起伏、轻重、长短、缓急…… 而涉及停顿的,尤其是非换气停顿的,才是辅音。 所以,音素分析之后,就是**音节**分析,本质上是对音节的核心 —— **元音** —— 的分析,**韵律节奏**上的分析。 > 需要反复强调的是,**韵律节奏分析比音素分析更为重要**。 难点只不过在于,每个人的韵律节奏都有一定的不同。所以,跟读一个人的录音,和跟读另外一个人的录音,可能会有很大的不同…… 但,就是这样,虽然每个人都多少个性化,总体上却又符合一定的规律和特征。 跟读多了,很快就能习惯那些最重要但不一定总结得出来的系统化特征 —— 我们就是这样学会并在一定程度上能够做到说好母语的。 [^1]: 语音来自 [Automatic Prosody Annotation with Pre-Trained Text-Speech Model](https://daisyqk.github.io/Automatic-Prosody-Annotation_w/)。