30th rectification.
This commit is contained in:
File diff suppressed because one or more lines are too long
@@ -189,15 +189,15 @@
|
||||
|
||||

|
||||
|
||||
请注意,虽然 Daniel Jones 的工作非常伟大,但最终,那只是一种 “近似描述的尝试”,而不是一个 “标准”。而英文的地方口音又多,各个地方都不太一样。以下是[加利福尼亚地区的人说英语](https://en.wikipedia.org/wiki/California_English)时的元音口腔内气流共振位置:
|
||||
请注意,虽然 Daniel Jones 的工作非常伟大,但最终,那只是一种 “近似描述的尝试”,而不是一个 “标准”。而英文的地方口音又多,各个地方都不太一样。以下是[美国加利福尼亚地区的人说英语](https://en.wikipedia.org/wiki/California_English)时的元音口腔内气流共振位置:
|
||||
|
||||

|
||||
|
||||
首先,每个人的发声习惯都各不相同,并非全世界所有的人都用完全相同的 “口腔内气流共鸣位置” 说出同样的元音。与此同时,人们在识别他人语音的时候,我们的大脑并不是对每个音素不同层面的各个参数进行对比分析而后才能识别,而是通过几个粗略的模式对比去完成识别,并且,还会参照一些音素之外的东西,比如,上下文。
|
||||
首先,每个人的发声习惯都各不相同,并非全世界所有的人都用完全相同的 “口腔内气流共鸣位置” 说出同样的元音。与此同时,人们在识别他人语音的时候,我们的大脑并不是对每个音素不同层面的各个参数进行对比分析而后才能识别,而是通过几个粗略的模式对比去完成识别,并且,还会参照一些音素之外的东西,比如,上下文([4.1](#4.1-流利))。
|
||||
|
||||
> [!note]
|
||||
>
|
||||
> 2022 年 OpenAI 发布的语音识别转换文字模型 [Whisper](https://github.com/openai/whisper) 语音识别之所以前所未有地速度更快,准确率更高,更多基于它的算法对语音内每个词对应的上下文分析(主要通过各种类型的 “模式识别”),而不仅仅是音素识别。在此之前,大多数语音识别模型更多只是基于对音素的分析,所以速度慢,准确率也不高。
|
||||
> 2022 年 OpenAI 发布的语音识别转换文字模型 [Whisper](https://github.com/openai/whisper) 语音识别之所以前所未有地速度更快,准确率更高,更多基于它的算法对语音内每个词对应的上下文分析(主要通过各种类型的 “模式识别”),而不仅仅是对各个的音素识别。在此之前,大多数语音识别模型更多只是基于对音素的分析,所以速度慢,准确率也不高。
|
||||
|
||||
在练习的时候,把所有英文元音的 **“口腔内气流共鸣位置” 尽量靠后就对了** —— 尽量往后移,感觉上移到接近喉咙的位置 —— 这是因为,亚洲语系的元音在发声的时候,“口腔内气流共鸣位置” 每一个都相对更为靠前。
|
||||
|
||||
@@ -226,7 +226,7 @@
|
||||
|
||||
有些词典,针对美式发音,常常会用 `ɛ` 标注 `e` 这个音。
|
||||
|
||||
`æ` 是 `e` 的更长版本。虽然 `æ` 后面没有长元音符号 `ː`,但,它其实应该算作 “长元音”。亚洲人在读这个音的时候,都能做到把嘴巴张得更大一点,但,都会不由自主地将它读成更短的版本。这里有两个要点:
|
||||
`æ` 相当于是 `e` 的更长版本。虽然 `æ` 后面没有长元音符号 `ː`。但,它其实应该算作 “长元音”。亚洲人在读这个音的时候,都能做到把嘴巴张得更大一点,但,都会不由自主地将它读成更短的版本。这里有两个要点:
|
||||
|
||||
> 1. 音拉长一点
|
||||
> 2. 嘴张大一点
|
||||
@@ -241,7 +241,7 @@
|
||||
|
||||
初学者容易矫枉过正,遇到这两个音就加上 `ʳ`,比如,可能会把 *focus* 读成 `fəʊkəʳs`。
|
||||
|
||||
注意:有些词典,常常会用 `ɜ` 标注 `ə` 这个音。另外,针对美式发音,`əʳ` 会被写成 `ɚ`,`əːʳ` 会被写成 `ɜː` 或者 `ɝ`。
|
||||
有些词典,常常会用 `ɜ` 标注 `ə` 这个音。另外,针对美式发音,`əʳ` 会被写成 `ɚ`,`əːʳ` 会被写成 `ɜː` 或者 `ɝ`。
|
||||
|
||||
注意,在连贯的自然语音中,很多非重音音节的元音,都有被简化成 ` ə` 的倾向,尤其是 `ɪ`。比如,*individual*, `ˌɪndɪˈvɪdʒjʊəl`,实际上会被读作 `ˌɪndəˈvɪdʒəwəl` —— `jʊ` 也变成了 `ə`,而后 `ʊ` 和 `ə` 之间有个加音 `w`([2.2.12](#2.2.13.-`j,-w`))…… 事实上,现在已经有很多词典干脆直接标注成了后者。
|
||||
|
||||
@@ -279,13 +279,13 @@ Daniel Jones 去世之后,Alfred C. Gimson 接受了他的工作,于 1977
|
||||
|
||||
这一对元音在发声的时候,嘴唇动作非常明显,嘴唇得形成一个小的圆形之后开始发音。另外,`ɔː` 可能会被美国人读成 `ɔʳ` ,更像是双元音 `ɔᵊʳ` —— 但,再一次,还是不一定都如此,需要逐个核对。
|
||||
|
||||
另外,D.J. 音标最初的时候短元音用 `ɔ`,长元音用 `ɔː`。但,后来短元音 `ɔ` 开始使用笔划上闭口的 `ɒ`,而后又换来换去…… 始终也没说清楚到底为什么 —— 初学者还真需要适应一下。
|
||||
另外,D.J. 音标最初的时候短元音用 `ɔ`,长元音用 `ɔː`。但,后来短元音 `ɔ` 开始使用笔划上闭口的 `ɒ`。
|
||||
|
||||
|
||||
|
||||
#### 2.1.8. `aɪ, eɪ, ɔɪ, aʊ, əʊ, eə, ɪə, ʊə`
|
||||
|
||||
亚洲语系基本上都没有和英文一样的双元音。韩文里压根就没有双元音(母音),日文的母音和中文的韵母虽然都有少数由两个基础音素构成的组合音,但,它们和英文的双元音不同的地方在于,它们都是和其它韵母或者母音等长的,而不是像英文双元音的长度那样几乎是短元音的两倍。
|
||||
亚洲语系基本上都没有和英文一样的双元音。韩文日文的母音和中文的韵母虽然都有少数由两个基础音素构成的组合音,但,它们和英文的双元音不同的地方在于,它们都是和其它韵母或者母音等长的,而不是像英文双元音的长度那样几乎是短元音的两倍。
|
||||
|
||||
比如,当中国人说 “太累了” 的时候,“太”(`tài`)这个字的 “韵母” 就很接近英文的双元音 `aɪ`;“累”(`lèi`)这个字的韵母就很接近英文的双元音 `eɪ`…… 但,它们很不一样,英文的双元音就是更长。
|
||||
|
||||
@@ -940,7 +940,7 @@ D.J 音标经过多次改版,最终被剑桥接手,于 1997 发布了第 15
|
||||
|
||||

|
||||
|
||||
除了少数词汇会被 “强读” 之外,还会有很多词汇会被 “弱读”。
|
||||
除了少数词汇会被**强读** 之外,还会有很多词汇会被**弱读**。
|
||||
|
||||
以下是 TOEFL 听力录音中第一篇中的前两个句子,请注意同一个单词 “**community**” 第一次出现和第二次出现时的具体不同:
|
||||
|
||||
@@ -952,7 +952,7 @@ D.J 音标经过多次改版,最终被剑桥接手,于 1997 发布了第 15
|
||||
|
||||
> **Community** **service** is an **important** **component** of **education** **here** at our **university**. We **encourage** **all** **students** to **volunteer** for at **least** **one** community **activity** **before** they **graduate**.
|
||||
|
||||
自然语音中,会有大量的 “常见词汇” 会被 “弱读”。
|
||||
自然语音中,会有大量的常见词汇会被**弱读** —— 尤其是那些最常见的单音节词汇。
|
||||
|
||||
各种语言都有这种现象,主要原因可能是因为 “太常见”、“太容易理解”、“相对于不那么重要” 等等的原因,乃至于说话者在说那些词汇(或者 “音节”)的时候会 “更快” 或者 “更轻”,甚至 “省略” 或者 “合并”……
|
||||
|
||||
@@ -978,14 +978,14 @@ D.J 音标经过多次改版,最终被剑桥接手,于 1997 发布了第 15
|
||||
|
||||
其实,哪怕在单独读某一个单词的时候,其中元音的长短都会受到重音重读的影响。比如,*city* 这个单词,重音在第一个音节上,而两处的元音是一样的:`ˈsɪ-t̬ɪ`;但是只要你把第一个音节读得足够重,自然而然就能感觉到第一个 `ɪ` 只能比第二个 `ɪ` 更长。
|
||||
|
||||
大多数助动词、系动词、介词、连词、冠词、代词,都有两种发音形式:“强读式”、“弱读式” —— 这些单词往往都是单音节单词。在自然语流中,它们更多的情况下是以弱读式读出的。以下是其中最常见最普及的强读式、弱读式对照列表。注意,以下的列表不能当作硬规则使用,不是所有的虚词都必须被弱读;也不是所有的实词都必须被强读。下面的列表只是在描述现象。
|
||||
大多数助动词、系动词、介词、连词、冠词、代词,都有两种发音形式:**强读式**(*accented form*)、**弱读式**(*weak form*) —— 这些单词往往都是单音节单词。在自然语流中,它们更多的情况下是以**弱读式**读出的。以下是其中最常见的强读式、弱读式对照列表。注意,以下的列表不能当作硬规则使用,不是所有的虚词都必须被弱读;也不是所有的实词都必须被强读。下面的列表只是在描述现象。
|
||||
|
||||
> - a: `eɪ` → `ə`
|
||||
> - am: `æm` → `əm, m`
|
||||
> - an: `æn` → `ən, n`
|
||||
> - and: `ænd` → `ənd, nd, ən, n`
|
||||
> - any: `'eni` → `ni`
|
||||
> - are: `a:` → `ə`
|
||||
> - are: `ɑ:` → `ə`
|
||||
> - as: `æs` → `əz`
|
||||
> - at: `æt` → `ət`
|
||||
> - but: `bʌt` → `bət`
|
||||
@@ -1009,7 +1009,7 @@ D.J 音标经过多次改版,最终被剑桥接手,于 1997 发布了第 15
|
||||
> - must: `mʌst` → `məst, məs`
|
||||
> - my: `mai` → `mi`
|
||||
> - of: `əv` → `əv, v, f, ə`
|
||||
> - our: `ɑʊɚ` → `ar`
|
||||
> - our: `ɑʊɚ` → `ɑr` ⭢ `ɑ`
|
||||
> - shall: `ʃæl` → `ʃəl, ʃl`
|
||||
> - she: `ʃiː` → `ʃi`
|
||||
> - should: `ʃud` → `ʃəd, ʃd, ʃt`
|
||||
@@ -1027,8 +1027,8 @@ D.J 音标经过多次改版,最终被剑桥接手,于 1997 发布了第 15
|
||||
> - we: `wiː` → `wi`
|
||||
> - were: `wəː` → `wə`
|
||||
> - when: `wen` → `wən`
|
||||
> - will: `wil` → `əl, l`
|
||||
> - would: `wud` → `wəd, əd`
|
||||
> - will: `wɪl` → `əl, l`
|
||||
> - would: `wuːd` → `wəd, əd`
|
||||
> - you: `juː` → `ju, jə`
|
||||
|
||||
|
||||
@@ -1052,7 +1052,7 @@ D.J 音标经过多次改版,最终被剑桥接手,于 1997 发布了第 15
|
||||
> * *at* 中的 `t`,由于前后被两个元音夹着,所以变成了和 `d` 非常接近的 `t̬`([2.2.5](#2.2.5.-`t`));
|
||||
> * 为了把 *university* 中的长元音重读音节 `vəː` 读清楚,与前一个音节 `junə·` 之间有个细微的停顿([3.2](#3.2.-停顿)),而 `vəː` 读成了平调([3.4](#3.4.-起伏))……
|
||||
|
||||
日常生活中,绝大多数人讲话并不会刻意在乎节奏,也常常感觉并无必要。但,总有一些人是训练有素的,比如,他们需要朗读、录音、演讲,甚至表演…… 于是,他们会有意无意地控制节奏。
|
||||
日常生活中,绝大多数人讲话并不会刻意在乎**节奏**,也常常感觉并无必要。但,总有一些人是训练有素的,比如,他们需要朗读、录音、演讲,甚至表演…… 于是,他们会有意无意地控制节奏。
|
||||
|
||||
这也是为什么绝大多数人在模仿外语录音的时候总是感觉心有余力不足的原因,首先因为他们忽视了节奏这个格外重要的因素。另外,他们忘了被模仿的语音,是训练有素且相当专业的声音,那甚至是质量极高难度极大的表演 —— 这更是提高了普通人模仿的难度。
|
||||
|
||||
@@ -1087,11 +1087,11 @@ D.J 音标经过多次改版,最终被剑桥接手,于 1997 发布了第 15
|
||||
|
||||
可是,突然之间,只是因为听不懂、记不住,大脑就像一台同时运行了太多软件的电脑, CPU 过热,内存溢出,恨不得当场死机。于是,不知不觉之间产生了幻觉,就是觉得对方说话快,即便对方正在以再正常不过的语速讲话。
|
||||
|
||||
基于上面这个误解的下一个误解,更微妙,人们常常误以为 “语速够快” 就能构成 “讲得足够流利”。其实,“流利” 的构成与 “语速快慢” 几乎全无关系。“是否流利” 更多是发音是否正确,措辞是否准确,句法和用法是否符合习惯,逻辑是否顺畅,等等等等 —— 以及,很多人可能并未意识到的另外一个东西,叫做 “节奏”([3.6](#3.6.-缓急))。
|
||||
基于上面这个误解的下一个误解,更微妙,人们常常误以为 “语速够快” 就能构成 “讲得足够流利”。其实,“流利” 的构成与 “语速快慢” 几乎全无关系。“是否流利” 更多是发音是否正确,措辞是否准确,句法和用法是否符合习惯,逻辑是否顺畅,等等等等 —— 以及,很多人可能并未意识到的另外一个东西,叫做**节奏**(停顿 [3.2](#3.2-停顿)、轻重 [3.5](#3.5-轻重)、缓急 [3.6](#3.6.-缓急))。
|
||||
|
||||
把长元音和双元音读成更短的版本,很多辅音没有清楚地发音,甚至可能在某些辅音之后插入了原本没有的元音…… 这种节奏上的 “出人意料” 才最影响识别,尤其所谓 “语速的不同”,不是慢了,而是快了 —— 这一方越是自觉流利,另一方就越是听不懂,跟不上。
|
||||
把**长元音**和**双元音**读成更短的版本(尤其是 `æ`,[2.1.3](#2.1.3.-`e`/`æ`)),很多**辅音**没有清楚地发音,很多实际存在的微妙**停顿**([2.2.5.1](#2.2.5.1-省音))全都忽略,甚至可能在某些辅音之后插入了原本**不存在的元音**,但是,反过来常见的**加音**([2.2.13](#2.2.13.-`j,-w`))却实际上缺席…… 这种节奏上的 “出人意料” 才最影响识别,尤其所谓 “语速的不同” —— 不是慢了,而是快了 —— 这一方越是自觉流利,另一方就越是听不懂,跟不上。
|
||||
|
||||
所以,说话的时候要放松,只要你能听懂了,幻觉就会消失,你的大脑就能轻松处理绝大多数信息,CPU 不会超载,内存不会溢出,对方的语速就 “慢了下来” —— 这只不过是日拱一卒假以时日就可以自动解决的问题。
|
||||
所以,说话的时候要放松 —— 只要你能听懂了,幻觉就会消失;你的大脑就能轻松处理绝大多数信息,CPU 不会超载,内存不会溢出,对方的语速就 “感觉上慢了下来” —— 这只不过是日拱一卒假以时日就可以自动解决的问题。
|
||||
|
||||
所以,刚开始的时候,**要刻意放慢自己的语速**。记住,流利不靠语速,起码不只靠语速。语速过快,容易出错,越快出错越多。再说,流利也不是一上来就需要追求的东西,速度更不是。
|
||||
|
||||
@@ -1123,17 +1123,17 @@ D.J 音标经过多次改版,最终被剑桥接手,于 1997 发布了第 15
|
||||
|
||||
在模仿的时候,最难模仿的,其实不是我们已经讲解过的各种重点…… 还有一个可能无法模仿的,和另外一个其实可以模仿的。
|
||||
|
||||
可能无法模仿的是对方的 “音质”,因为到最后,每个人的声音都不一样,声线、音域、音量都…… 通常来说,除非是 “模仿能力特别强” 的人,才能做到发出和别人同样音质的声音 —— 虽然不是谁都做不到,但,在 “说话” 这个相当于 “超级低配版地唱歌” 这个活动中,这个要求多少的确有点过份……
|
||||
可能无法模仿的是对方的**音质**,因为到最后,每个人的声音都不一样,声线、音域、音量都…… 通常来说,除非是模仿能力特别强的人,才能做到发出和别人同样音质的声音 —— 虽然不是谁都做不到,但,在说话这个相当于**超级低配版唱歌**的活动中,这个要求多少的确有点过份……
|
||||
|
||||
但,有其实可以模仿的 —— “情绪”。紧张、兴奋、疲惫、失望、恐惧、悲伤、快乐、期待,等等等等。就算不能模仿得一模一样,终归能按照自己的方式去表现同样的情绪 —— 瞬间就能做到八九不离十。
|
||||
但,的确有其实可以模仿的 —— **情绪**。紧张、兴奋、疲惫、失望、恐惧、悲伤、快乐、期待,等等等等。就算不能模仿得一模一样,终归能按照自己的方式去表现同样的情绪 —— 瞬间就能做到八九不离十。
|
||||
|
||||
用 AI 生成的真人语音,最大的问题在于,它目前还不能做到 “情绪饱满”,它只是尽量做到了 “听起来像是真人说话”,虽然已经很好,但就是缺乏情绪表达 —— 它也的确没有什么真正的情绪……
|
||||
用 AI 生成的真人语音,最大的问题在于,它目前还不能做到**情绪饱满**,它只是尽量做到了 “听起来像是真人说话”,虽然已经很好,但就是缺乏情绪表达 —— 它也的确没有什么真正的情绪…… 另外,AI 生成的真人语言,目前(2024.02)在连读([2.3](#2.3-停顿))现象上模仿得相对较少。
|
||||
|
||||
各种惊悚片动作片都很精彩,很吸引人…… 可实际上它们真的不是最好的学习材料,因为这类影视内容的对话事实上非常枯燥,警匪片里最常重复的,只不过是 *Freeze! Drop your gun!* 要么就是 *You have the right to remain silent*... 战争片里最常重复的更加迷离,反反复复最多的都是 *Get down!* 或者 *Go! Go! Go!* —— 动作太多,语言就只能太少。至于情绪么,往往更多的只有愤怒或者悲伤。
|
||||
|
||||
—— 这就是为什么**生活情景剧**和**脱口秀**常常是很好的学习材料的重要原因 —— 主要是情绪丰富且饱满。另外,纪录片往往都是很好的学习材料。它们的特点是,措辞简单明了,语速慢,吐字清晰,并且情绪饱满。情绪更加饱满的,是各种给青少年甚至婴幼儿看的动画片或者绘本讲解,情绪丰富饱满到夸张的地步……
|
||||
这就是为什么**生活情景剧**和**脱口秀**常常是很好的学习材料的重要原因 —— 主要是情绪丰富且饱满。另外,**纪录片**往往都是很好的学习材料。它们的特点是,措辞简单明了,语速慢,吐字清晰,并且情绪饱满。情绪更加饱满的,是各种给青少年甚至婴幼儿看的动画片或者绘本讲解,情绪丰富饱满到夸张的地步……
|
||||
|
||||
如果觉得这些都太尴尬,还有个办法是不断学唱英文歌曲 —— 每个音节都带着不同的音高曲调,甚至有可能一个词就唱了满满一两个小节,容不得一丝的错误,真的是绝佳的练习场景。
|
||||
如果觉得这些都太尴尬,还有个办法是不断学唱**英文歌曲** —— 每个音节都带着不同的音高曲调,甚至有可能一个词就唱了满满一两个小节,容不得一丝的错误,真的是绝佳的练习场景。
|
||||
|
||||
语音的功用,如果说有 20% 是用来传递对事实的感受的话,那么,剩下的 80% 肯定并且只能用来传递情绪,不是吗?一直以来,大家在 “学外语” 的时候,都太理智了,不是吗?理智的确是一种很好的品质,但,有时候,它可能会成为不可逾越的障碍…… 真的很可惜!
|
||||
|
||||
|
||||
Reference in New Issue
Block a user