fix some errors in markdown.

This commit is contained in:
xiaolai
2024-03-03 18:18:23 +08:00
parent 80ec006e31
commit e392b49a0a
61 changed files with 600 additions and 602 deletions

View File

@@ -4,4 +4,4 @@
有些词典,常常会用 `ɜ` 标注 `ə` 这个音。另外,针对美式发音,`əʳ` 会被写成 `ɚ``əːʳ` 会被写成 `ɜː` 或者 `ɝ`
注意,在连贯的自然语音中,很多非重音音节的元音,都有被简化成 `ə` 的倾向,尤其是 `ɪ`。比如,*individual*, ɪndɪˈvɪdʒjʊəl`,实际上会被读作 ɪndəˈvɪdʒəwəl`<span class="speak-word-inline" data-audio-us="/audios/individual-us.mp3"></span> —— `jʊ` 也变成了 `ə`,而后 `ʊ``ə` 之间有个加音 `w`[2.2.12](#2.2.13.-`j,-w`))…… 事实上,现在已经有很多词典干脆直接标注成了后者。
注意,在连贯的自然语音中,很多非重音音节的元音,都有被简化成 `ə` 的倾向,尤其是 `ɪ`。比如,*individual*, ɪndɪˈvɪdʒjʊəl`,实际上会被读作 ɪndəˈvɪdʒəwəl`<span class="speak-word-inline" data-audio-us="/audios/individual-us.mp3"></span> —— `jʊ` 也变成了 `ə`,而后 `ʊ``ə` 之间有个加音 `w`[2.2.13](25-jw))…… 事实上,现在已经有很多词典干脆直接标注成了后者。

View File

@@ -2,7 +2,7 @@
`f` 这个辅音,对中文普通话的使用者来说毫不费力,因为中文普通话里有这个声母。
但是,这个清辅音 `f` 的浊辅音版本,`v`,就是中文普通话里没有的了。所以需要 “新学” 并且还得 “专门练习”,不能用近似的 `w` 替代 `v`。比如,不能把 *every* 读成 `/ˈewərɪ/`。朝鲜语也没有这两个音,所以韩国人常常会用 `p` 替代 `f`,把 *photo* 读成 `/ˈpɔtɔ/`<span class="speak-word-inline" data-audio-uk="/audios/photo-ko-kr.mp3"></span>;也常常会用 `b` 替代,把 *video* 读成 `/ˈbɪdiəʊ/`<span class="speak-word-inline" data-audio-uk="/audios/video-ko-kr.mp3"></span>。
但是,这个清辅音 `f` 的浊辅音版本,`v`,就是中文普通话里没有的了。所以需要 “新学” 并且还得 “专门练习”,不能用近似的 `w` 替代 `v`。比如,不能把 *every* 读成 `/ˈewərɪ/`。朝鲜语也没有这两个音,所以韩国人常常会用 `p` 替代 `f`,把 *photo* 读成 `/ˈpɔtɔ/`<span class="speak-word-inline" data-audio-uk="/audios/photo-ko-kr.mp3"></span>;也常常会用 `b` 替代,把 *video* 读成 `/ˈbɪdiəʊ/`<span class="speak-word-inline" data-audio-uk="/audios/video-ko-kr.mp3"></span>。
`f``v` 可能对中国南部地区的一些人会造成困难。需要反复练习一个原本生活里没用过的发声方式:**上牙齿接触下嘴唇之后再开始发音**。

View File

@@ -17,7 +17,7 @@
> * *wrong idea* ⭢ `/rɔn aɪˈdiə/`
> * *thinking of* ⭢ `/ˈθɪŋkɪn əv/`
另外,`m``n` 常常会使之前的辅音,尤其是 `d``t` 变成**音节辅音***syllabic consonant*),比如,*didn't* `/ˈdɪd̩nt/`<span class="speak-word-inline" data-audio-uk="/audios/didn't-uk.mp3" data-audio-us="/audios/didn't-us.mp3"></span>, *wouldn't* `/ˈwʊd̩nt/`<span class="speak-word-inline" data-audio-uk="/audios/wouldn't-uk.mp3" data-audio-us="/audios/wouldn't-us.mp3"></span> —— 独自构成音节的那个辅音,例如这里的 `d`,下面多了个竖线作为标注,`d̩`。再比如,*rhythm* `/ˈrɪð̩m/`<span class="speak-word-inline" data-audio-uk="/audios/rhythm-uk.mp3" data-audio-us="/audios/rhythm-us.mp3"></span>。
另外,`m``n` 常常会使之前的辅音,尤其是 `d``t` 变成**音节辅音***syllabic consonant*),比如,*didn't* `/ˈdɪd̩nt/`<span class="speak-word-inline" data-audio-uk="/audios/didn't-uk.mp3" data-audio-us="/audios/didn't-us.mp3"></span>, *wouldn't* `/ˈwʊd̩nt/`<span class="speak-word-inline" data-audio-uk="/audios/wouldn't-uk.mp3" data-audio-us="/audios/wouldn't-us.mp3"></span> —— 独自构成音节的那个辅音,例如这里的 `d`,下面多了个竖线作为标注,`d̩`。再比如,*rhythm* `/ˈrɪð̩m/`<span class="speak-word-inline" data-audio-uk="/audios/rhythm-uk.mp3" data-audio-us="/audios/rhythm-us.mp3"></span>。
有些词典会直接将 *didn't* 标注为 `/ˈdɪdənt/`,将 *wouldn't* 标注为 `/ˈwʊdənt/`,将 *rhythm* 标注成 `/ˈrɪðəm/`…… 但是,音节辅音内的元音音素,更准确地讲,更接近 `ɤ`[2.2.1](13-pbmnfkgh))而不是 `ə` —— 这个细微差异,竟然会使美国人轻易地听出外国口音[^1]。

View File

@@ -41,5 +41,5 @@
> 只要你把所有 `t` 都读成 `d`,你听起来就很像印度人,要是把所有长元音都读短,就更像……
比如,你可以试着玩玩这句:<span class="speak-word-inline" data-audio-other="/audios/en-IN-Dont-tell-me.mp3"></span>*Don't tell me what to do!*
比如,你可以试着玩玩这句:<span class="speak-word-inline" data-audio-other="/audios/en-IN-Dont-tell-me.mp3"></span>*Don't tell me what to do!*
:::

View File

@@ -10,4 +10,4 @@
又比如,*household* 这个词听起来更像是`ˈ/haʊˌsəʊld/`<span class="speak-word-inline" data-audio-uk="/audios/household-uk.mp3" data-audio-us="/audios/household-us.mp3"></span>……

View File

@@ -10,7 +10,7 @@
所以,要格外注意 `l` 在元音之后的情况,注意舌尖位置正确,动作完整,不能有嘴唇动作 —— 否则就会出现 `ʊ` 音。
<img src="/images/speech-tract-l.svg" class="themed" />
<img alt="speech tract of /l/" src="/images/speech-tract-l.svg" class="themed" />
格外需要注意的是,由于处于音节末尾的 `l` 有这个完整的舌尖动作,于是,它之前的`ɪ``iː``eɪ``e``æ` 都会附加这一个未标注音标的 `ə` 音 —— 完整舌尖动作的自然结果。

View File

@@ -4,7 +4,7 @@
自然语音从来都是连贯的,所以它从来都不是以词为最基础单位([1.2](02-syllables)),从来都是 “以音节为最基础单位” —— 在这个层面上来看,其实人类所有语言的自然语音都是如此。
> 英文表面上是以词为最基础单位……
> 英文表面上是以词为最基础单位……
>
> 但从连贯的语音上来看,事实上以音节为最基础单位。
@@ -41,7 +41,7 @@
> * *you're* `/jʊ-ar/`,会有 `w` 的加音,但,很轻,需要仔细分辨才听得出来:`/jʊ war/` [2.2.13](25-jw)
> * *going out*`/gəʊɪŋ aʊt/` 中 `ŋ` 说成了 `n`[2.2.3](15-mn)),与后面的音节连起来,`/gəʊwɪ·naʊt/`,这里也有个 `w` 的加音( [2.2.13](25-jw)
> * *with the*`/wɪθ ðə/``θ· ð` 两个相近的辅音叠在一起,前一个只剩下了停顿,`/wɪ·ðə/`[2.2.5.2](17-td#_2-2-5-2-叠音)
> * *got to*`/gɒt tʊ/`,两个 `t` 叠在一起,前一个只剩下了停顿([2.2.5.2](17-td#_2-2-5-2-叠音)),后面的 `to` 被弱读([3.5](34-strong-weak))成了 `/tə/``t` 还是弹舌音([2.2.5.4](17-td#_2-2-5-4-弹舌音) `/gɒ·t̬(ə)/`
> * *got to*`/gɒt tʊ/`,两个 `t` 叠在一起,前一个只剩下了停顿([2.2.5.2](17-td#_2-2-5-2-叠音)),后面的 `to` 被弱读([3.5](34-strong-weak))成了 `/tə/``t` 还是弹舌音([2.2.5.4](17-td#_2-2-5-4-弹舌音) `/gɒ·t̬(ə)/`
> * *something*, 说的是 `/ˈsəmθɪn/`[2.2.3](15-mn)
> * *with him*`h` 被击穿([2.2.8](20-h)),说成了 `/wɪ·θəm/`……

View File

@@ -23,7 +23,7 @@
![](/images/posters.png)
这些电影海报的有趣之处在于那些**大量被忽略掉的细节**。你仔细看看,所有的海报都一样,其中所有 “人物” 的脸都是空的,压根就没画眉毛眼睛鼻子嘴这些一般来说被认为是最重要的细节 —— 可你竟然看一眼就知道人家画的是什么……
这些电影海报的有趣之处在于那些**大量被忽略掉的细节**。你仔细看看,所有的海报都一样,其中所有 “人物” 的脸都是空的,压根就没画眉毛眼睛鼻子嘴这些一般来说被认为是最重要的细节 —— 可你竟然看一眼就知道人家画的是什么……
也就是说,当我们去识别一样东西的时候,不管什么都一样,靠的不是**所有细节**,而是**少数重点**。这是人类的大脑能够迅速完成**模式识别**的关键(我们在 [2.1.1](04-vowel-positions) 提到过 “模式识别”)—— 也就是说,只需要 “少数重点存在”,识别就可以完成。再换言之,别说 “细节准不准确”,哪怕 “很多细节缺失”,在 “少数最重要的重点是否存在并已经识别” 面前,完全无所谓。

View File

@@ -9,7 +9,7 @@
> *Yet, it is a fact of life that an unlettered peasant is considered ignorant.*
>
> <audio controls><source src="/audios/yet-it-is-a-fact-of-life.mp3" type="audio/mpeg">Your browser does not support the audio element.</source></audio>
> <audio controls><source src="/audios/yet-it-is-a-fact-of-life.mp3" type="audio/mpeg">Your browser does not support the audio element.</source></audio>
>
> 以下是这段音频的 *Waveform*(波谱)和 *Pitch Contour*(音高变化):
>
@@ -35,7 +35,7 @@
> * 把 `/ɪs/` 中的 `s` 夸张地拉长,保持气流振动;
> * 然后再抬高声调清楚地读出那个重音音节 `/ˈpe/`
> * 而后顺畅地接着把后面的 `/ʃəlɪ/` 读完……
> * 而后顺畅地接着把后面的 `/ʃəlɪ/` 读完……
再试试 *abstraction* `/æbˈstrækʃən/`:

View File

@@ -14,7 +14,7 @@
> * 最后一个音节是**重音***adapt*, a`→`dapta`↗`dapta`↘`dapt
>
> * 倒数第二个音节是重音:
> * 倒数第二个音节是重音:
>
> * 第一种情况是**重音**用更高**音调** —— 以下用 `↑` 表示音调(*pitch*)的提高:
>
@@ -22,7 +22,7 @@
>
> * *condition*, con`↑`di·tion
>
> 在这种情况下,最后一个音节只能继续轻声读出来……
> 在这种情况下,最后一个音节只能继续轻声读出来……
>
> * 第二种情况是**重音**用**降调**
>
@@ -40,6 +40,6 @@
::: tip
这是很多人学英语从未养成的习惯:
> 在学一个新的英语词汇的时候,要分别用三个声调各自读很多遍……
> 在学一个新的英语词汇的时候,要分别用三个声调各自读很多遍……
:::

View File

@@ -34,7 +34,7 @@
自然语音中,会有大量的常见词汇会被**弱读** —— 尤其是那些最常见的单音节词汇。
各种语言都有这种现象,主要原因可能是因为**太常见**、**太容易理解**、**不可能被误解**、**相对于不那么重要**等等诸如此类的原因,乃至于说话者在说那些**词汇**(或者**音节**)的时候会**更快**或者**更轻**,甚至**合并**或者**省略**。
各种语言都有这种现象,主要原因可能是因为**太常见**、**太容易理解**、**不可能被误解**、**相对于不那么重要**等等诸如此类的原因,乃至于说话者在说那些**词汇**(或者**音节**)的时候会**更快**或者**更轻**,甚至**合并**或者**省略**。
北京人在说 “不知道” 这三个字的时候,有可能说出来的是用拼音都很难标记的 `bù(r)dào`,其中原本应该的 `zhī` 被糊弄成了甚至好像没有韵母的 `r`…… 但,谁都听得懂,哪怕最初不习惯,听个两三次也就适应了。
@@ -107,7 +107,7 @@
> - we: `/wiː/` → `/wi/`
> - were: `/wəː/` → `/wə/`
> - when: `/wen/` → `/wən/`
> - will: `/wɪl/` → `/əl, l`/
> - will: `/wɪl/` → `/əl, l`/
> - would: `/wuːd/` → `/wəd, əd/`
> - you: `/juː/` → `/ju, jə/`

View File

@@ -8,7 +8,7 @@
但,的确有其实可以模仿的 —— **情绪**。紧张、兴奋、疲惫、失望、恐惧、悲伤、快乐、期待,等等等等。就算不能模仿得一模一样,终归能按照自己的方式去表现同样的情绪 —— 瞬间就能做到八九不离十。
用 AI 生成的真人语音,最大的问题在于,它目前还不能做到**情绪饱满**,它只是尽量做到了 “听起来像是真人说话”,虽然已经很好,但就是缺乏情绪表达 —— 它也的确没有什么真正的情绪……
用 AI 生成的真人语音,最大的问题在于,它目前还不能做到**情绪饱满**,它只是尽量做到了 “听起来像是真人说话”,虽然已经很好,但就是缺乏情绪表达 —— 它也的确没有什么真正的情绪……
各种惊悚片动作片都很精彩,很吸引人…… 可实际上它们真的不是最好的学习材料,因为这类影视内容的对话事实上非常枯燥,警匪片里最常重复的,只不过是 *Freeze! Drop your gun!* 要么就是 *You have the right to remain silent*... 战争片里最常重复的更加迷离,反反复复最多的都是 *Get down!* 或者 *Go! Go! Go!* —— 动作太多,语言就只能太少。至于情绪么,往往更多的只有愤怒或者悲伤。