fix some errors in markdown.
This commit is contained in:
@@ -2,7 +2,7 @@
|
||||
|
||||
虽然 “生学硬练” 最靠谱,但,我们也不是不重视 “方法” 或者 “策略” —— 只不过,无论做什么,总得有个优先顺序;所以,“最重要的最先关注”,只不过是个既自然且又合理的选择。
|
||||
|
||||
在过去的若干年里,人工智能辅助的语音合成迅猛发展,今天的 TTS(Text to Speech)已经完善到令人震惊的地步 —— 比如微软的 Natural Sound,或者 Suno-AI 的 Bark。这背后,是一个叫做 “[ToBI](https://en.wikipedia.org/wiki/ToBI)”(Tones and Breaks Indices 的缩写)的语音解析模型,最初的时候是计算机科学家们为了研究如何让机器能够发出像真人一样的声音而制作的模型,最初是针对美式英语设计的,后来发现可以应用到任何语言(无论是英式英语,还是日语、德语、甚至中文)……
|
||||
在过去的若干年里,人工智能辅助的语音合成迅猛发展,今天的 TTS(Text to Speech)已经完善到令人震惊的地步 —— 比如微软的 Natural Sound,或者 Suno-AI 的 Bark。这背后,是一个叫做 “[ToBI](https://en.wikipedia.org/wiki/ToBI)”(Tones and Breaks Indices 的缩写)的语音解析模型,最初的时候是计算机科学家们为了研究如何让机器能够发出像真人一样的声音而制作的模型,最初是针对美式英语设计的,后来发现可以应用到任何语言(无论是英式英语,还是日语、德语、甚至中文)……
|
||||
|
||||
这里的 *Tones*,即,所谓的 “**语调**”,主要是 “**音高**”(Pitch)的变化,从一个较高的 “音高” 逐步下来,那就是 “降调”,或者反过来,就是 “升调”,降下来再升上去,那就是所谓的 “降升调”。而所谓的 *Breaks*,就直观了,句子之中,就是有些明显的 “**停顿**” —— 其实,每个音节之间都可能有所停顿,只不过是长短不一而已。
|
||||
|
||||
|
||||
Reference in New Issue
Block a user