Files
xuesheng/content/posts/517-2024.07.24.多维竞争力的一个实例.md
2025-07-10 15:45:00 +08:00

14 KiB
Raw Permalink Blame History

+++ date = '2024-07-25T01:37:45.948Z' draft = false title = '517-2024.07.24.多维竞争力的一个实例' +++

6127d421-03fe-4124-91e8-c92a669bf022.mp3

今天早上起来之后呢嗯一直到现在哦算是干了一个大活。 什么呢? 就是把我们的重塑语音教程做了一个呃重要的更新。 就是在每个因素的详解部分啊,增加了呃拼读规则。

0d8e33fc-2304-4eef-8ed4-3e8ab134f155.jpg

eacb69cc-da4f-4475-83e1-87be72a9b059.mp3

当然了啊大家去翻的时候呢,只是看到啊一些单词啊和音标。 可实际上呢这个东西挺不好写的。 因为你要写的是这个HTML然后呢字体要对音标要对。 然后呢呃声音文件啊,要对啊不能错开,不能串位啊嗯完全是没有办法用手写的东西,其实呢都得这个啊写程序代码,就写个程序片段,然后呢啊让他去处理啊这些列表,然后才能做到说啊音标一定是对的啊,声音文件一定是对的啊,词汇和音标以及声音文件的对应也一定是对的 。

bd17bdf6-87fd-40b8-ae4c-fe4b3dd26af7.mp3

最初整理的文本文件长成这个样子。

f18c4e99-029a-43e5-bebe-33c0767cdb8e.jpg

5d73817a-9361-4b3c-ae27-33c2c82f7814.mp3

嗯,处理他们的程序呢啊片段呢大概长成这个样子。

a5ad198b-d8c2-4435-8793-6bcee2aab650.jpg

a8085543-6595-42f1-a232-98245684f5c8.mp3

那篇文章里呢我提到说哈其实呢我们一天下来呢哈大概要呃每天说大概是7000到2万个字对吧 然后呢平均来看每个人哈每天说16000。

fc64ca8e-1d48-42e9-bb00-5d69965693c0.jpg

f5063532-8245-437e-a01d-dfe486d709db.mp3

然后呢还得啊通过这个这个代码呢,把那些历词啊的声音文件生成,对吧? 啊我使用的是那个呃微软的HTTS。

22d5d366-98a4-4e20-a0ba-e60afe55cd4c.jpg

cf651118-0623-42cc-b3c0-a9c029dc01ab.mp3

今天的更新很大哈,嗯一整天折腾完了之后呢,发现说哈嗯总计生成了呃七八百个生意文件吧。

https://mp.weixin.qq.com/s/DLJDlztgj-zhDEh1sT8T5A

0d4f0d85-52c0-41f1-9832-42d97b73f761.mp3

在这个过程当中呢,我还顺手解决了另外一个问题。 呃,大家还记得前两天哈,我在这个微信公众账号上发的一篇文章,从语言学习关键期开始说起。

127b842b-7451-4f60-b672-ac151611e867.mp3

那篇文章里呢我提到说哈其实呢我们一天下来呢哈大概要呃每天说大概是7000到2万个词对吧 然后呢平均来看每个人哈每天说16000个词那就相当于说差不多2400个音节。 那英文当中实际上哈有15个音节那么就意味着说呃每天呢每个音节都可能被重复说1600遍啊平均来看对吧

310f6636-4555-405f-9ad8-6a31495c7372.mp3

好了,当时写那篇文章的时候呢,我为什么用这个这个呃元音和辅音啊? 啊有另外一个问题我解决不了什么呢? 就是其实呢我想计算的是叫独特音节数量啊独特音节数量啊比如说中文呢就是有这个语言学家做过统计的啊中文的独特音节大概是420个对吧 像比如说哈啊这个啊不是所有的元音不是所有的声母和韵母都是可以连起来的。 比如说在中文的普通话当中啊在中文的普通话当中就没有BBB这个B这个音啊也没有表这个音也没有变m这个音对吧 所以呢别看有那么多声母成以那么多韵母,到最后呢,其实实际组合数量并没有那么多。

袁家骅先生的《汉语语音学》1989 商务印书馆)

d1a935e1-0d88-4f12-8fdd-c4e2ca55a1f0.mp3

那么中文的哈独特音节数量哈大概是多少个呢? 嗯我找了很久的资料后来找到了啊这个袁家华先生呢哈在1989年通过商务印书馆呢啊出版了一本书叫做汉语与音学。 在这本书里呢我找到了具体的数字哈就是根据他的统计呢普通话的独特音节大约有420个。 。

中文 420 个

fd8431e7-2ffc-4a20-87d9-7a4442d16608.mp3

那英文有多少呢? 英文就特别难以统计哈,别看他有时有这个呃原音和辅音的分别,但是它的这个音节构成特别复杂,对吧? 啊最前面呢可能有2到3个辅音后面呢最多的有三四个辅音啊中间夹着一个原音所以呢很难统计。 然后我去问了这个啊chaGPT他给我的答案很令我崩溃。

The number of unique syllables in American English can be challenging to pinpoint exactly due to the complexity and variability of the language. However, it is generally estimated that there are around 15,000 to 16,000 unique syllables in American English. This estimation takes into account the various combinations of consonants, vowels, and diphthongs, as well as stress patterns and phonological rules.

These syllables are formed by combining:

1.	Vowels and Diphthongs: There are about 15 vowel sounds in American English, including diphthongs.
2.	Consonants: There are about 24 consonant sounds.
3.	Stress Patterns: The placement of stress can create different syllables.

Combining these elements in various ways leads to a large number of unique syllables used in everyday speech.

183810f9-9017-47ee-a9bd-4eb77204ebd5.mp3

我反复换了好几个pro去问他啊想办法让他这个去搜索一些啊论文文献什么的。 但是呢最终呢嗯并没有得到我想要的答案啊,都是几千个啊,甚至上万个。 那我就觉得这肯定比与直觉不相符嘛。 。

2cce9aad-b3c0-42a8-a930-bf3f006f0586.jpg

8a209d91-ec5c-45c4-816a-009267c5772d.mp3

结果今天在干活的时候啊,突然想到一个哈可行的特别简单的算法。 啊,幸亏我也会什么政策表达式什么的对。

英文中,独特音节数量,约为 411 个。

23cae366-9e02-4bf4-9072-37a98a206dfd.mp3

嗯,这个数字的获得哈其实令我非常非常的开心。 嗯,因为这个是困惑了我很久的这个这个一个小问题,对吧? 但这个小问题呢你没搞清楚,就很烦人对? 那最终呢哎竟然得到了一个数字,然后呢啊统计结果是这样。 然后呢就比袁家发先生所统计的中文的独特音阶数量420个还少一点点。 所以从语音的角度来看哈,其实中文和英文的难度是差不多的对吧? 当然从语音的角度来看,地球上可能最简单的文字是日文对吧? 日文的50音图其实不到50个啊独特音阶数量不到50个。 。

a5ee3c9b-de61-4eaf-b05b-e8c431754ba9.mp3

以后我讲语音课哈,大家就知道了啊,这个数字的获得啊其实是一个很很很很重要的证据,就是什么呢? 就是岁数多大啊,你想认真学,你也能去除你的口音,或者是极大程度上去除你的口音,到最后能不能并不是有没有可能性,而是你自己愿不愿意,然后你自己的功夫有没有用到,。

48898336-56ef-4144-9240-3f1174d83eec.mp3

这不仅是一个证据哈,这是一个非常严谨的学术证据,你知道吗? 啊,所以这个啊在过程当中哈突然解决了这么一个小问题,然后开心的要死。

023ece9d-cb82-41cb-b871-c43742040c28.mp3

那为什么给大家讲这么一个事情呢? 一个呢是敦促大家哈那个呃重塑语音的教材啊,有更新,你应该去看了。 反正你要看很多很多遍。 啊,但是更为重要是说,大家还记得吗? 好几年前好多年前,我在这个呃通往财富自由之路里,曾经给大家讲过一个概念,叫做多维竞争力。 啊今天给大家讲的哈,其实就是一个多维竞争力的实战案例嘛。 。

多维竞争力

befba606-f3f6-43d6-b215-24c14fccd6d7.mp3

其实呢大家仔细看一看哈,我这半年折腾的这件小事情,对吧? 其实不就是个英文的语音教材嘛啊,如果打印出来的话,应该是很薄的一个小册子,对吧? 当然了以后会扩展扩展为很多的课程哈,这是以后的事情。 但是他的最最最最基础的基石,就是那么几十页的小册子,但就是这么几十页的小册子,说句实话,如果嗯我仅仅是一个英语老师的话,就可能写不出来,或者是说肯定写不出来,对吧? 那我爹就是精通好几国语言的人,然后呢,他也是做了一辈子的英语老师啊,这个退休之前呢是延边学院嗯外语系的系主任啊,英语教授。

3275098c-afbe-4d8e-866f-8eb418c19235.mp3

所以我爹的语言功底呢肯定比我强无数倍。 对吧? 但是呢我今天写的这个语言教材啊,语音教材对吧? 啊,不是我得去世了,我才这么说,就是他在使我也可以跟他说,你就是写不出来的,你不可能的,为什么? 因为有大量东西你做不当,对啊? 他不会编程他不会统计他不会用AI对吧 然后呢,他啊你要知道程序员里面也有相当一部分或者是很大一个比例的人,压根就不会使用正则表达式,虽然这应该是基础的基础,。

49d036f1-bb37-4606-862a-bdc92e57dd48.mp3

那你想啊2019年哈1月初啊我开始写自学十门手艺的时候啊生生的把这个pyython啊从头至尾哈这个这个这个系统的学了一遍在这个过程当中呢生逼着自己把那么多年来哈拖拖拖拖延延一直学不会的正则表达式啊从头到尾哈从里到外哈认真的研究了一遍那谁能想到啊突然许多年之后某一天人工智能出现的时候啊会用python是一个特别重要的事情对吧 然后呢,谁能想到啊,我竟然又又又开始写英文教材,这个时候突然发现说哎呀,幸亏我会正则表达式啊,不然的话连例子都找不着。

69a5f70f-9595-4a70-968d-14ed26d198cd.mp3

所以呢因为同时会多个领域里的东西,所以能做各个领域当中绝大多数人单独做不出来的事情。 呃这是非常重要的一个竞争力的表现。 对那我想哈你也可能全中国找不到第二个英语老师啊能像我这样有一天哈突然想教这个语音啊自己想练语音然后呢就可以哈现学哈在这个AI的辅助下啊现学现卖写了一个这个啊TOBI playerer就是今天大家用的injoy最初的啊proto就是最初的原型 。 然后呢呃呃呃这个自己用着然后交给程序员继续去完善变成了今天的injoy。

d8ab74c7-b800-4f2b-85f2-0334d9005961.mp3

嗯,别看哈,我写语音教程不怎么赚钱,我也不指望他赚钱。 对,但是呢他是一个对我个人来说哈,非常嗯开心的成就,它不叫了不起的成就是非常开心的成就。 其原因在于说我这么多年啊学的东西啊,嗯既然都用得上。 对呀? 然后呢啊他也会错筋磨哈,学一些啊有的没有的东西,对吧? 谁知道什么时候有用呢? 。 😊

f90fae95-ad12-4efc-817b-0fed6ee2d0aa.mp3

好了,这就是跟大家哈分享一下今天我的工作的喜悦。 与此同时呢啊今天我做的这些事情呢,某种意义上也是我曾经讲过的一个重要概念的实力,叫做多维竞争力啊,所以呢大家在学东西的时候啊啊切记哈不要问学它有什么用,对吧? 而是说哎不一定有什么用呢? 早晚他就有用啊,这个也是我在把时间当做朋友里哈,反复向大家分享的观念。 好,我们下次分享再见。