一个简单的吴语苏州话语音合成程序

| 分类 技术随笔  | 标签 吴语 

上一篇文章讲到了吴语词典的制作。我发现语音文件是按发音来命名的,并不用每个字都做一个录音,只要读音相同,就可以共用一个发音文件。于是我想能不能用这1000多个音频来做一个语音合成程序。

实现方法是这样的:

利用定时器,一个字一个字读取要朗读的文本,将文字转换成拼音,调用播放器播放音频文件,如果没有音频文件或读取的文本是标点符号,就不播放。

当然,这样的效果是很不好的。我发现了一些问题:

1、音频文件开头结尾有空白。这可以用goldwave批处理删除静音。

2、有多音字的问题。另外,吴语还有比较特别的文白异读现象。吴语的连读变调也是一个问题。

3、其它还有语音语调等问题。

现在又有了基于机器学习的语音合成技术,应该可以比这种拼接音频的方法效果更好。

另外,既然把文字转拼音了,那么利用html5的ruby标签,可以给文字注上吴语拼音,以后练习朗读吃不准音时比较方便。


上一篇     下一篇