体系结构概览
ALTextToSpeech模块由一个API部分、发送至NAOqi的接口命令和TTS合成模块组成。该合成模块嵌入声音处理对象,可以调整音高变化和添加次音。然后,语言混合在一起,发送至音频引擎。
注释: | 本模块仅在机器人上使用。 |
---|
体系结构图:
- 声音合成引擎将文本转化成声音信号。语言生成基于语音包,在下文中简称为“语音”。
注释: RoboCup软件包里只包含了一个语音,名为"Heather22Enhanced"。
- FX模块在主音调整音高变化。可以进行两次,以创造双语音效果。每个模块的参数可以分别定义。
- 混合块叠加两个语音,次音上带有可变增益,主音与次音间存在一个可变延迟。这一延迟可以用来弥补由FX处理造成的主、次音之间的潜伏时间,也可用来作为一个简单的声音效果。
注释: 次音上的可变增益不改变整体语音音量,只改变每个音之间的相对音量。
- 产生的信号发送至机器人系统上的ALSA声音引擎。
使用实例:如果您想让机器人说一句话,您必须调用音频模块中的“Say”方法。字符串在API模块被解析,分成单句。每个单句在合成模块排队。合成模块输出音频帧,必要时,在声音处理对象里进行处理。然后,来自每个语音的帧混合在一起,发送至默认的ALSA输出(两个输出通道)。
Copyright © 2010 Aldebaran-Robotics - 版权所有