程序说明书索引 >> 红色说明书索引

>音频系统

引言

ALAudio Player (音频播放器)

ALTextToSpeech (声音合成)

ALSpeechRecognition (语音识别)

ALAudioDevice (音频器件)

ALSoundDetection(声音识别)

ALAudioSourceLocalization(音频源定位)

体系结构概览

ALTextToSpeech模块由一个API部分、发送至NAOqi的接口命令和TTS合成模块组成。该合成模块嵌入声音处理对象,可以调整音高变化和添加次音。然后,语言混合在一起,发送至音频引擎。

注释:

本模块仅在机器人上使用。

体系结构图:

architecture diagram

  • 声音合成引擎将文本转化成声音信号。语言生成基于语音包,在下文中简称为“语音”。
    注释:

    RoboCup软件包里只包含了一个语音,名为"Heather22Enhanced"。

  • FX模块在主音调整音高变化。可以进行两次,以创造双语音效果。每个模块的参数可以分别定义。
  • 混合块叠加两个语音,次音上带有可变增益,主音与次音间存在一个可变延迟。这一延迟可以用来弥补由FX处理造成的主、次音之间的潜伏时间,也可用来作为一个简单的声音效果。
    注释:

    次音上的可变增益不改变整体语音音量,只改变每个音之间的相对音量。

  • 产生的信号发送至机器人系统上的ALSA声音引擎。

使用实例:如果您想让机器人说一句话,您必须调用音频模块中的“Say”方法。字符串在API模块被解析,分成单句。每个单句在合成模块排队。合成模块输出音频帧,必要时,在声音处理对象里进行处理。然后,来自每个语音的帧混合在一起,发送至默认的ALSA输出(两个输出通道)。





Copyright © 2010 Aldebaran-Robotics - 版权所有