@runsql
看的出,只有几页纸,包含一些导航以外的语音信息,如节日出行提醒等。这应当就是比默认语音数据量大的原因。
志玲的语音分为两部分:导航语音部分应该采用通用的、很完善波型合成技术,将元音、辅音及音调等采样,通过算法实现文语转换;这一部分要录入的内容很少,很可能是含有个人语音特征的一些基础发音。
而比较人性化的特殊提醒,时间总长在5分钟到20分钟左右,依照一般语速计,录制内容最多不会超过5000字,视频中录音稿只有几页纸,可以佐证这一点。
志玲的语音分为两部分:导航语音部分应该采用通用的、很完善波型合成技术,将元音、辅音及音调等采样,通过算法实现文语转换;这一部分要录入的内容很少,很可能是含有个人语音特征的一些基础发音。
而比较人性化的特殊提醒,时间总长在5分钟到20分钟左右,依照一般语速计,录制内容最多不会超过5000字,视频中录音稿只有几页纸,可以佐证这一点。