选取男声说话人13人,女声说话人10人,每人60句话。共有句子1380句。
数据大小160M,约1.5小时语音。
采样率16KHZ,量化级别 16位线性,存储格式PCM方式。
CASIA98语音测试库根目录下有23个以f或m开头的文件夹,分别对应23名说话人。其中男声以m开头,女声以f开头,后面跟的字符串为说话人的姓名缩写。
人名目录下包含该录音人所录所有语音文本的文件“STN.TSH”和数据目录STN。录音人的每一个语音数据文件(句子)的对应的录音文本保存在数据目录STN中。
录音文本的格式为一行汉字一行拼音的格式,示例:
选取男声说话人5人,每人4组脚本,每组脚本30句话。共有句子600句。
数据大小73M,约40分钟语音。
CASIA99语音测试库根目录下有20个文件夹,对应5名说话人每人4组录音脚本。5名说话人均为男声。
语料全部选取自863语音库,随机抽取600句作为原始录音文本。