选取男声说话人13人,女声说话人10人,每人60句话。共有句子1380句。

数据大小160M,约1.5小时语音。

采样率16KHZ,量化级别 16位线性,存储格式PCM方式。

CASIA98语音测试库根目录下有23个以f或m开头的文件夹,分别对应23名说话人。其中男声以m开头,女声以f开头,后面跟的字符串为说话人的姓名缩写。

人名目录下包含该录音人所录所有语音文本的文件“STN.TSH”和数据目录STN。录音人的每一个语音数据文件(句子)的对应的录音文本保存在数据目录STN中。

录音文本的格式为一行汉字一行拼音的格式,示例:

选取男声说话人5人,每人4组脚本,每组脚本30句话。共有句子600句。

数据大小73M,约40分钟语音。

CASIA99语音测试库根目录下有20个文件夹,对应5名说话人每人4组录音脚本。5名说话人均为男声。

语料全部选取自863语音库,随机抽取600句作为原始录音文本。