Kaldi的Phones文件夹下面的文件介绍

Kaldi的Phones文件夹下面的文件介绍

里面共有三种格式 csl, int, txt ,其实内容都是一样的,

align_lexicon
表示对齐文件,是由lexiconp.txt的第一列第三列提取出来生成

context_indep
非正常音素集合,包含(静音(SIL),口语噪声(SPN),非口语噪声(NSN)和笑声(LAU)

silence
静音音素

nonsilence
正常音素 可以认为和上面的silence是互斥的,两个文件音素的合集可以认为是整个音素集

sets
包含了一些列的音素集,在聚类音素时被分组,以建立相关的问题集(决策树的决策条件)

extra_question
包含了自动生成以外的问题

disambig
文件里面包含的是消歧符号 ,这些消歧符号在phones.txt中当作音素使用

word_boundary
音素和词位的关联信息,建立这种对应关系是需要这些信息在音素网络中恢复词的边界

roots
建立音素上下文决策树信息,里面的shared 表示共享根,一般语气和语调会在同一行,认为共享

    分享到:

留言

你的邮箱是保密的 必填的信息用*表示