文章摘要
郑铁然,韩纪庆.基于后验概率的汉语语音检索方法研究[J].高技术通讯(中文),2009,19(2):119~124
基于后验概率的汉语语音检索方法研究
  
DOI:
中文关键词: 汉语语音检索, 音节lattice, 后验概率, 检索模型, 邻接矩阵
英文关键词: 
基金项目:
作者单位
郑铁然 哈尔滨工业大学计算机科学与技术学院 
韩纪庆 哈尔滨工业大学计算机科学与技术学院 
摘要点击次数: 2599
全文下载次数: 2104
中文摘要:
      针对经典的向量空间检索模型直接用于基于音节lattice形式的汉语语音检索存在无法有效区分lattice中包含的正确音节识别候选和错误的识别候选以及不能充分利用lattice中所蕴含的各层级信息的不足,提出了一种基于语音文档邻接音节后验概率矩阵的检索方法。该方法以该矩阵作为文档索引,并计算查询请求被包含在语音文档中的后验概率,并以此来度量查询请求和语音文档间的相关度。后验概率作为可靠的置信测度能够有效区分正确和错误的音节候选,在lattice中后验概率的计算能够充分地利用语音识别结果中的多层级的信息。语音检索实验表明,与基于向量空间模型的检索方法相比,该方法的检索性能有显著提高,是一种适用于汉语语音检索的有效方法。
英文摘要:
      
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮