[发明专利]语音文件检索方法及系统有效
申请号: | 201510882391.9 | 申请日: | 2015-11-30 |
公开(公告)号: | CN105551485B | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 王建社;柳林;冯翔;胡国平 | 申请(专利权)人: | 讯飞智元信息科技有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/16;G06F16/683;G06F16/33 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 刘路尧;逢京喜 |
地址: | 230088 安徽省合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语音文件检索方法及系统,该方法包括:训练对应检索关键词的用户兴趣模型;获取待检索的各语音文件;对所述语音文件进行语音转写,得到转写结果;根据所述转写结果获得所述语音文件对应的文本文件及所述文本文件中各词的多知识源特征;利用所述多知识源特征对各词进行置信度重估,并滤除所述文本文件中无意义的词句;根据置信度重估结果计算各文本文件与所述用户兴趣模型的相关度;根据所述相关度展示检索出的语音文件。利用本发明,可以提高语音文件检索效率及准确性。 | ||
搜索关键词: | 语音 文件 检索 方法 系统 | ||
【主权项】:
一种语音文件检索方法,其特征在于,包括:训练对应检索关键词的用户兴趣模型;获取待检索的各语音文件;对所述语音文件进行语音转写,得到转写结果;根据所述转写结果获得所述语音文件对应的文本文件及所述文本文件中各词的多知识源特征;利用所述多知识源特征对各词进行置信度重估,并滤除所述文本文件中无意义的词句;根据置信度重估结果计算各文本文件与所述用户兴趣模型的相关度;根据所述相关度展示检索出的语音文件信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司,未经讯飞智元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510882391.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种160℃电机引流电缆
- 下一篇:语音数据的韵律标注方法及装置