[发明专利]检索语音文件的设备和方法无效
申请号: | 200910176846.X | 申请日: | 2009-09-22 |
公开(公告)号: | CN102023994A | 公开(公告)日: | 2011-04-20 |
发明(设计)人: | 鲁耀杰;尹悦燕;史达飞;郑继川;赵利军 | 申请(专利权)人: | 株式会社理光 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 黄小临 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 语音 文件 设备 方法 | ||
技术领域
本发明涉及一种用于检索语音文件的设备和方法,具体地说,本发明涉及根据输入的查询条件检索语音文件、从而得到语音文件的各时间点与查询条件的相关度的设备和方法。
背景技术
随着多媒体技术的发展,语音媒体得到了越来越多的关注。由于语音本身的特点,用户很难像检索文本一样快速检索语音文件。当用户想在语音文件中查询自己感兴趣的相关语音片段的时候,用户不得不从头开始浏览整个语音文件。在语音文件较大的情况下,这是非常耗费时间和精力的。虽然语音播放器中的快进和快退按钮能帮助用户相对较快地浏览文件,但是其并不能为用户提供语音文件中的各时间点与所查询的条件的相关程度,更加不能查询到与查询条件相关的语音段落。
通常,存在两种方法来在语音文件中检索与用户输入的查询条件相关的时间点。第一种方法是基于关键字标注的方法,其基于语音识别技术,将语音文件转换为文本,并标注转换后的文本中与用户输入的文本查询条件相关的文本。然而,该方法存在下述不足之处:1.该方法基于语音识别技术,仅仅进行一次相关度计算,因此检索性能受语音识别的效果影响相对较大,容错性能较差;2.当文本查询条件不是关键字而是句子甚至段落时,该方法的效率大大下降;3.该方法仅针对文本查询条件进行查询,使用范围受到限制。
第二种方法是基于语义分割的方法,其利用语音分割技术,按照语义分割语音文件,然后利用语音检索的方法检索分割好的片断与预定查询条件的相关程度。然而,由于当今的语义分割技术尚不够成熟,错误率较高,因此在此基础上进行一次相关度计算而获得的检索结果的错误率也非常高。
发明内容
本发明提供了一种用于检索语音文件的设备和方法,其能够根据用户输入的多种查询条件检索语音文件,并以较高精度得到语音文件的各时间点与查询条件的相关度,从而改进了检索效率。进一步说,本发明还提供一种用于检索语音文件的设备和方法,其不但能够以较高精度得到语音文件的各时间点与查询条件的相关度,还能够得到语音文件中与所述查询条件相关的语音段落,从而在改进检索效率的同时还提高了用户操作的方便度。
根据本发明的一个方面,一种用于根据输入的查询条件检索语音文件的设备,包括以下装置:分割装置,被配置为将一个或多个语音文件分别分割为一个或多个语音片;第一相关度确定装置,被配置为确定每个语音片与所述查询条件的第一相关度;以及第二相关度确定装置,被配置为根据所述第一相关度,确定每个语音文件的每个预定时间点与所述查询条件的第二相关度。
根据本发明的另一方面,一种用于根据输入的查询条件检索语音文件的方法,包括以下步骤:分割步骤,用于将一个或多个语音文件分别分割为一个或多个语音片;第一相关度确定步骤,用于确定每个语音片与所述查询条件的第一相关度;以及第二相关度确定步骤,用于根据所述第一相关度,确定每个语音文件的每个预定时间点与所述查询条件的第二相关度。
根据本发明各方面的设备和方法能够以较高精度得到语音文件的各时间点与输入的查询条件的相关度,从而改进了检索效率。
通过参考附图阅读下面以示例性方式给出的本发明实施例的具体描述,本发明的上述和其他目标、特征和优点将变得更加明显。
附图说明
图1示意性示出了根据本发明第一实施例的语音文件检索设备100的框图;
图2示意性示出了由本发明第一实施例的语音文件检索设备100使用的窗函数的波形特征;
图3示意性示出了根据本发明第二实施例的语音文件检索设备200的框图;
图4示意性示出了由根据本发明第一实施例的语音文件检索设备100执行的处理的流程图;
图5示意性示出了由根据本发明第二实施例的语音文件检索设备200执行的处理的流程图;以及
图6示意性示出了由根据本发明第二实施例的语音文件检索设备200执行的处理中的段落发现处理的流程图。
具体实施方式
在具体描述本发明实施例前,首先说明在本发明实施例中使用的相关技术术语:
“语音片”:语音片是将一语音文件分割而得到的各个片段。相邻语音片之间在时间上可以重叠。所有语音片构成的集合将涵盖该语音文件。
“语音段落”:语音段落是语音文件的任一部分。在本发明实施例中,与查询条件相关的语音段落的长度可以大于语音片的长度、等于语音片的长度,也可以小于语音片的长度。
以下,将参照附图详细描述本发明的优选实施例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910176846.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汤圆
- 下一篇:用于在令牌与验证器之间进行认证的网络助手