[发明专利]语音搜索方法、系统、设备及计算机可读存储介质有效
申请号: | 201910571846.3 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110287364B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 刘庆峰;钟锟 | 申请(专利权)人: | 合肥讯飞读写科技有限公司 |
主分类号: | G06F16/635 | 分类号: | G06F16/635;G06F40/30;G06F40/44 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 荣甜甜;刘芳 |
地址: | 230088 安徽省合肥市高新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 搜索 方法 系统 设备 计算机 可读 存储 介质 | ||
本发明实施例提供一种语音搜索方法、系统、设备及计算机可读存储介质。其中,该方法包括:响应于用户请求进行语音搜索的请求信息,确定相应的录音的转换文本,请求信息携带有搜索参数;基于搜索参数在录音的多个关键信息中进行匹配,得到目标关键信息,多个关键信息是用户在录音的录音过程中记录的,每个关键信息分别具有与录音的时间轴相对应的记录时间;以目标关键信息的记录时间为起点,并沿转换文本的时间轴向前搜索,得到与目标关键信息相匹配的目标文本片段,转换文本的时间轴与录音的时间轴相一致;基于目标文本片段确定相应的目标录音片段。本发明实施例能够精准定位语音片段,提高语音搜索效率。
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种语音搜索方法、系统、设备及计算机可读存储介质。
背景技术
随着语音识别技术的发展,越来越多的信息终端装置,如个人计算机、智能办公本、智能手机等具备了语音识别转换文字的功能,用户可通过该功能获得语音信息相对应的录音和转换文本。但当用户在学习、会议结束后整理录音,核实一些关键点的信息时,需要通过反复听录音,找出录音对应的时间段,这一过程就会耗时太长。如何在长段语音中快速、准确地定位阐述关键词对应的语音片段及转换文本是语音识别技术中需要解决的问题。
发明内容
本发明实施例提供一种语音搜索方法、系统、设备及计算机可读存储介质,以精准定位语音中的语音片段。
第一方面,本发明实施例提供一种语音搜索方法,包括:响应于用户请求进行语音搜索的请求信息,确定相应的录音的转换文本,所述请求信息携带有搜索参数;基于所述搜索参数在所述录音的多个关键信息中进行匹配,得到目标关键信息,所述多个关键信息是所述用户在所述录音的录音过程中记录的,每个所述关键信息分别具有与所述录音的时间轴相对应的记录时间;以所述目标关键信息的记录时间为起点,并沿所述转换文本的时间轴向前搜索,得到与所述目标关键信息相匹配的目标文本片段,所述转换文本的时间轴与所述录音的时间轴相一致;基于所述目标文本片段确定相应的目标录音片段。
可选的,以所述目标关键信息的记录时间为起点,并沿所述转换文本的时间轴向前搜索,得到与所述目标关键信息相匹配的目标文本片段,包括:以所述目标关键信息的记录时间为起点,沿所述转换文本的时间轴向前进行基于语义的模糊搜索,得到与所述目标关键信息相关的多个句子;在所述多个句子中,确定与所述目标关键信息的语义的相关度最高的句子,作为目标句子;将所述目标句子的起始时刻至所述目标关键信息的记录时刻之间的句子作为目标文本片段。
可选的,所述请求信息是所述用户通过语音方式或文字方式输入的字、词语、句子或文本;所述关键信息是所述用户通过语音方式或文字方式输入的字、词语或句子或文本。
可选的,所述响应于用户请求进行语音搜索的请求信息,确定相应的录音的转换文本,包括:
计算每个所述词语的居间度密度,得到每个所述词语的语义贡献值;
计算每个所述词语的统计特征值;基于多个所述词语的所述语义贡献值与所述统计特征值的加权值,确定所述请求信息中的所述关键词,作为所述搜索参数;基于所述搜索参数确定相应的录音的转换文本。
可选的,所述基于所述目标文本片段确定相应的目标录音片段之后,所述方法还包括:播放所述目标录音片段,并将所述目标文本片段以不同于所述录音的转换文本中其他文本内容的显示方式进行显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥讯飞读写科技有限公司,未经合肥讯飞读写科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910571846.3/2.html,转载请声明来源钻瓜专利网。