[发明专利]一种语音搜索方法、装置、电子设备及存储介质在审
申请号: | 201811458192.5 | 申请日: | 2018-11-30 |
公开(公告)号: | CN111259170A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 薄琳 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06F16/383 | 分类号: | G06F16/383;G06F16/33 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 邓超 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 搜索 方法 装置 电子设备 存储 介质 | ||
本申请涉及语音搜索技术领域,尤其涉及一种语音搜索方法,包括:获取参考文本集;针对参考文本集中的每个参考文本,基于该参考文本对应的语言种类,对参考文本进行处理,得到候选搜索文本库;在确定目标语音对应的语音识别文本后,从所有候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库,并根据查找到的候选搜索文本库确定与目标语音对应的参考文本。采用上述方法,基于语言种类进行语音识别文本的处理提高了目标语音识别的包容度,基于匹配度确定搜索结果又进一步提升了目标语音搜索的准确度,从而提升了用户的使用体验。本申请还提供了一种语音搜索装置、电子设备及存储介质。
技术领域
本申请涉及语音搜索技术领域,具体而言,涉及一种语音搜索方法、装置、电子设备及存储介质。
背景技术
随着移动终端技术的飞速发展,移动终端所具备的功能也越来越丰富,如在手机等移动终端上应用十分广泛的语音搜索功能。用户通过语音搜索功能可以搜索包括天气、地图、音乐、联系人等各种类型的数据。
现有的语音搜索方法,通常是基于对用户的语音内容的识别结果来进行的,也即,在识别出用户的语音内容后,搜索引擎可以为用户提供与上述语音内容相匹配的搜索内容。以音乐搜索为例,当用户对着移动终端说出:“我想听××歌曲”时,希望该歌曲能够很快被识别并播放。
然而,利用现有语音识别技术识别语音内容时,往往无法避免各种语音环境所可能带来的噪声影响,导致语音识别的准确度较差,这将进一步导致返回的搜索内容不准确,甚至是无法返回相应的搜索内容,用户的使用体验度较差。
可见,需要一种能够准确推送用户所要搜索的内容的技术方案。
发明内容
有鉴于此,本申请实施例的目的在于提供一种语音搜索方法、装置、电子设备及存储介质,能够提高语音搜索的准确度,提升用户的使用体验。
主要包括以下几个方面:
第一方面,本申请实施例提供了一种语音搜索方法,所述方法包括:
获取参考文本集;
针对所述参考文本集中的每个参考文本,基于该参考文本对应的语言种类,对所述参考文本进行处理,得到候选搜索文本库;
在确定目标语音对应的语音识别文本后,从所有候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库,并根据查找到的候选搜索文本库确定与所述目标语音对应的参考文本。
在一些实施例中,所述参考文本包括至少一个汉字,所述至少一个汉字对应的语言种类为汉语类别;基于所述参考文本对应的语言种类,对所述参考文本进行处理,包括:
依次从所述参考文本中提取出各个汉字;
将提取的任意多个汉字进行顺序组合,得到各个汉字组;
将每个所述汉字、以及所述汉字组分别作为处理后的一个候选搜索文本。
在一些实施例中,所述参考文本包括至少一个拼音,所述至少一个拼音对应的语言种类为汉语类别;基于所述参考文本对应的语言种类,对所述参考文本进行处理,包括:
依次从所述参考文本中提取出各个拼音,并确定每个拼音对应的声母部和韵母部;
将提取的任意多个拼音进行顺序组合,得到各个拼音组;
针对任意两个拼音,确定一个拼音的声母部与另一个拼音的声母部组合后的声母组,以及确定一个拼音的韵母部与另一个拼音的韵母部组合后的韵母组;
将每个所述拼音、所述拼音组、以及所述声母组和所述韵母组分别作为处理后的一个候选搜索文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811458192.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种地图围栏显示方法及装置
- 下一篇:一种变速箱装配用固定装置