[发明专利]语音搜索方法和装置、电子设备、计算机可读介质在审

申请号：	202110586407.7	申请日：	2021-05-27
公开（公告）号：	CN113326279A	公开（公告）日：	2021-08-31
发明（设计）人：	刘嵘;李坚涛;贺学焱	申请（专利权）人：	阿波罗智联（北京）科技有限公司
主分类号：	G06F16/24	分类号：	G06F16/24;G10L15/22
代理公司：	北京英赛嘉华知识产权代理有限责任公司 11204	代理人：	王达佐;马晓亚
地址：	100176 北京市大兴区经济***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音搜索方法装置电子设备计算机可读介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了一种语音搜索方法和装置，涉及车联网、智能座舱、语音识别等技术领域。具体实现方案为：获取语音数据；对语音数据进行识别，得到对应的文本数据；基于文本数据和预设的待匹配数据集，得到混合匹配数据集；基于待匹配数据集，对混合匹配数据集进行筛选，得到与语音数据对应的搜索结果集。该实施方式提高了语音搜索的全面性。

技术领域

本公开涉及数据处理技术领域，具体涉及车联网、智能座舱、语音识别等技术领域，尤其涉及一种语音搜索方法和装置、电子设备、计算机可读介质以及计算机程序产品。

背景技术

在终端通话场景下，如果用户发音具有缺陷(如l/r部分、前后鼻音不分等)，在对语音进行联系人搜索，得到联系人搜索结果之后，如果仅按照姓名的拼音的先后顺序进行排序，容易出现搜索结果排序结果混乱的问题。

发明内容

提供了一种语音搜索方法和装置、电子设备、计算机可读介质以及计算机程序产品。

根据第一方面，提供了一种语音搜索方法，该方法包括：获取语音数据；对语音数据进行识别，得到对应的文本数据；基于文本数据和预设的待匹配数据集，得到混合匹配数据集；基于待匹配数据集，对混合匹配数据集进行筛选，得到与语音数据对应的搜索结果集。

根据第二方面，提供了一种语音搜索装置，该装置包括：采集单元，被配置成获取语音数据；识别单元，被配置成对语音数据进行识别，得到对应的文本数据；匹配单元，被配置成基于文本数据和预设的待匹配数据集，得到混合匹配数据集；处理单元，被配置成基于待匹配数据集，对混合匹配数据集进行筛选，得到与语音数据对应的搜索结果集。

根据第三方面，提供了一种电子设备，该电子设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器，其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行如第一方面任一实现方式描述的方法。

根据第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行如第一方面任一实现方式描述的方法。

根据第五方面，提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现如第一方面任一实现方式描述的方法。

本公开的实施例提供的语音搜索方法和装置，首先，获取语音数据；其次，对语音数据进行识别，得到对应的文本数据；再次，基于文本数据和预设的待匹配数据集，得到混合匹配数据集；最后，基于待匹配数据集，对混合匹配数据集进行筛选，得到与语音数据对应的搜索结果集。由此，基于文本数据和预设的待匹配数据集，得到的混合匹配数据集，较全面的扩充了与文本数据的相匹配的混合匹配数据，进一步将混合匹配数据进行了与待匹配数据集相适配的更加合理的筛选，使语音数据搜索结果更加准确，提高了用户进行语音搜索的体验。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开语音搜索方法的一个实施例的流程图；

图2是根据本公开得到混合匹配数据集的方法的流程图；

图3是根据本公开得到与语音数据对应的搜索结果集的方法的流程图；

图4是根据本公开得到搜索数据集的方法的流程图；

图5是根据本公开语音搜索装置的实施例的结构示意图；

图6是用来实现本公开实施例的语音搜索方法的电子设备的框图。

具体实施方式

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载