[发明专利]基于语音交互的搜索方法和装置有效
申请号: | 201611019821.5 | 申请日: | 2016-11-17 |
公开(公告)号: | CN106653006B | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 郎文静;李裕东;朱群燕;石远 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 交互 搜索 方法 装置 | ||
1.一种基于语音交互的搜索方法,其特征在于,包括以下步骤:
根据用户提供的用于搜索的语音数据获取第一检索词,并获取为所述第一检索词的上文信息的多个第二检索词;
根据所述第一检索词的第一分词结果和每个第二检索词的第二分词结果生成多种分词组合;
根据每种分词组合的相关性评分,从所述多种分词组合中选择目标分词组合并作为第三检索词;
根据所述第三检索词进行搜索;
所述根据所述第一检索词的第一分词结果和每个第二检索词的第二分词结果生成多种分词组合,包括:
判断历史搜索词中是否存在包含所述第一分词结果和所述第二分词结果的初始分词组合;
若存在所述包含所述第一分词结果和所述第二分词结果的初始分词组合,则将所述初始分词组合作为生成的分词组合。
2.如权利要求1所述的基于语音交互的搜索方法,其特征在于,所述根据所述第一检索词的第一分词结果和每个第二检索词的第二分词结果生成多种分词组合,还包括:
若不存在所述包含所述第一分词结果和所述第二分词结果的初始分词组合,则提取所述第一分词结果中每个第一分词的第一特征信息,并提取所述第二分词结果中每个第二分词的第二特征信息;
根据所述第一特征信息和所述第二特征信息,确定所述第一检索词的类型信息,其中,所述类型信息包括:所述第一检索词为所述第二检索词的补充搜索的第一类型信息、所述第一检索词为所述第二检索词的追问搜索的第二类型信息;
根据所述第一检索词的类型信息将所述第一分词和所述第二分词进行组合处理,得到所述多种分词组合。
3.如权利要求2所述的基于语音交互的搜索方法,其特征在于,所述第一特征信息/所述第二特征信息包括以下至少之一:
所述第一分词/所述第二分词的实体类型、权重、用户历史搜索频次、用户历史搜索后的点击频次、泛口语化的惩罚权重,以及编辑距离。
4.如权利要求1所述的基于语音交互的搜索方法,其特征在于,在所述根据每种分词组合的相关性评分之前,还包括:
确定所述多种分词组合中,每种分词组合在用户搜索历史中的出现频次,以及与所述分词组合对应的第一分词的第一用户历史搜索频次和对应的第二分词的第二用户历史搜索频次;
根据所述出现频次、所述第一用户历史搜索频次,以及所述第二用户历史搜索频次确定所述相关性评分。
5.如权利要求1所述的基于语音交互的搜索方法,其特征在于,所述从所述多种分词组合中选择目标分词组合并作为第三检索词,包括:
从所述多种分词组合中选择所述相关性评分最高的分词组合作为所述目标分词组合,并将所述目标分词组合作为所述第三检索词。
6.如权利要求1所述的基于语音交互的搜索方法,其特征在于,所述根据用户提供的用于搜索的语音数据获取第一检索词,包括:
接收用户提供的用于搜索的语音数据,获取与所述语音数据对应的第一文本,并将所述对应的第一文本作为所述第一检索词。
7.一种基于语音交互的搜索装置,其特征在于,包括:
第一获取模块,用于根据用户提供的用于搜索的语音数据获取第一检索词;
第二获取模块,用于获取为所述第一检索词的上文信息的多个第二检索词;
生成模块,用于根据所述第一检索词的第一分词结果和每个第二检索词的第二分词结果生成多种分词组合;
选择模块,用于根据每种分词组合的相关性评分,从所述多种分词组合中选择目标分词组合并作为第三检索词;
搜索模块,用于根据所述第三检索词进行搜索;
所述生成模块包括:
判断子模块,用于判断历史搜索词中是否存在包含所述第一分词结果和所述第二分词结果的初始分词组合;
第一处理子模块,用于在存在所述包含所述第一分词结果和所述第二分词结果的初始分词组合时,将所述初始分词组合作为生成的分词组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611019821.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机器人的语音处理方法
- 下一篇:刀柄(160311)