[发明专利]查询内容自动补全的方法及装置有效

专利信息
申请号: 202210058334.9 申请日: 2022-01-19
公开(公告)号: CN114090722B 公开(公告)日: 2022-04-22
发明(设计)人: 田有朋;李俊;黄亚东;王小卫 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06F16/31 分类号: G06F16/31;G06F16/33;G06F40/14;G06F40/242;G06F40/279
代理公司: 北京亿腾知识产权代理事务所(普通合伙) 11309 代理人: 陈霁;周良玉
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 查询 内容 自动 方法 装置
【权利要求书】:

1.一种查询内容自动补全的方法,包括:

获取用户当前输入的针对目标数据的自然语言查询内容;

对所述自然语言查询内容进行切分,得到若干查询词;

将所述若干查询词作为当前查询词,查询对应于不同实体类别的若干词典树,以获取各查询词的对应于多个实体类别的各候选词;所述若干词典树根据针对所述目标数据的数据查询预先构建;

至少基于所述各查询词的各候选词对应的实体类别,从所述各候选词中选取各目标候选词;

根据所述各目标候选词,确定所述自然语言查询内容的补全内容;

所述从所述各候选词中选取各目标候选词,包括:

对于所述各候选词中任意的第一候选词,基于基础实体类别以及所述第一候选词的目标实体类别形成实体类别序列;所述基础实体类别是通过对所述自然语言查询内容进行实体识别得到的;

利用正则表达式,对所述实体类别序列进行校验,若校验通过,则将所述第一候选词作为一个目标候选词。

2.根据权利要求1所述的方法,其中,所述若干词典树包括对应于第一实体类别的第一词典树;所述第一词典树包括前缀树和后缀树;所述前缀树基于所述第一实体类别的各实体词的从开端开始的至少部分字构建得到;所述后缀树基于所述第一实体类别的各实体词的截至末尾的至少部分字构建得到;

所述查询对应于不同实体类别的词典树,包括:

将当前查询词作为前缀词,查询所述前缀树,得到当前查询词的第一实体类别的第一实体词,以及将当前查询词作为后缀词,查询所述后缀树,得到当前查询词的第一实体类别的第二实体词;

所述第一实体词和第二实体词构成当前查询词的第一实体类别的各候选词。

3.根据权利要求1所述的方法,其中,所述若干词典树包括对应于第一实体类别的第一词典树,所述第一词典树包括多个分支,每个分支中的各节点间路径分别对应于所代表实体词中的至少部分字,且叶子节点的值为所代表实体词;

所述查询对应于不同实体类别的若干词典树,包括:

依次将当前查询词与所述第一词典树中的各个分支进行逐字匹配,若任意的第一分支所覆盖的字包含当前查询词,则将该第一分支的叶子节点的值作为当前查询词的第一实体类别的一个候选词。

4.根据权利要求1所述的方法,其中,所述对所述实体类别序列进行校验,包括:

将所述实体类别序列输入所述正则表达式对应的状态机,并进行状态迁移;所述状态迁移包括:将所述实体类别序列中的当前实体类别与当前状态的迁移边对应的标注实体类别进行比对,若相一致,则迁移至下一状态,并更新当前实体类别;否则结束;

在所述状态迁移结束后,若所述状态机的状态为匹配状态,则校验通过,否则校验不通过。

5.根据权利要求1所述的方法,其中,在所述将所述各目标候选词确定为所述自然语言查询内容的补全内容之前,所述方法还包括:

按照排序算法,对所述各目标候选词进行排序;

将排序后的各目标候选词确定为所述自然语言查询内容的补全内容;

其中,所述排序算法包括以下中的任一项:最长匹配算法、状态优先级算法、词典基数算法、词组合热度算法、自定义优先级算法以及词使用频次算法。

6.根据权利要求1所述的方法,还包括:

当检测到光标的位置位于所述自然语言查询内容的中间位置时,将所述自然语言查询内容中截至中间位置的内容作为更新的自然语言查询内容;

对所述更新的自然语言查询内容进行补全。

7.根据权利要求1所述的方法,其中,所述实体类别包括以下中的至少一项:时间、运算符、单位、函数、意图、维度、维值以及度量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210058334.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top