[发明专利]一种查询串语义需求分析方法及装置有效
申请号: | 201610150692.7 | 申请日: | 2016-03-16 |
公开(公告)号: | CN107203526B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 王思聪 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/9532;G06F16/29;G06F16/242;G06F16/2452 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 310051 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 查询 语义 需求 分析 方法 装置 | ||
1.一种查询串语义分析方法,其特征在于,所述方法包括:
对接收到的查询串进行分词,获得分词查询串;
从所述查询串所对应的语义模板库中获取匹配所述分词查询串的包括多个模板词的候选语义模板;所述模板词为人工线下挖掘的,并具有预设的与之匹配的词语;
根据所述模板词的语义评分,分别计算所述候选语义模板的语义评分,将语义评分最高的候选语义模板作为最优语义模板,并根据所述最优语义模板构造检索方案,所述检索方案包括:需求类型、检索内容。
2.根据权利要求1所述的方法,其特征在于,从所述查询串所对应的语义模板库中获取匹配所述分词查询串的包括多个模板词的候选语义模板的步骤,具体包括:
获取所述查询串所对应的搜索范围;
获取与所述搜索范围对应的所述语义模板库,从所述语义模板库中获取匹配所述分词查询串的包括多个模板词的候选语义模板。
3.根据权利要求2所述的方法,其特征在于,所述搜索范围为搜索城市,所述获取所述查询串所对应的搜索范围的步骤,具体包括:
根据当前定位位置获取所述查询串所对应的搜索城市;并且/或者
对所述查询串进行位置分析,获取所述查询串所对应的搜索城市。
4.根据权利要求1所述的方法,其特征在于,所述从所述查询串所对应的语义模板库中获取匹配所述分词查询串的包括多个模板词的候选语义模板的步骤,具体还包括:
使用AC自动机从语义模板库中获取匹配所述分词查询串的包括多个模板词的候选语义模板。
5.根据权利要求1所述的方法,其特征在于,所述计算所述候选语义模板的语义评分的步骤,具体包括:
获取所述候选语义模板中包含的模板词,并获得所述模板词的语义评分,所述模板词的语义评分根据所述模板词的类型以及所述模板词的长度进行设定;
对所述候选语义模板中包含的所有模板词的语义评分进行线性加权求和获得求和结果,所述求和结果为所述候选语义模板的语义评分。
6.根据权利要求1所述的方法,其特征在于,所述将语义评分最高的候选语义模板作为最优语义模板的步骤,具体包括:
根据POI资源库去除所述语义评分最高的候选语义模板中实体词的冗余信息噪音,获得去冗语义模板,将所述去冗语义模板作为最优语义模板。
7.一种地址查询串语义分析系统装置,其特征在于,所述系统装置包括:
分词模块,用于对接收到的查询串进行分词获得分词查询串;
候选语义模板获取模块,用于从所述查询串所对应的语义模板库中获取匹配所述分词查询串的包括多个模板词的候选语义模板;所述模板词为人工线下挖掘的,并具有预设的与之匹配的词语;
检索方案构造模块,用于根据所述模板词的语义评分,分别计算所述候选语义模板的语义评分,将语义评分最高的所述候选语义模板作为最优语义模板,并根据最优语义模板构造检索方案,所述检索方案包括:需求类型、检索内容。
8.根据权利要求7所述的系统装置,其特征在于,所述候选语义模板获取模块具体包括:
搜索范围获取单元,用于获取所述查询串所对应的搜索范围;
候选语义模板匹配单元,用于从与所述搜索范围对应的所述语义模板库中获得匹配所述分词查询串的包括多个模板词的候选语义模板。
9.根据权利要求7所述的系统装置,其特征在于,所述候选语义模板获取模块具体用于:使用AC自动机从语义模板库中获取匹配所述分词查询串的包括多个模板词的候选语义模板。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610150692.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车后座专用座椅套
- 下一篇:车用保护垫