[发明专利]关键字匹配方法及装置有效
申请号: | 201710856489.6 | 申请日: | 2017-09-20 |
公开(公告)号: | CN107590258B | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 刘元;范渊;李凯;莫金友 | 申请(专利权)人: | 杭州安恒信息技术股份有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/903 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 苏胜 |
地址: | 310051 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键字 匹配 方法 装置 | ||
1.一种关键字匹配方法,其特征在于,所述方法包括:
解析流量数据,获取所述流量数据中的待测关键字;
判断所述待测关键字中的多个字符是否均对应在预先设定的目标字典树的一分支中,在为是时,获取所述流量数据中与所述待测关键字对应的数据信息,其中,所述分支包括多个节点,每个所述节点对应一所述字符;
以及,判断所述待测关键字中的多个字符是否均对应在预先设定的目标字典树的一分支中,在为是时,获取所述流量数据中与所述待测关键字对应的数据信息,包括:
按所述待测关键字中多个所述字符的排列顺序,获取所述待测关键字中的首字符;
判断所述首字符是否与预先设定的至少一个字典树中的一字典树对应,在为是时 ,将所述字典树作为所述目标字典树;
判断所述待测关键字中所述首字符之后的每个所述字符是否均对应在所述目标字典树的一分支中,在为是时,获取所述流量数据中与所述待测关键字对应的所述数据信息。
2.根据权利要求1所述的关键字匹配方法,其特征在于,所述节点为根节点、子节点或子节点的分支节点,判断所述首字符是否与预先设定的至少一个字典树中的一字典树对应,在为是时 ,将所述字典树作为所述目标字典树,包括:
判断所述至少一个字典树中,是否有一所述字典树中的所述根节点与所述首字符对应,在为是时,将所述字典树作为所述目标字典树。
3.根据权利要求2所述的关键字匹配方法,其特征在于,判断所述待测关键字中所述首字符之后的每个所述字符是否均对应在所述目标字典树的一分支中,在为是时,获取所述流量数据中与所述待测关键字对应的所述数据信息,包括:
按所述待测关键字中所述首字符之后每个所述字符排列顺序,依次将每个所述字符与所述目标字典树的所述根节点之后的所述子节点或所述子节点的分支节点匹配,其中,匹配的每个所述子节点或所述子节点的分支节点与匹配的其余所述子节点或所述子节点的分支节点具有链接关系;
判断是否存在与所述目标字典树的所述子节点或所述子节点的分支节点不匹配的所述字符,在为否时,判定所述待测关键字中所述首字符之后的每个所述字符均对应在所述目标字典树的一分支中,获取所述流量数据中与所述待测关键字对应的所述数据信息。
4.根据权利要求1所述的关键字匹配方法,其特征在于,所述方法还包括:
获取并解析多个预存关键字;
根据所述多个预存关键字,按预设规则建立至少一个字典树,其中,所述预设规则为每个所述字典树的一分支中,该所述分支中的多个所述节点与一所述预存关键字中多个字符对应;
将所述至少一个字典树存储。
5.根据权利要求4所述的关键字匹配方法,其特征在于,所述节点为根节点、子节点或子节点的分支节点,根据所述多个预存关键字,按预设规则建立至少一个字典树,包括:
针对每个所述预存关键字,获取所述预存关键字的多个所述字符中的首字符;
针对每个所述预存关键字,判断是否存在所述字符与所述预存关键字中的首字符相同的一目标预存关键字,在为否时,按所述预存关键字的所述多个字符的排列顺序建立对应的一所述字典树,在为是时,将所述预存关键字的所述多个字符按排列顺序,组合到所述目标预存关键字的所述多个字符按排列顺序建立对应的一目标字典树中,获得组合后的所述字典树,以使组合后的所述字典树中每个所述分支均对应一所述预存关键字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术股份有限公司,未经杭州安恒信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710856489.6/1.html,转载请声明来源钻瓜专利网。