[发明专利]一种基于多级分类器的分类结果筛选方法及装置在审
申请号: | 201710780295.2 | 申请日: | 2017-09-01 |
公开(公告)号: | CN107562880A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 席丽娜;李德彦;晋耀红 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙)11363 | 代理人: | 逯长明,许伟群 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多级 分类 结果 筛选 方法 装置 | ||
1.一种基于多级分类器的分类结果筛选方法,其特征在于,所述方法包括:
获取初始请求和多级分类器的分类结果;所述分类结果为所述多级分类器对预测文本信息分类的结果;所述分类结果包括x个分类路径的集合,x为大于或者等于1的正整数;
使用与所述初始请求相应的预设规则筛选所述分类结果,得到目标结果;
输出所述目标结果。
2.根据权利要求1所述的方法,其特征在于,所述使用与所述初始请求相应的预设规则筛选所述分类结果,得到目标结果包括:
按照分类等级筛选所述分类结果;和/或,
按照分类权重筛选所述分类结果;和/或,
按照分类内容筛选所述分类结果。
3.根据权利要求2所述的方法,其特征在于,所述按照分类等级筛选所述分类结果包括:
获取所述多级分类器的分类结果或者上一次筛选的分类结果,和,所述分类结果中所述分类路径的等级;
根据所述分类结果与所述等级,构建分类等级倒排索引;所述分类等级倒排索引为所述分类路径根据所述等级降序排列的路径集合;
根据预设等级数值,筛选所述分类等级倒排索引中的所述分类路径,得到包含所述分类路径的目标结果。
4.根据权利要求2所述的方法,其特征在于,所述按照分类权重筛选所述分类结果包括:
获取所述多级分类器的分类结果或者上一次筛选的分类结果,和,所述分类体系;所述分类体系包括n个分类节点,n为大于或者等于1的正整数;所述分类节点包括m个分类规则表达式,m为大于或者等于0的正整数;
匹配所述分类结果和所述分类体系,得到所述分类结果中所述分类路径对应的规则表达式;
计算所述规则表达式的权重值;
比较所述权重值与预设权重阈值,筛选所述规则表达式,得到筛选后的规则表达式对应的分类路径;
根据所述分类路径,得到与所述分类路径对应的目标结果。
5.根据权利要求2所述的方法,其特征在于,所述按照分类内容筛选所述分类结果包括:
获取所述多级分类器的分类结果或者上一次筛选的分类结果,和,所述分类体系;所述分类体系包括n个分类节点,n为大于或者等于1的正整数;所述分类节点包括m个分类规则表达式,m为大于或者等于0的正整数;
根据所述分类结果和所述分类体系,得到与所述分类结果中的分类路径对应的分类节点;
根据预设约束参数,筛选所述分类节点;所述约束参数包括包含、不包含、等于和不等于;
根据所述筛选后的分类节点,得到与所述分类节点对应的目标结果。
6.根据权利要求3所述的方法,其特征在于,所述根据预设等级数值,筛选所述分类等级倒排索引中的所述分类路径,得到包含所述分类路径的目标结果的步骤包括:
比较所述预设等级数值和所述等级,如果所述预设等级数值等于所述等级,则筛选出所述等级对应的分类路径,得到包含所述分类路径的目标结果。
7.根据权利要求4所述的方法,其特征在于,所述比较所述权重值与预设权重阈值,筛选所述规则表达式,得到筛选后的规则表达式对应的分类路径的步骤包括:
如果所述权重值大于或者等于所述预设权重阈值,则筛选出所述权重值对应的规则表达式以及规则表达式所在的分类路径,将所述分类路径按照权重值降序排列;
根据权重值降序排列序的顺序,筛选出与预设数量约束值对应数量的所述分类路径。
8.根据权利要求1所述的方法,其特征在于,所述输出筛选后的分类结果之后,还包括:
根据所述目标结果,得到所述目标结果对应的预测文本信息;
输出所述预测文本信息。
9.一种基于多级分类器的分类结果筛选装置,其特征在于,所述装置包括:
获取模块,用于获取初始请求和多级分类器的分类结果;所述分类结果为所述多级分类器对预测文本信息分类的结果;所述分类结果包括x个分类路径的集合,x为大于或者等于1的正整数;
筛选模块,用于使用与所述初始请求相应的预设规则筛选所述分类结果,得到目标结果;
分类结果输出模块,用于输出所述目标结果。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
预测文本信息获取模块,用于根据所述目标结果,得到所述目标结果对应的预测文本信息;
预测文本信息输出模块,用于输出所述预测文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710780295.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:表单查询处理方法和装置
- 下一篇:推荐系统的干预方法、介质、系统及计算设备