[发明专利]一种分类检测方法、装置、设备及存储介质有效
申请号: | 202010338915.9 | 申请日: | 2020-04-26 |
公开(公告)号: | CN111538813B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 刘红;谢永恒;张鹏毅;陈冬霞;王梅;崔样洋;汪金苗;王淑萍 | 申请(专利权)人: | 北京锐安科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/295;G06F40/30;G06N5/022 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100044 北京市海淀区西小口*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分类 检测 方法 装置 设备 存储 介质 | ||
1.一种分类检测方法,其特征在于,包括:
获取与目标实体对应的目标数据和目标标签;所述目标数据包括所述目标实体的第一属性信息;所述目标标签为所述目标实体当前标记的标签;
获取与所述第一属性信息关联的分类贡献值;所述分类贡献值用于衡量所述第一属性信息对所述目标实体分类的贡献程度;
根据所述分类贡献值确定所述目标实体的分类结果;
根据所述目标实体的分类结果和所述目标标签确定所述目标实体的分类是否正确;
所述根据所述分类贡献值确定所述目标实体的分类结果包括:
利用所述分类贡献值确定分类函数;
根据所述分类函数确定所述目标实体的分类结果;
所述根据所述分类贡献值确定分类函数包括:
根据公式确定所述分类函数;
其中,classe表示所述目标实体的分类结果,sign()为符号函数,e表示所述目标实体,k表示与所述目标实体e对应的聚类后的第二属性词的个数,wi表示第i个聚类后的第二属性词,表示目标实体e对应的第i个聚类后的第二属性词wi的分类贡献值,α为正值或者负值。
2.根据权利要求1所述的分类检测方法,其特征在于,所述获取与所述第一属性信息关联的分类贡献值包括:
在预先建立的分类贡献值表中查找与所述第一属性信息关联的分类贡献值;所述分类贡献值表用于存储所述第一属性信息与所述分类贡献值的映射关系。
3.根据权利要求2所述的分类检测方法,其特征在于,还包括:
获取与样本标签对应的样本实体和第一样本数据;所述样本标签为所述样本实体当前标记的标签;
获取除所述样本标签之外的标签对应的样本实体和第二样本数据;所述第一样本数据和所述第二样本数据均包括样本实体的第二属性信息;
确定每个所述第二属性信息关联的分类贡献值;
根据所述样本标签、每个所述第二属性信息及对应的所述分类贡献值建立所述分类贡献值表。
4.根据权利要求3所述的分类检测方法,其特征在于,所述确定每个所述第二属性信息关联的分类贡献值包括:
对每个所述第二属性信息进行文本处理,得到与所述第二属性信息语义相关的至少一个第一属性词;
将至少一个第一属性词进行相似度聚类;
确定聚类后的每个第一属性词对应的分类贡献值。
5.根据权利要求4所述的分类检测方法,其特征在于,所述确定聚类后的每个第一属性词对应的分类贡献值包括:
确定聚类后的每个第一属性词在所有所述第一样本数据的属性信息位置处出现的第一次数;
确定聚类后的每个第一属性词在所有所述第二样本数据的属性信息位置处出现的第二次数;
根据所述第一次数和所述第二次数确定聚类后的每个第一属性词对应的分类贡献值。
6.根据权利要求5所述的分类检测方法,其特征在于,所述根据所述第一次数和所述第二次数确定聚类后的每个第一属性词对应的分类贡献值包括:
根据公式sw=(cw0-cw1)/(cw0+cw1)确定聚类后的每个第一属性词对应的分类贡献值;
其中,w表示聚类后的第一属性词,sw表示聚类后的第一属性词w的分类贡献值,cw0表示聚类后的第一属性词w在所有所述第一样本数据的属性信息位置处出现的第一次数,cw1表示聚类后的第一属性词w在所有所述第二样本数据的属性信息位置处出现的第二次数。
7.根据权利要求4所述的分类检测方法,其特征在于,所述获取与所述第一属性信息关联的分类贡献值包括:
对每个所述第一属性信息进行文本处理,得到与所述第一属性信息语义相关的至少一个第二属性词;
将所述至少一个第二属性词进行相似度聚类;
获取与聚类后的每个第二属性词对应的分类贡献值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010338915.9/1.html,转载请声明来源钻瓜专利网。