[发明专利]数据分类的方法、装置、存储介质及电子设备在审
申请号: | 201811549855.4 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109830296A | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 徐境雪;李健;王伟光 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06K9/62;G06K9/66;G06N3/04 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 张岩龙;魏嘉熹 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 非关键数据 关键数据 标签 目标数据 预设数据 存储介质 电子设备 分类模型 关联数据 筛选模型 数据标签 数据分类 训练模型 样本数据 分类 分类结果 获取目标 目标事件 预先设置 | ||
1.一种数据分类的方法,其特征在于,所述方法包括:
获取目标事件在多个数据标签下对应的样本数据;
获取预设数据筛选模型,从所述数据标签中确定预先设置的关键数据标签和非关键数据标签,并从所述样本数据中确定所述关键数据标签对应的关键数据以及所述非关键数据标签对应的非关键数据;
根据所述关键数据和所述非关键数据通过所述预设数据筛选模型从所述非关键数据标签中确定与所述关键数据标签相关的关联数据标签;
获取预设数据分类训练模型,通过所述关键数据和所述关联数据标签对应的非关键数据对所述预设数据分类训练模型进行训练,得到目标数据分类模型;
获取所述目标事件中待分类的目标数据,将所述目标数据作为所述目标数据分类模型的输入,得到分类结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述关键数据和所述非关键数据通过所述预设数据筛选模型从所述非关键数据标签中确定与所述关键数据标签相关的关联数据标签包括:
对所述非关键数据标签进行排列组合处理,得到多个非关键数据标签集,其中,不同的所述非关键数据标签集对应不同的排列组合结果;
将所述关键数据标签分别与每个所述非关键数据标签集组合,得到多个数据标签集组;
依次将每个数据标签集组中,关键数据标签对应的关键数据和非关健数据标签对应的非关健数据作为预设数据筛选模型的输入,得到输出结果;
根据所述输出结果确定每个所述数据标签集组对应的分类正确率;
从全部所述数据标签集组中,确定分类正确率最高的目标标签集组,并将所述目标标签集组中的非关键数据标签,确定为所述关联数据标签。
3.根据权利要求2所述的方法,其特征在于,所述根据输出结果确定每个所述数据标签集组对应的分类正确率包括:
获取每个所述数据标签集组对应的期望输出结果;
根据所述输出结果和所述期望输出结果得到所述分类正确率。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述目标数据分类模型包括:
其中,x1,x2,...xn表示所述目标数据分类模型的输入变量,xi表示第i个数据,Y表示所述目标分类模型的输出变量,bi、ci、pi、a0表示所述目标数据分类模型的参数,i表示从1到n中的任意一个。
5.一种数据分类的装置,其特征在于,所述装置包括:
获取模块,用于获取目标事件在多个数据标签下对应的样本数据;
确定模块,用于获取预设数据筛选模型,从所述数据标签中确定预先设置的关键数据标签和非关键数据标签,并从所述样本数据中确定所述关键数据标签对应的关键数据以及所述非关键数据标签对应的非关键数据;
数据筛选模块,用于根据所述关键数据和所述非关键数据通过所述预设数据筛选模型从所述非关键数据标签中确定与所述关键数据标签相关的关联数据标签;
模型训练模块,用于获取预设数据分类训练模型,通过所述关键数据和所述关联数据标签对应的非关键数据对所述预设数据分类训练模型进行训练,得到目标数据分类模型;
分类模块,用于获取所述目标事件中待分类的目标数据,将所述目标数据作为所述目标数据分类模型的输入,得到分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811549855.4/1.html,转载请声明来源钻瓜专利网。