[发明专利]一种多元组层次划分的分类方法及装置有效
申请号: | 201710585101.3 | 申请日: | 2017-07-17 |
公开(公告)号: | CN107402994B | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 晋彤;李永康 | 申请(专利权)人: | 云润大数据服务有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510520 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多元 层次 划分 分类 方法 装置 | ||
1.一种多元组层次划分的分类方法,其特征在于,包括以下步骤:
根据文档主题生成模型进行语料训练,生成多元组特征库;其中,所述多元组特征库包含至少一个元组的元组特征;所述元组特征拥有独属于自身的权重比例;所述多元组特征库中的各个元组特征根据实体权重及概率权重模型进行权重比例调整;
所述实体权重具体指对文档数据进行元组划分,文档实体权重根据元组特征调整权重比例,即不同特征的元组有不同的权重比例;所述概率权重模型具体包括每个元组作为单独的总体进行概率模型计算,每个元组因不同的特征而选择不同的概率模型;
根据所述多元组特征库中的各个元组特征生成对应所述元组特征的分类器;
接收输入的待分类数据,对所述待分类数据进行实体权重计算和轻量级的概率权重模型计算得出所述待分类数据的特征,通过所述待分类数据的特征选择对应的所述分类器,根据所述分类器的实体权重比例及概率权重比例对所述待分类数据进行判别分类,输出所述待分类数据所属分类。
2.根据权利要求1所述的分类方法,其特征在于,在所述根据所述多元组特征库中的各个元组特征生成对应所述元组特征的分类器之后,还包括:
根据元组之间的联系建立所述元组之间的跨域的非线性关联规则。
3.根据权利要求1所述的分类方法,其特征在于,在所述接收输入的待分类数据,通过所述待分类数据的特征选择对应的所述分类器,根据所述分类器的实体权重比例及概率权重比例对所述待分类数据进行判别分类,输出所述待分类数据所属分类之后,还包括:
根据所述元组特征及所述待分类数据进行自适应学习以自动调整分类器。
4.根据权利要求1所述的分类方法,其特征在于,在接收输入的待分类数据,通过所述待分类数据的特征选择对应的所述分类器,根据所述分类器的实体权重比例及概率权重比例对所述待分类数据进行判别分类,输出所述待分类数据所属分类之后,还包括:
根据不同粒度对已分类的所述待分类数据进行多元结果集合归档及分类索引;其中,所述粒度指所述待分类数据所属分类的范围。
5.根据权利要求4所述的分类方法,其特征在于,所述根据不同粒度对已分类的所述待分类数据进行多元结果集合归档及分类索引具体为:
根据划分的粒度,将属于同一粒度且划分为一类的分类数据进行分布式计算的集合存储归档;
根据粒度的不同,生成特征指纹进行分类索引。
6.一种多元组层次划分的分类装置,其特征在于,包括:
语料训练模块,用于根据文档主题生成模型进行语料训练,生成多元组特征库;其中,所述多元组特征库包含至少一个元组的元组特征;所述元组特征拥有独属于自身的权重比例;所述多元组特征库中的各个元组特征根据实体权重及概率权重模型进行权重比例调整;
所述实体权重具体指对文档数据进行元组划分,文档实体权重根据元组特征调整权重比例,即不同特征的元组有不同的权重比例;所述概率权重模型具体包括每个元组作为单独的总体进行概率模型计算,每个元组因不同的特征而选择不同的概率模型;
分类器生成模块,用于根据所述多元组特征库中的各个元组特征生成对应所述元组特征的分类器;
类别输出模块,用于接收输入的待分类数据,对所述待分类数据进行实体权重计算和轻量级的概率权重模型计算得出所述待分类数据的特征,通过所述待分类数据的特征选择对应的所述分类器,根据实体权重判别及概率权重判别对所述待分类数据进行判别分类,输出所述待分类数据所属分类。
7.根据权利要求6所述的分类装置,其特征在于,还包括:
关联模块,用于根据元组之间的联系建立所述元组之间的跨域的非线性关联规则。
8.根据权利要求6所述的分类装置,其特征在于,还包括:
分类器自动调整模块,用于根据所述元组特征及所述待分类数据进行自适应学习以自动调整分类器。
9.根据权利要求6所述的分类装置,其特征在于,还包括:
多元结果集合模块,用于根据不同粒度对已分类的所述待分类数据进行多元结果集合归档及分类索引;其中,
所述多元结果集合模块具体包括:
归档单元,用于根据划分的粒度,将属于同一粒度且划分为一类的分类数据进行分布式计算的集合存储归档;
索引单元,用于根据粒度的不同,生成特征指纹进行分类索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云润大数据服务有限公司,未经云润大数据服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710585101.3/1.html,转载请声明来源钻瓜专利网。