[发明专利]对象分群方法、模型训练方法及装置在审
申请号: | 201510927700.X | 申请日: | 2015-12-14 |
公开(公告)号: | CN106874925A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 席炎;王晓光;隋宛辰;漆远;张柯;姜晓燕;王少萌;俞吴杰;施兴 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京国昊天诚知识产权代理有限公司11315 | 代理人: | 黄熊,李永强 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 分群 方法 模型 训练 装置 | ||
技术领域
本申请涉及计算机技术,特别涉及一种对象分群方法、模型训练方法及装置。
背景技术
目前,机器学习(Machine Learning,ML)应用于人工智能的各个领域。例如:通过提取用户的信用数据来进行机器学习,得到信用评分模型。
以信用评分的应用为例,一般是将所有用户的信用数据来进行机器学习,得到一个统一的信用评分模型,并在这个统一的信用评分模型中完成所有用户的信用评估。实践证明,由于用户群中存在不同的群体特性或人群分布,上述统一的信用评分模型往往很难达到令人满意的信用评估效果。故,合理地对用户群进行人群划分,并根据不同人群分别建立信用评估模型,已成为当前信用评估过程的重要环节。
现有技术中,一般可以利用监督学习(Supervised Learning)或半监督学习(Semi-Supervised Learning,SSL)来实现上述群划分,例如:逻辑回归(Logistic Regression)。其中,在监督学习或半监督学习中,一般需要预先对群划分进行人为定义(如:预先确定群聚类的个数)。
可见,在现有技术中,由于在监督学习或半监督学习的过程中,一般需要预先对群划分进行人为定义,使得群划分过程中因存在人为干预的因素,而影响最终群划分的准确性。
发明内容
本申请实施例的目的是提供一种对象分群方法、模型训练方法及装置,以 解决现有技术中的群划分过程中因存在人为干预的因素,而影响最终群划分的准确性的问题。
为解决上述技术问题,本申请实施例提供的对象分群方法、模型训练方法及装置是这样实现的:
一种对象分群方法,包括:
根据与待分群的对象集合中的各个对象对应的预设特征值,确定所述对象集合中的任意两个对象之间的欧式距离;
将所述对象集合中的对象按照所述欧式距离在三维空间内进行分布;
基于所述对象集合中的对象在所述三维空间内的分布,确定在预设半径的邻域内的对象数量不小于预设数值的第一核心对象;
确定在预设半径的邻域内的对象数量不小于预设数值的、且处于所述第一核心对象的预设半径的领域内的第二核心对象;
将所述第一核心对象和所述第二核心对象归属于同一个对象群。
一种对象分群方法,包括:
根据与待分群的对象集合中的各个对象对应的预设特征值,确定所述对象集合中的任意两个对象之间的欧式距离;
将所述对象集合中的对象按照所述欧式距离在三维空间内进行分布;
基于所述对象集合中的对象在所述三维空间内的分布,确定在预设半径的邻域内的对象数量不小于预设数值的核心对象,得到由核心对象组成的核心对象集合;
若所述核心对象集合中的第一核心对象处于第二核心对象的预设半径的领域内,将所述第一核心对象和所述第二核心对象归属于同一个对象群。
一种模型训练方法,包括:
利用上述对象分群方法将待分群的对象集合中的对象进行分群;以及
根据预先确定的与分群得到的各个对象群对应的待选取特征,提取与各个对象群中包含的对象对应的所述待选取特征;
利用提取的各个对象群中包含的对象的所述待选取特征进行模型训练,得到与各个对象群对应的模型。
一种对象分群装置,包括:
第一确定单元,用于根据与待分群的对象集合中的各个对象对应的预设特征值,确定所述对象集合中的任意两个对象之间的欧式距离;
分布单元,用于将所述对象集合中的对象按照所述欧式距离在三维空间内进行分布;
第二确定单元,用于基于所述对象集合中的对象在所述三维空间内的分布,确定在预设半径的邻域内的对象数量不小于预设数值的第一核心对象;
第三确定单元,用于确定在预设半径的邻域内的对象数量不小于预设数值的、且处于所述第一核心对象的预设半径的领域内的第二核心对象;
分群单元,用于将所述第一核心对象和所述第二核心对象归属于同一个对象群。
一种对象分群装置,包括:
第一确定单元,用于根据与待分群的对象集合中的各个对象对应的预设特征值,确定所述对象集合中的任意两个对象之间的欧式距离;
分布单元,用于将所述对象集合中的对象按照所述欧式距离在三维空间内进行分布;
核心对象确定单元,用于基于所述对象集合中的对象在所述三维空间内的分布,确定在预设半径的邻域内的对象数量不小于预设数值的核心对象,得到由核心对象组成的核心对象集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510927700.X/2.html,转载请声明来源钻瓜专利网。