[发明专利]一种目标群体识别方法、装置及设备在审
申请号: | 201910713263.X | 申请日: | 2019-08-02 |
公开(公告)号: | CN110516713A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 宋孟楠;杨丹;高阳;崔欣培 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/06;G06Q40/08 |
代理公司: | 11623 北京晋德允升知识产权代理有限公司 | 代理人: | 王戈<国际申请>=<国际公布>=<进入国 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混合矩阵 数值型数据 聚类结果 目标群体 用户数据 装置及设备 数据计算 相似程度 聚类 | ||
1.一种目标群体识别方法,包括:
获取多个用户的待识别用户数据,所述待识别用户数据包括数值型数据和符号型数据;
对于所述多个用户中的任意两个用户,根据任意两个用户对应的所述数值型数据和所述符号型数据计算所述任意两个用户对应的混合矩阵,得到多个混合矩阵;所述任意两个用户对应的混合矩阵中任意一个元素的值表示所述任意两个用户在一个属性上的相似程度;
根据所述多个混合矩阵对所述多个用户进行聚类,得到聚类结果;
根据所述聚类结果识别出所述多个用户中的目标群体。
2.如权利要求1所述的方法,所述根据任意两个用户对应的所述数值型数据和所述符号型数据计算所述任意两个用户对应的混合矩阵,具体包括:
根据所述任意两个用户的数值型数据计算第一相似矩阵;
根据所述任意两个用户的符号型数据计算第二相似矩阵;
根据所述第一相似矩阵与所述第二相似矩阵计算得到所述任意两个用户对应的混合矩阵。
3.如权利要求2所述的方法,所述根据所述第一相似矩阵与所述第二相似矩阵计算得到所述任意两个用户对应的混合矩阵,具体包括:
根据所述第一相似矩阵与所述第二相似矩阵计算得到所述任意两个用户对应的初始混合矩阵;
根据所述初始混合矩阵对所述多个用户进行聚类,得到初始聚类结果;
根据所述初始聚类结果以及所述第二相似矩阵,对所述初始混合矩阵中的权重值进行迭代更新,直至更新后的权重值满足条件为止,得到所述任意两个用户对应的混合矩阵。
4.如权利要求1所述的方法,所述根据所述多个混合矩阵对所述多个用户进行聚类,得到聚类结果,具体包括:
根据所述多个混合矩阵确定所述多个用户之间的相似程度值;
根据所述相似程度值,利用谱聚类的方法对所述多个用户进行聚类,得到聚类结果,所述聚类结果中包括至少一个聚类集合,所述聚类集合中包括一个或多个用户。
5.如权利要求2所述的方法,所述根据所述任意两个用户的数值型数据计算第一相似矩阵,具体包括:
采用如下公式计算所述任意两个用户的数值型数据中每一类数值型数据对应的第一相似矩阵:
其中,Snum表示第一相似矩阵,D表示第i个数据点和第j个数据点之间的欧式距离,σ为方差,所述一个数据点对应于一个用户的待识别用户数据,n表示数据点的数量。
6.如权利要求2所述的方法,所述根据所述任意两个用户的符号型数据计算第二相似矩阵,具体包括:
采用如下公式计算所述任意两个用户的符号型数据中对应的每一类符号属性的第二相似矩阵:
其中,St表示第二相似矩阵,t表示第t类符号属性,xi表示第i个数据点的符号属性值,xj表示第j个数据点的符号属性值,n表示符号属性的类别数量。
7.如权利要求3所述的方法,所述根据所述第一相似矩阵与所述第二相似矩阵计算得到所述任意两个用户对应的初始混合矩阵,具体包括:
根据所述第一相似矩阵与所述第二相似矩阵,采用如下公式计算得到所述任意两个用户对应的初始混合矩阵:
其中,S表示混合矩阵,w表示所述符号型数据中每类符号属性的权重值,wi表示第i类符号属性的权重值,T表示符号属性的个数,Snum表示第一相似矩阵,St表示第二相似矩阵,t表示第t类符号属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910713263.X/1.html,转载请声明来源钻瓜专利网。