[发明专利]抽取共同特征的方法和装置在审
申请号: | 201710142514.4 | 申请日: | 2017-03-10 |
公开(公告)号: | CN108573266A | 公开(公告)日: | 2018-09-25 |
发明(设计)人: | 张少娜 | 申请(专利权)人: | 中国移动通信集团河北有限公司;中国移动通信集团公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 050021 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抽取 方法和装置 用户群体 特征量计算 特征量确定 关联性 自适应 获知 分配 | ||
一种抽取共同特征的方法和装置,包括:依据用户的特征量确定类中心,基于所述类中心分配用户至所属类中;根据类中用户的特征量计算类自适应度,调整用户所属类;抽取用户所属类的共同特征。采用本发明实施例后,能够依据用户群体特征的关联性,获知用户群体的共同特征。
技术领域
本发明涉及计算机领域,尤其涉及一种抽取共同特征的方法和装置。
背景技术
随着时代的发展与进步,市场经济越来越多元化,人与人之间的各种联系也日趋便利和集中化,社交已成为人们沟通交流和拓宽自己交际圈的有效渠道,人类发展的群体特征愈发明显。曾有著名的六度空间理论:你和任何一个陌生人之间所间隔的人不会超过6个,即最多通过6个人就能认识任何一个陌生人。
传统的挖掘技术分析只是针对用户个体或用户个体特征属性进行聚类判断,聚类数的选取以及聚类初始中心点的确定是首先需要面对的问题,也是影响聚类结果好坏的重要参数。
现有的聚类方法是以设定的k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。该聚类方法依赖于初始中心的设定,聚类结果对初始中心点的选取比较敏感。聚类结果依赖于初始值的选取,当初始中心点的选择不同时,聚类结果可能会发生很大差异,由此导致了不能保证获得最优的聚类结果。
综上,现有技术中用户聚类只是根据用户个体或用户特征属性之间的相似性分类用户,忽略了用户群体特征的关联性。因此,无法获知用户群体的共同特征。
发明内容
本发明实施例提供了一种抽取共同特征的方法,能够依据用户群体特征的关联性,获知用户群体的共同特征。
本发明实施例还提供了一种传输数据的装置,能够依据用户群体特征的关联性,获知用户群体的共同特征。
一种抽取共同特征的方法,包括:
依据用户的特征量确定类中心,基于所述类中心分配用户至所属类中;
根据类中用户的特征量计算类自适应度,调整用户所属类;
抽取用户所属类的共同特征。
可选的,所述基于所述类中心分配用户至所属类中,包括:
基于所述类中心与用户的特征量的距离,将所述用户分配至最小距离对应的类中。
可选的,所述最小距离的数目等于2,所述最小距离是一个类中最大距离;
所述将所述用户分配至最小距离对应的类中,包括:
将所述用户分配至所述最小距离对应的另一个类中。
可选的,所述最小距离的数目等于2,所述最小距离是一个类中最小距离;
所述将所述用户分配至最小距离对应的类中,包括:
将所述用户分配至所述最小距离对应的一个类中。
可选的,所述根据类中用户的特征量计算类自适应度,调整用户所属类,包括:
根据类中用户的特征量与类中心的差的平方和,确定类自适应度;
最小类自适应度与最大类自适应度的比值小于预设自适应度阈值,则基于当前类中心调整用户所属类。
可选的,所述根据类中用户的特征量计算类自适应度,调整用户所属类,包括:
根据类中用户的特征量与类中心的差的平方和,确定类自适应度;
最小类自适应度与最大类自适应度的比值大于等于预设自适应度阈值,用户与所属类中心的用户距离大于等于所属类中最大用户距离的一半,则基于当前类中心调整用户所属类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团河北有限公司;中国移动通信集团公司,未经中国移动通信集团河北有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710142514.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人流量统计方法及统计系统
- 下一篇:一种肝脏组织结构分类的方法及装置