[发明专利]输出对象的数据处理方法及装置有效
申请号: | 201510349469.0 | 申请日: | 2015-06-23 |
公开(公告)号: | CN104951545B | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 吴金虎;吴名宇 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 输出对象 特征属性 相似度矩阵 交集 数据处理 可视化 相似度 双向关系 输出 | ||
本发明提供一种输出对象的数据处理方法及装置。本发明实施例通过获取至少两个输出对象中每个输出对象的特征属性,进而根据所述每个输出对象的特征属性,获得两两输出对象的特征属性的交集,以及根据所述每个输出对象的特征属性和所述两两输出对象的特征属性的交集,获得相似度矩阵,使得能够根据所述相似度矩阵,对所述每个输出对象进行可视化输出,由于根据每个输出对象的特征属性和两两输出对象的特征属性的交集所获得的相似度矩阵,能够表示两两输出对象之间的双向关系,使得所获得的两两输出对象的相似度是两两输出对象真正的相似度,从而提高了输出对象可视化的可靠性。
【技术领域】
本发明涉及数据处理技术,尤其涉及一种输出对象的数据处理方法及装置。
【背景技术】
随着互联网的不断发展,不同行业的用户所面临的数据量越来越大,从这些海量数据中找到他们所关心的内容即输出对象,并且可视化是一个很大的挑战。例如,广告商可以通过选择不同的推广产品,来向公众提供推广服务,其需要知道推广产品与其他推广产品之间的关系,或者推广产品与媒体属性、人口属性和地域属性之间的关系,等等,并且还需要将这些多维度关系展现在一个如二维平面空间等较低维度空间上。在展现的过程中,可以将两两输出对象的特征属性的交集与该两两输出对象的特征属性的并集的比值,作为该两两输出对象的相似度。
然而,由于两两输出对象的特征属性的交集与该两两输出对象的特征属性的并集的比值只能够表示两两输出对象之间的单向关系,使得所获得的两两输出对象的相似度并不是两两输出对象真正的相似度,从而导致了输出对象可视化的可靠性的降低。
【发明内容】
本发明的多个方面提供一种输出对象的数据处理方法及装置,用以提高输出对象可视化的可靠性。
本发明的一方面,提供一种输出对象的数据处理方法,包括:
获取至少两个输出对象中每个输出对象的特征属性;
根据所述每个输出对象的特征属性,获得两两输出对象的特征属性的交集;
根据所述每个输出对象的特征属性和所述两两输出对象的特征属性的交集,获得相似度矩阵;
根据所述相似度矩阵,对所述每个输出对象进行可视化输出。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述输出对象的特征属性包括:
输出对象所属搜索关键词所对应的人数。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述每个输出对象的特征属性和所述两两输出对象的特征属性的交集,获得相似度矩阵,包括:
根据两两输出对象的特征属性的交集的平方与该两两输出对象的特征属性的乘积的比值,获得该两两输出对象的相似度;
根据该两两输出对象的相似度,获得所述相似度矩阵。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述相似度矩阵,对所述每个输出对象进行可视化输出,包括:
对所述相似度矩阵进行SVD处理,以获得分解矩阵;
根据所述分解矩阵,获得所述每个输出对象的输出位置;
根据所述每个输出对象的输出位置,输出所述每个输出对象。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述相似度矩阵,对所述每个输出对象进行可视化输出,包括:
根据所述相似度矩阵,计算两两输出对象的理论距离;
根据预先设置的至少一个特定种子,利用随机函数,获得所述每个输出对象的至少一个随机位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510349469.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种待推荐对象的确定方法及装置
- 下一篇:一种图像搜索的方法和装置