[发明专利]信息处理的方法及电子设备有效
申请号: | 201310062191.X | 申请日: | 2013-02-27 |
公开(公告)号: | CN104008261B | 公开(公告)日: | 2017-03-01 |
发明(设计)人: | 冯翱 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京同达信恒知识产权代理有限公司11291 | 代理人: | 黄志华 |
地址: | 100085 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 电子设备 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种信息处理的方法及电子设备。
背景技术
随着电子设备技术和计算机技术的发展,现有的电子设备中的CPU的处理数据的速度越来越快,使得所述电子设备能够在较短的时间内完成数据计算任务,进而使得用户使用方便,用户的体验也更好。
本申请发明人在实现本申请实施例技术方案的过程中,至少发现现有技术中存在如下技术问题:
现有的电子设备在进行大量二元组数据相似度计算时,存在计算量大,计算时间长的技术问题,这是因为现有的电子设备在对于两组数据M和N中的相似度时,需要将M中的每一个元素和N中的每一个元素进行一一配对,获取多个二元组数据,计算得到所述多个二元组数据中的每一个二元组中的两个数据之间的相似度,当M和N都比较大,这是一个计算量非常大的过程,比如:在对460万个用户模型和22万个信息模型进行逐对计算时,需要进行大约1万亿次计算,从而存在计算量大,计算时间长的技术问题,从而使得用户使用不方便,使得用户的体验也不好。
发明内容
本申请实施例通过提供一种信息处理的方法及电子设备,用以解决现有的电子设备在进行大量二元组数据相似度计算时,存在计算量大,计算时间长的技术问题。
本申请实施例提供了一种信息处理的方法,应用于电子设备中,所述方法包括:
获取所述电子设备存储的具有N个第一数据的第一组数据和与所述第一组数据对应的具有M个第二数据的第二组数据,其中,所述N个第一数据中的每一个第一数据至少包括与第一参数对应的第一参数值和与第二参数对应的第二参数值,所述M个第二数据中的每一个第二数据至少包括与所述第一参数对应的第三参数值和与所述第二参数对应的第四参数值,N和M都为不小于2的整数;
基于与所述第一及第二参数相关的第一预设条件,从所述第一组数据和所述第二组数据中提取包括有第一二元组集合和第二二元组集合的至少两组二元组集合,其中,所述第一二元组集合是将所述第一组数据中具有与所述第一参数对应的第一特征的K个第一数据中的每一个第一数据与所述第二组数据中具有所述第一特征的L个第二数据中的每一个第二数据进行一一比较的二元组的集合,所述第二二元组集合是将所述第一组数据中具有与所述第二参数对应的第二特征的Q个第一数据中的每一个第一数据与所述第二组数据中具有所述第二特征的P个第二数据中的每一个第二数据进行一一比较的二元组的集合,K、L、Q和P都为不小于1的整数;
基于一预设规则,从所述至少两组二元组集合中获取第一组二元组集合,其中,所述第一组二元组集合中的每一个二元组都不相同;
对所述第一组二元组集合中的每一个二元组中的第一数据和第二数据进行相似度计算,获取与所述第一组二元组集合对应的多个第一相似度值。
可选的,所述基于与所述第一及第二参数相关的第一预设条件,从所述第一组数据和所述第二组数据中提取包括有第一二元组集合和第二二元组集合的至少两组二元组集合,具体包括:基于所述第一预设条件中的与所述第一参数相关的第一预设子条件,从所述第一组数据和所述第二组数据中提取所述第一二元组集合;基于所述第一预设条件中的与所述第二参数相关的第二预设子条件,从所述第一组数据和所述第二组数据中提取所述第二二元组集合。
可选的,在所述第一参数为第一坐标系中的第一轴时,所述基于所述第一预设条件中的与所述第一参数相关的第一预设子条件,从所述第一组数据和所述第二组数据中提取所述第一二元组集合,具体为:基于所述第一组数据中的每一个第一数据在所述第一轴上的数值为零时,获取所述第一组数据中的在所述第一轴上的数值为非零的所述K个第一数据,其中,将所述在所述第一轴上的数值为非零作为所述第一特征;以及基于所述第二组数据中的每一个第二数据在所述第一轴上的数值为零时,获取所述第二组数据中的在所述第一轴上的数值为非零的所述L个第二数据;基于所述K个第一数据和所述L个第二数据,获取所述第一二元组集合,其中,所述第一二元组集合为将所述K个第一数据中的每一个第一数据与所述L个第二数据中的每一个第二数据进行一一比较的二元组的集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310062191.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用