[发明专利]特征处理方法及装置有效
申请号: | 201910176079.6 | 申请日: | 2019-03-08 |
公开(公告)号: | CN109934628B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 周源;邳进发;高俊敏;单厚智;郑杰;张耀荣 | 申请(专利权)人: | 智者四海(北京)技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 任卫华 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 处理 方法 装置 | ||
本公开内容涉及一种特征处理方法及装置。根据本公开内容的一个实施方式,该方法包括:为对象分配对象ID;为对象的特征的类型分配类型ID;使用与类型对应的算子生成与对象的特征对应的哈希值;以及基于对象的对象ID、类型ID和哈希值生成表示对象的特征的签名。本公开内容的方法及装置至少具有以下有益技术效果之一:丰富特征向量的表达能力,以及保证特征处理过程具有较佳的易用性及可扩展性。
技术领域
本公开内容涉及计算机技术,具体地,涉及一种特征处理方法及装置。
背景技术
特征处理是模型训练和服务部署过程中比较重要的一部分,其可以理解为从用户、上下文、物品等属性值(离散属性或连续属性)到若干个特征向量的映射过程。单一的特征比较容易表示,但在模型构建的过程中,需要使用大量的属性值,有着各种不同的类型,最终形成的向量维度可能是万甚至亿这个级别,导致在管理特征和处理特征方面存在一定的困难。在特征处理和服务部署过程中,要想严格保证数据处理过程的一致性,需要使用严格一致的逻辑模块来进行此项操作,比如使用共同类库或者同一套代码,因此,当新增特征时往往需要代码介入,导致易用性与可扩展性有限。
发明内容
在下文中将给出关于本公开内容的简要概述,以便提供关于本公开内容的某些方面的基本理解。应当理解,此概述并不是关于本公开内容的穷举性概述。它并不是意图确定本公开内容的关键或重要部分,也不是意图限定本公开内容的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
根据本公开内容的第一方面,提供了一种特征处理方法,包括:
为对象分配对象ID;
为对象的特征的类型分配类型ID;
使用与类型对应的算子生成与对象的特征对应的哈希值;以及
基于对象的对象ID、类型ID和哈希值生成表示对象的特征的签名。
根据本公开内容的第二方面,提供了一种特征处理装置,包括:
第一分配单元,被配置成为对象分配对象ID;
第二分配单元,被配置成为对象的特征的类型分配类型ID;
计算单元,被配置成使用与类型对应的算子生成与对象的特征对应的哈希值;以及
生成单元,被配置成基于对象的对象ID、类型ID和哈希值生成表示对象的特征的签名。
根据本公开内容的第三方面,提供一种存储介质,其上存储有实现上述第一方面的特征处理方法的程序。
本公开内容的技术方案至少具有以下技术效果之一:丰富了特征向量的表达能力,以及保证特征处理过程具有较佳的易用性及可扩展性。
附图说明
本公开可以通过参考下文中结合附图所给出的描述而得到更好的理解,附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。在附图中:
图1是根据本公开内容的一个实施例的特征处理方法的流程示意图;以及
图2是根据本公开内容的一个实施例的特征处理装置的结构框图。
具体实施方式
在下文中将结合附图对本公开内容的示例性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施例的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中可以做出很多特定于实施例的决定,以便实现开发人员的具体目标,并且这些决定可能会随着实施例的不同而有所改变。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本公开内容,在附图中仅仅示出了与根据本公开内容的方案密切相关的装置结构,而省略了与本公开内容关系不大的其他细节。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智者四海(北京)技术有限公司,未经智者四海(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910176079.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:建立满意度预测模型的方法及装置
- 下一篇:一种信息推送方法及装置