[发明专利]一种系统化生成标签的方法和系统在审
申请号: | 201811458242.X | 申请日: | 2018-11-30 |
公开(公告)号: | CN109657013A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 沈金;杨春斌 | 申请(专利权)人: | 杭州数澜科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 北京市联德律师事务所 11361 | 代理人: | 黄大正 |
地址: | 311121 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 系统化 属性传递 关联 | ||
本发明公开了一种系统化生成标签的方法和系统。一种生成标签的方法包括:选择第一对象和第二对象;选择行为;根据所述行为,关联所述第一和第二对象,形成所述第一和第二对象之间的关系;选择属性;以及将所述属性传递到所述关系以形成所述标签。
技术领域
本发明涉及计算机技术,更具体而言,涉及一种在大数据平台上系统化生成标签的方法和系统。
背景技术
在企业的运营过程中,会生成大量的业务数据,这些业务数据中包含了对企业生成状况的记录。企业的决策者可以根据业务数据对运营现状进行判断,辅助决策分析。然而,这些业务数据通常分散在各个部门,如果要将业务数据利用起来,能够为企业运营人员提供决策辅助,则需要将业务数据形成体系以进行管理,这个环节被称为数据资产化。数据资产化的具体含义是将企业的业务数据以成体系的标签的形式存储起来,作为企业的数据资产,用于后续的数据应用开发。
数据资产化的过程中的一个重要手段是根据业务需求生成标签。目前公知的生成标签的方法具有很大的人为性,生成的标签的体系不够完备。
发明内容
根据本发明的一个方面,一种生成标签的方法可以包括:选择第一对象和第二对象;选择行为;根据所述行为,关联所述第一和第二对象,形成所述第一和第二对象之间的关系;选择属性;将所述属性传递到所述关系以形成所述标签。
所述形成所述第一和第二对象之间的关系的步骤包括:将所述第一对象以作为键值名“主语”的键值;将所述行为作为键值名“谓语”的键值;将所述第二对象作为键值名“宾语”的键值;以及将上述与主语、谓语和宾语对应形成的三个键值对存储为体现所述关系的数据结构。
所述第一对象选自于第一集合,所述第二对象选自于第二集合,从第三集合选择所述行为,并且在所述根据所述行为,关联所述第一和第二对象,形成所述第一和第二对象之间的关系的步骤中,根据预定规则排除不合理的“主语-谓语-宾语”的组合。
所述传递操作包括以下步骤:将所述属性关联到所述数据结构,形成代表所述标签的数据包。
所述方法还包括:利用自然语言处理技术调整所述标签。
所述方法还包括:在所述属性被选择之前生成所述属性。
所述生成所述属性的步骤包括:对来自于数据源的词汇进行拆分;对经拆分的词汇标注词性;以及基于预定的标准筛选经标注词性的词汇,以得到符合所述标准的所述属性。
所述自然语言处理技术是RNN算法模型。
根据本发明的一个方面,一种生成标签的系统可以包括:用于选择第一对象和第二对象的模块;用于选择行为的模块;用于根据所述行为,关联所述第一和第二对象,形成所述第一和第二对象之间的关系的模块;用于选择属性的模块;用于将所述属性传递到所述关系以形成所述标签的模块。
所述用于根据所述行为,关联所述第一和第二对象,形成所述第一和第二对象之间的关系的模块包括:用于将所述第一对象以作为键值名“主语”的键值的模块;用于将所述行为作为键值名“谓语”的键值的模块;用于将所述第二对象作为键值名“宾语”的键值的模块;以及用于将上述与主语、谓语和宾语对应形成的三个键值对存储为体现所述关系的数据结构的模块。
所述第一对象选自于第一集合,所述第二对象选自于第二集合,所述系统还包括:用于从第三集合选择所述行为,并且利用所述用于根据所述行为,关联所述第一和第二对象,形成所述第一和第二对象之间的关系的模块,根据预定规则排除不合理的“主语-谓语-宾语”的组合的模块。
所述用于将所述属性传递到所述关系以形成所述标签的模块包括:用于将所述属性关联到所述数据结构,形成代表所述标签的数据包的模块。
所述系统还包括:用于利用自然语言处理技术调整所述标签的模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州数澜科技有限公司,未经杭州数澜科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811458242.X/2.html,转载请声明来源钻瓜专利网。