[发明专利]一种基于知识推理的大数据业务标签的扩展方法及系统有效

专利信息
申请号: 202010543081.5 申请日: 2020-06-15
公开(公告)号: CN111737400B 公开(公告)日: 2023-06-20
发明(设计)人: 李铮;丁富强;陆晋军;孙海;蒋润青;张亮;代晓菊;周敏杰;钱志骥 申请(专利权)人: 上海理想信息产业(集团)有限公司
主分类号: G06F16/31 分类号: G06F16/31;G06F16/33;G06F16/335;G06F16/338;G06F16/36;G06N5/04
代理公司: 上海国智知识产权代理事务所(普通合伙) 31274 代理人: 潘建玲
地址: 201315 上海市浦东*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 推理 数据业务 标签 扩展 方法 系统
【说明书】:

发明公开了一种基于知识推理的大数据业务标签的扩展方法及系统,该方法包括:步骤S1,从预设的业务标签树中选中待扩展标签及标签下属关键词集合K,搜索每一关键词,获得结果相关URL集合C;步骤S2,对每一关键词,遍历集合C中对应URL,从每个网页获取文本内容,对文本进行语义分析,抽取与关键词有关联的语义对象和语义关系,构建语义关系知识图谱;步骤S3,利用知识图谱,结合本体规则模型,以待扩展标签为依据,对知识图谱中实体进行校验和筛选,将通过校验的实体属性内容以关键字形式加入结果集合;步骤S4,判断结果集合规模是否达到预设扩展规模,若达到则结束,否则将结果集合中关键词作为集合K,并返回到步骤S1。

技术领域

本发明涉及智能机器技术领域,特别是涉及一种基于知识推理的大数据业务标签的扩展方法及系统。

背景技术

在以业务为中心的企业中,由于各种业务的类型、目的和范围都不相同,如何获取、管理和扩展各种不同的业务标签已成为一个紧迫的问题,具有非常巨大的意义,其中,获取业务标签主要通过简单的关键词提取工具和人工标记,而管理业务标签则主要通过标签分类体系来完成,对于每个体系的标签都各自以标签树的形式进行管理。

扩展业务标签,即扩展业务标签下属的实体(关键词和URL)则是当前最重要的一个任务,目前尚未有成熟的方法,一般采用人工扩展或使用程序进行自动化扩展的方式,但是采取人工扩展的形式,不仅需要消耗巨大的人力资源,而且扩展结果还可能带有较大的主观性;而使用程序进行自动化扩展则面临着扩展逻辑适应性的问题,很多情况下为了适应大量不同的应用场景会导致扩展逻辑会变得极其复杂。

因此,为了使得扩展逻辑通用化,同时避免构建规则时带来的主观性,本发明欲采用结合行业知识图谱进行智能化扩展的方式,利用知识图谱提供的知识与逻辑推理分析能力来解决自动化扩展逻辑中的问题。

发明内容

为克服上述现有技术存在的不足,本发明之目的在于提供一种基于知识推理的大数据业务标签的扩展方法及系统,以实现智能的通用化标签扩展能力,从而大大提高了生产效率,满足各种业务发展的需求。

为达上述目的,本发明提出一种基于知识推理的大数据业务标签的扩展方法,包括如下步骤:

步骤S1,从预设的业务标签树中选中待扩展标签X以及标签下属关键词集合K,并利用搜索引擎搜索每一个关键词,获得结果相关URL集合C;

步骤S2,对每一个关键词kn,遍历集合C中其对应的URL,从每个URL的网页获取文本内容,对文本进行语义分析,抽取与该关键词有关联的语义对象和语义关系,利用预设的知识图谱框架对所有关键词构建语义关系知识图谱;

步骤S3,利用步骤S2构建的语义关系知识图谱,结合预制的本体规则模型,以选中的待扩展标签X为依据,对所述语义关系知识图谱中的实体对象进行校验和筛选,并于完成所有实体的校验后,将通过校验的实体的属性内容以关键字的形式加入到结果集合中;

步骤S4,判断所述结果集合的规模是否达到预设的扩展规模Nmax,若已达到则结束所有步骤,否则将所述结果集合中已有的关键词作为集合K,并返回到步骤S1继续进行。

优选地,于步骤S2中,将文本的每一句单句进行分词和语义标注,构建语法依存树;定位重点词,对所述语法依存树中重点词所在的节点根据词性与语义关联,匹配事件模板进行筛选,将结果导入所述知识图谱框架,得到所述语义关系知识图谱。

优选地,将筛选结果作为“对象-关系-对象/值”形式的候选三元组保存,并导入所述知识图谱框架,得到所述语义关系知识图谱。

优选地,所述知识图谱框架具备业务本体规则模型和同义词库,所述本体规则模型由业务专家构建,框架内的同义词库来自于实际业务知识。

优选地,步骤S3进一步包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理想信息产业(集团)有限公司,未经上海理想信息产业(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010543081.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top