[发明专利]一种基于知识图谱的税务知识库系统在审
申请号: | 202011592779.2 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112613611A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 胡乃庄;邓志勇;黄金 | 申请(专利权)人: | 上海永骁智能技术有限公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06F40/295;G06F40/211;G06F16/36;G06F16/31;G06F16/22;G06F16/28;G06F16/901;G06N3/04 |
代理公司: | 上海中外企专利代理事务所(特殊普通合伙) 31387 | 代理人: | 孙旭华 |
地址: | 200237 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 税务 知识库 系统 | ||
1.一种基于知识图谱的税务知识库系统,数据模块、知识模块以及测试评估模块,其特征在于:所述知识模块包括:知识获取模块、知识融合模块、知识计算模块、知识表示模块、知识构建模块、知识存储模块以及知识运维模块;
所述数据模块具体为:
a)作为知识获取来源,分为结构化数据,半结构化数据,非结构化数据,数据最终的结构为:实体-属性-值;
b)结构化数据,关系型数据库中相关数据;
i.业务:完税证明打印;
ii.属性:包含上游未完成业务;
iii.值:实名认证;
c)半结构化数据,为日志相关,第三方接口数据等其他数据源;
i.半结构化数据中可能只包含实体-属性,实体-值,属性-值;
ii.需要通过数据整合,第三方接口,算法预测等方式进行数据补全;
iii.非结构化数据,需要实体抽取,属性抽取,值预测,值关联等方式进行补全;
iv.实体抽取,属性抽取会在知识获取中介绍。
2.根据权利要求1所述的一种基于知识图谱的税务知识库系统,其特征在于:所述知识获取模块具体为:
a)知识获取作为整个引擎中关键组件,主要完成信息抽,实体识别,关系抽取,属性抽取等功能;
b)税务概念抽取,知识图谱知识库构建的第一步,关键是如何从异构数据中自动抽取信息到候选的知识单元中;
c)实体抽取,采用Bi.LSTM.CRE,模型进行抽取;
i.数据输入:税务语料,爬取的政策,税务报告,资料,书籍;
ii.输出结果:税务业务,税务政策,税务规则;
d)关系抽取,经过实体抽取,会得到一些税务业务实体,但是这些实
体都是离散的,为了得到语义信息,还需要将这些抽取到这些实体之间的关系才能将这些实体联系到一起;
i.关系抽取采用模型四种方式进行Ensemble;
ii.有监督学习方法:对于已知的关系,模型为:Bi-LSTM;
1).输入为:实体语料;
2).输出为:关系;
iii.半监督学习方法:采用BootStrapping进行关系抽取,设定若干种子语料,找到对应的关系;
1).业务:完税证明打印;
2).属性:-包含上游未完成业务;
3).值:-实名认证;
4).找—些和他类似的关系数据,这个种子相当于模板;
iv.无监督方法:采用句法分析,依存分析得到句子的结构性分析结果,在通过关系短语进行抽取;
v.规则抽取方法:
1).设定规则词〔关系词),比如还需要,需要完成,实名认证;
2).检测到规则词,做实体抽取,抽取到相应的业务得到的关系。
3.根据权利要求1所述的一种基于知识图谱的税务知识库系统,其特征在于:所述知识融合模块具体为:知识融合主要是将一些关联的知识图谱,知识库融合到一起的技术。
4.根据权利要求1所述的一种基于知识图谱的税务知识库系统,其特征在于:所述知识计算模块具体为:
a).知识计算主要功能就是进行知识推理,由一个知识如何推理到另外一个知识,推理机制;
b).知识统计,通过统计推断的方式进行推理计算;
c).图计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海永骁智能技术有限公司,未经上海永骁智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011592779.2/1.html,转载请声明来源钻瓜专利网。