[发明专利]基于法律知识图谱的智能识别系统在审
申请号: | 201910666119.5 | 申请日: | 2019-07-23 |
公开(公告)号: | CN110348024A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 余梓飞;张程华;刘双勇 | 申请(专利权)人: | 天津汇智星源信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04 |
代理公司: | 天津诺德知识产权代理事务所(特殊普通合伙) 12213 | 代理人: | 王同胜 |
地址: | 301700 天津市武清区京津科技谷产*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 词向量 候选实体 图谱 模型训练模块 智能识别系统 表征模块 法律知识 情感识别 实体标签 问题描述语句 自然语言处理 语义 表征模型 模块获取 人工成本 实体识别 用户情感 智能识别 法律 融合 | ||
本发明涉及基于法律知识图谱的智能识别系统,属于知识图谱和自然语言处理等技术与法律融合的领域,包括词向量表征模块,模型训练模块,标注问句模块,获取候选实体集模块和情感识别模块,其中,词向量表征模块是采用Skip‑gram模型来进行所述词向量表征模型训练;模型训练模块是利用tensorflow对实体识别模型开始训练;标注问句模块是利用词向量提取用户问句特征,并输入训练好的模型中,得到模型标注后的问句序列;获取候选实体集模块是通过标注问句模块获取问句序列中标注的实体标签,再通过实体标签获得候选实体名称;情感识别模块是从与用户的问题描述语句中提取用户情感。本发明可大幅度减少人工成本,增加智能识别法律语义的速度。
技术领域
本发明涉及基于法律知识图谱的智能识别系统,属于知识图谱和自然语言处理等技术与法律融合的技术领域。
背景技术
知识图谱技术日益成为人工智能的基础,它是机器理解自然语言和构建知识网络的重要方法。近年来,知识图谱在司法领域的运用悄然兴起,它帮助从业人员快速地在线检索相关的法务内容,从而提高法院审判工作质量和效率。目前存在的自动法律问答系统是基于全文检索技术或者深度学习语义匹配技术来实现,往往不能真正理解用户真实的法律诉求,解决不了用户法律方面的问题,实用性差。
人工智能时代,人们期待像科幻电影中那样简单直接地与机器进行交互。这也是以自然语言为交互方式的智能机器人、智能个人助理系统备受用户和一线互联网公司青睐的原因。随着大数据时代的来临,互联网上每时每刻都在产生着包括文字、图片、视频在内的海量法律数据。这些法律数据在给人们获取信息带来了便利的同时,也存在海量的无效和错误的法律条例极大地干扰着人们去获取需要的信息,而这可能会造成国民对司法常识的误知。
搜索引擎作为互联网时代人们获取信息的主要窗口,已经越来越难以满足人们的需求。现有的法律知识图谱的智能识别系统主要是基于规则、排序等思想,往往不能真正理解用户真实的法律诉求,解决不了用户法律方面的问题,实用性差。常用的RNN虽然在时序模型中提取文本特征上有很大的优势,但梯度消失和梯度爆炸问题会导致句子过长时模型的拟合表现变差。并且缺乏对法律常识的语义分析和语义理解,这是机器理解和人类自然语言表达的天然隔阂。这个过程操作也相对繁琐,返回的网页结果无论是按相关程度还是时间排序,都无法给予用户完全准确的答案,需要消耗大量人力与时间去进行筛选并剔除无关的法律信息,造成了大量资源的浪费和消耗。
发明内容
针对现有的法律知识图谱的智能识别系统缺乏对法律常识的语义分析和语义理解,过程操作相对繁琐,无法给予用户完全准确的答案,且需要消耗大量人力与时间去进行筛选并剔除无关的法律信息的技术问题。基于法律知识图谱的智能识别系统采用知识图谱、自然语言处理和深度学习等领域的技术,使用基于序列标注的思想来充分利用上下文信息定位问句的候选实体位置,从而达到大幅度减少人工成本,增加了智能识别法律语义的速度的目的。
为了实现上述目的,本发明所采用的技术方案包括:
基于法律知识图谱的智能识别系统,包括词向量表征模块,模型训练模块,标注问句模块,获取候选实体集模块和情感识别模块,其中:
词向量表征模块:采用Skip-gram模型来进行所述词向量表征模型训练,依次包括构建实体词典、构建构体识别标注集模块和词向量输入模块;
模型训练模块:利用tensorflow对实体识别模型开始训练;
标注问句模块:利用词向量提取用户问句特征,并输入训练好的模型中,得到模型标注后的问句序列;
获取候选实体集模块:所述获取候选实体集是通过所述标注问句模块获取所述问句序列中标注的实体标签,再通过所述实体标签获得候选实体名称;
情感识别模块:采用情感识别技术,从与用户的问题描述语句中提取用户情感。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津汇智星源信息技术有限公司,未经天津汇智星源信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910666119.5/2.html,转载请声明来源钻瓜专利网。