[发明专利]基于法律知识图谱的语义搜索方法、装置和电子设备有效

专利信息
申请号: 202011597968.9 申请日: 2020-12-29
公开(公告)号: CN112632226B 公开(公告)日: 2021-10-26
发明(设计)人: 朵思惟;余梓飞;于锋杰;薛晨云 申请(专利权)人: 天津汇智星源信息技术有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F16/36;G06F40/211;G06F40/216;G06F40/295;G06F40/30;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京风雅颂专利代理有限公司 11403 代理人: 孙晓凤
地址: 300384 天津市滨海新区华苑产*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 法律知识 图谱 语义 搜索 方法 装置 电子设备
【说明书】:

本说明书一个或多个实施例提供一种基于法律知识图谱的语义搜索方法、装置和电子设备。响应于接收到用户输入的法律问题的描述,对所述描述进行预处理;对经过所述预处理的所述描述进行要素提取,所述要素提取包括实体‑关系‑实体三元组的抽取,根据所述实体‑关系‑实体三元组构建语义搜索图,对所述语义搜索图基于法律法规类型建立类别标签,输出带有标签的语义搜索图;将所述语义搜索图与法律知识图谱进行子图匹配,将匹配度高的子图作为法律答案数据。本发明通过对用户问题建立语义网,并结合法律知识图谱进行匹配和推理,能够准确捕捉用户的搜索意图,从而直接给出满足用户搜索意图的答案,实际解决用户的法律问题。

技术领域

本说明书一个或多个实施例涉及知识图谱技术领域,尤其涉及一种基于法律知识图谱的语义搜索方法、装置和电子设备。

背景技术

随着科技的发展,自动化的法律咨询服务在缓解人工法律服务资源不足的问题上发挥着越来越重要的作用。在民众进行法律咨询的过程中,一个高效精准的法律搜索系统可以为民众提供精准、全面的一站式解决方案。

传统的法律搜索系统大多基于检索提问式关键词匹配技术和排序算法,返回的结果主要依据素材中是否存在关键词,无法获知用户搜索语句的真正含义。这往往与用户对结果精准、即得的需求相矛盾。比如当搜索“民事案件类型有哪些?”时,传统搜索系统呈现的是包含关键词“民事”、“案件”等的信息,而用户想要得到的答案实际是“劳动纠纷、人格权纠纷”等信息。

基于此,需要一种能够准确捕捉用户的搜索意图,从而直接给出满足用户搜索意图答案的语义搜索方案。

发明内容

有鉴于此,本说明书一个或多个实施例的目的在于提出一种基于法律知识图谱的语义搜索方法、装置和电子设备,以解决无法准确捕捉用户法律搜索意图的问题。

基于上述目的,本说明书一个或多个实施例提供了一种基于法律知识图谱的语义搜索方法,包括:

响应于接收到用户输入的对法律问题的描述,对所述描述进行预处理;

通过预定的关系抽取模型,从经过预处理的所述描述中提取出实体-关系-实体三元组,以构建语义搜索图;

基于预定的法律法规类型,通过预先建立的分类模型对经过预处理的所述描述进行分类,得到类别标签;

在预先基于法律知识相关文件构建的法律知识图谱中搜索到与所述类别标签对应的目标节点,并将所述法律知识图谱中以所述目标节点为根节点的部分法律知识图谱与所述语义搜索图进行子图匹配,得到一个或多个匹配子图;

输出所述一个或多个匹配子图中的至少一个目标子图作为针对所述描述的法律答案。

进一步的,所述关系抽取模型包括CASREL模型。

进一步的,所述响应于接收到用户输入的对法律问题的描述,对所述描述进行预处理,包括下列中至少一个:

通过正则表达式去除所述描述的标点符号和/或特殊符号;

通过中文分词算法WMSeg对所述描述进行分词;

将所述描述中的繁简字体进行统一化;

通过标准表达方式对所述描述进行同义词归一化;

通过Soft-Masked BERT模型对所述描述进行文本纠错处理。

进一步的,所述通过预定的关系抽取模型,从经过预处理的所述描述中提取出实体-关系-实体三元组,以构建语义搜索图,包括:

基于完整的训练模型BERT对所述描述进行编码,获取所述描述中每个词的特征表示;

对所述特征表示进行解码,构建分类器预测所述实体位置,识别出所述实体对应的主语;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津汇智星源信息技术有限公司,未经天津汇智星源信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011597968.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top