[发明专利]一种基于意图识别及孪生网络的中文法律问答系统在审
申请号: | 202110639278.3 | 申请日: | 2021-06-08 |
公开(公告)号: | CN113326364A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 范会心;张红英 | 申请(专利权)人: | 范会心 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06Q50/18;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 意图 识别 孪生 网络 中文 法律 问答 系统 | ||
本发明公开了一种基于意图识别及孪生网络的中文法律问答系统,包括爬虫获取原始语料数据与建立反反爬虫机制,所述爬虫获取原始语料数据连接于标签建立,所述标签建立连接于标签修正以及法律问答数据库,所述建立反反爬虫机制设置连接UA伪装、动态IP以及使用代理,所述爬虫获取原始语料数据1设置为通过爬虫获取互联网中法律问答对数据,进行清洗、筛选后形成法律问答原始语料,通过计算余弦相似度计算用户新问题与语料库中问题的相似程度,返回相似度最高的问题对应的答案作为用户法律问题的最终答案,答案匹配通过bert预训练模型对法律问句进行文本表示意图识别通过TextRCNN网络对法律问题进行分类实现对法律问题的意图识别。
技术领域
本发明属于相关问答系统技术领域,具体涉及一种基于意图识别及孪生网络的中文法律问答系统。
背景技术
社会的发展离不开法律的制衡,这个时代是一个法制的时代。随着法治社会脚步的加快与人工智能的不断发展,数字智能高效的法律服务成为人民的需求。近年来,随着深度学习的发展,法律智能也在如火如荼地发展中。最高人民法院与最高人民检察院提出“智慧法院”与“智慧检务”建设规划,旨在促进法律人员的需求与软件程序设计进行深度融合。法律智能问答系统不但能够为广大群众提供日常问题的解答,而且能够提高专业人士的工作效率,减少不必要工作量。在为专业人士提供参考意见的同时,也为需要寻求法律援助的人群提供前期的法律援助与法律指导。目前的法律问答讲解均是人工服务,人工服务需要经常进行简单且重复的回答,效率低。因此需要一种为用户提供服务的智能问答系统,提高服务效率。
问答系统作为自然语言处理问题占据着重要席位。基于深度学习的问答系统是当前自然语言处理在实际工业生产生活中的重要应用,如阿里小蜜、天猫精灵、苹果siri等都是其具体实现。现有的问答系统大多为闲聊或对话形式、缺少在具体领域的专业应用。当前,已有多家专注于面向广大人民群众的法律应用平台,但各平台在智能处理方面仍有很大提升空间,法律智能问答系统能够促进法律应用平台智能化发展。近年,随着神经网络的复杂度越来越高,问答系统开始发展,国内互联网公司开始应用其开展智能客服服务。但现有的问答系统多是用于百科问答或简单对话,缺少对于垂直行业问答系统的设计。因此,在法律领域开展问答系统的研究对解决专业领域问题存在巨大的研究价值,法律智能问答将促进新时代智慧法院的发展。
发明内容
本发明的目的在于提供一种基于意图识别及孪生网络的中文法律问答系统,以解决上述背景技术中提出的现有的问答系统大多为闲聊或对话形式、缺少在具体领域的专业应用等问题。
为实现上述目的,本发明提供如下技术方案:
一种基于意图识别及孪生网络的中文法律问答系统,包括爬虫获取原始语料数据与建立反反爬虫机制,其特征在于:所述爬虫获取原始语料数据连接于标签建立,所述标签建立连接于标签修正以及法律问答数据库,所述法律问答数据库分别连接于意图识别以及答案匹配,所述答案匹配连接于1:4负采样,所述1:4负采样连接于训练孪生预训练网络,所述预训练网络连接于fine-tune预训练模型,所述fine-tune预训练模型连接于问句bertfine-tune文本表示,所述问句bertfine-tune文本表示连接于法律问答数据库。
优选的,所述建立反反爬虫机制设置连接UA伪装、动态IP以及使用代理。
优选的,所述建立反反爬虫机制包括网站分析,所述网站分析连接于设定url,所述设定url连接于发送requests请求,所述requests请求连接于获得response响应,所述response响应连接于soup解析响应内容,所述soup解析响应内容连接于过滤无效数据,所述过滤无效数据连接于插入数据库表,所述插入数据库表连接于法律问答数据库,所述建立反反爬虫机制还设置有连接数据库,所述连接数据库连接于新建表及迭代对象,所述新建表及迭代对象连接于法律问答数据库。
优选的,所述爬虫获取原始语料数据设置为通过爬虫获取互联网中法律问答对数据,进行清洗、筛选后形成法律问答原始语料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于范会心,未经范会心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110639278.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防止基坑边坡裂缝变形扩大的方法
- 下一篇:一种齿轮干切设备及齿轮干切工艺