[发明专利]一种基于意图识别及孪生网络的中文法律问答系统在审
申请号: | 202110639278.3 | 申请日: | 2021-06-08 |
公开(公告)号: | CN113326364A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 范会心;张红英 | 申请(专利权)人: | 范会心 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06Q50/18;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 意图 识别 孪生 网络 中文 法律 问答 系统 | ||
1.一种基于意图识别及孪生网络的中文法律问答系统,包括爬虫获取原始语料数据(1)与建立反反爬虫机制(20),其特征在于:所述爬虫获取原始语料数据(1)连接于标签建立(2),所述标签建立(2)连接于标签修正(3)以及法律问答数据库(10),所述法律问答数据库(10)分别连接于意图识别(5)以及答案匹配(4),所述答案匹配(4)连接于1:4负采样(6),所述1:4负采样(6)连接于训练孪生预训练网络(7),所述预训练网络(7)连接于fine-tune预训练模型(8),所述fine-tune预训练模型(8)连接于问句bertfine-tune文本表示(9),所述问句bertfine-tune文本表示(9)连接于法律问答数据库(10)。
2.根据权利要求1所述的一种基于意图识别及孪生网络的中文法律问答系统,其特征在于:所述建立反反爬虫机制(20)设置连接UA伪装(22)、动态IP(23)以及使用代理(21)。
3.根据权利要求1所述的一种基于意图识别及孪生网络的中文法律问答系统,其特征在于:所述建立反反爬虫机制(20)包括网站分析(13),所述网站分析(13)连接于设定url(14),所述设定url(14)连接于发送requests请求(15),所述requests请求(15)连接于获得response响应(16),所述response响应(16)连接于soup解析响应内容(17),所述soup解析响应内容(17)连接于过滤无效数据(18),所述过滤无效数据(18)连接于插入数据库表(19),所述插入数据库表(19)连接于法律问答数据库(10),所述建立反反爬虫机制(20)还设置有连接数据库(11),所述连接数据库(11)连接于新建表及迭代对象(12),所述新建表及迭代对象(12)连接于法律问答数据库(10)。
4.根据权利要求1所述的一种基于意图识别及孪生网络的中文法律问答系统,其特征在于:所述爬虫获取原始语料数据(1)设置为通过爬虫获取互联网中法律问答对数据,进行清洗、筛选后形成法律问答原始语料。
5.根据权利要求1所述的一种基于意图识别及孪生网络的中文法律问答系统,其特征在于:所述问句bertfine-tune文本表示(9)连接于法律问答数据库(10),通过计算余弦相似度计算用户新问题与语料库中问题的相似程度,返回相似度最高的问题对应的答案作为用户法律问题的最终答案。
6.根据权利要求1所述的一种基于意图识别及孪生网络的中文法律问答系统,其特征在于:所述答案匹配(4)通过bert预训练模型对法律问句进行文本表示。
7.根据权利要求1所述的一种基于意图识别及孪生网络的中文法律问答系统,其特征在于:所述意图识别(5)通过TextRCNN网络对法律问题进行分类实现对法律问题的意图识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于范会心,未经范会心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110639278.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防止基坑边坡裂缝变形扩大的方法
- 下一篇:一种齿轮干切设备及齿轮干切工艺