[发明专利]一种可解释的法律争议焦点归纳方法与系统在审
申请号: | 202110982983.3 | 申请日: | 2021-08-25 |
公开(公告)号: | CN113868414A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 邓蔚;刘永聪;赵晨曦;刘新星;曹雅筠;高垒;查金豆 | 申请(专利权)人: | 成都纬创立科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/126;G06F40/289;G06Q50/18;G06N3/04 |
代理公司: | 成都立新致创知识产权代理事务所(特殊普通合伙) 51277 | 代理人: | 刘俊 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可解释 法律 争议 焦点 归纳 方法 系统 | ||
1.一种可解释的法律争议焦点归纳方法,其特征在于:所述归纳方法包括:
S1、设定一定长度的切片序列,通过切片序列对原始文本进行文本分词和字符转化处理;
S2、使用BERT预测模型对经过处理的文本信息进行编码处理;
S3、采用注意力机制对经过编码处理后的向量进行权重分配,得到综合向量;
S4、将向量输入到全连接Sigmoid层,经过其中的linear层,得到维度大小为1×n的输出向量,并将输出向量进行Sigmoid处理得到Probability向量;
S5、对各个类别的争议焦点进行预测,输出每个类别为正的概率,得到焦点归纳结果。
2.根据权利要求1所述的一种可解释的法律争议焦点归纳方法,其特征在于:所述设定一定长度的切片序列,通过切片序列对原始文本进行文本分词和字符转化处理包括:
S11、以token为单位将原始文本切分为一个个字并保存到列表中,在列表开头添加特殊字符[CLS],并用字符[UNK]代替字典中没有包含的字;
S12、设定切片序列最大长度为n,对列表长度大于n的列表直接进行切片,对列表长度小于n的列表末尾不断添加字符[PAD],直到该列表长度为n后进行切片;
S13、将进行切片后列表中的每个字转换为其对应在字典中的顺序号。
3.根据权利要求1所述的一种可解释的法律争议焦点归纳方法,其特征在于:所述使用BERT预测模型对经过处理的文本信息进行编码处理包括:通过双向的Transformer对上下文信息进行特征提取,将经过处理后的数据传入BERT预测模型对数据进行编码,每一个token都对应输出编码了token上下文信息的向量T,实现对token含义的向量化表示。
4.根据权利要求1所述的一种可解释的法律争议焦点归纳方法,其特征在于:所述采用注意力机制对经过编码处理后的向量进行权重分配,得到综合向量包括:
S31、对除了开头的特殊字符[CLS]外的BERT编码输出向量T进行非线性激活,得到激活矩阵T^';
S32、将随机初始化的可学习矩阵W与激活矩阵T^'相乘,得到N-1长度的向量,并对这个向量进行Softmax处理使其成为总和为1的权重向量A,将权重向量A与激活矩阵T^'的每一行计算内积,得到综合了文本内容的向量C^'。
5.根据权利要求1所述的一种可解释的法律争议焦点归纳方法,其特征在于:所述归纳方法还包括在对原始文本进行处理之前的构建BERT预测模型的步骤;所述构建BERT预测模型的步骤包括:
构建由BERT编码层、注意力层和全连接Sigmoid层组成的BERT预测模型;
设置模型的网络参数L=12,表示Transformer层数、H=768,表示Transformer内部维度、A=12,表示Heads的数量;
并利用中国裁判文书网中的所有民事法律文书来对BERT模型的网络参数进行预训练。
6.一种可解释的法律争议焦点归纳系统,其特征在于:它包括预测模型构建模块、原始文本处理模块、文本信息编码模块、权重向量生成模块、全连接Sigmoid层处理模块和预测模块;
所述预测模型构建模块用于构建由BERT编码层、注意力层和全连接Sigmoid层组成的BERT预测模型;
所述原始文本处理模块用于对原始文本进行处理,进行文本分词和字符转化;
所述文本信息编码模块用于通过BERT预测模型的BERT编码层对进行所述原始文本处理模块后的信息进行编码处理;
所述权重向量生成模块用于使用注意力机制对BERT编码模块的输出向量分配权重;
所述全连接Sigmoid层处理模块用于将向量传入Linear层,得到输出向量,将输出向量进行Sigmoid处理,得到Probability向量;
所述预测模块用于对各个类别的争议焦点进行预测,输出每个类别为正的概率,得到焦点归纳结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都纬创立科技有限公司,未经成都纬创立科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110982983.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种方便移动的空压机
- 下一篇:二次回路信号检测系统