[发明专利]一种合同文本合规性智能检查方法有效
申请号: | 202111540264.2 | 申请日: | 2021-12-16 |
公开(公告)号: | CN113935335B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 胡为民;郑喜 | 申请(专利权)人: | 深圳市迪博企业风险管理技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/35;G06F40/194 |
代理公司: | 北京惟盛达知识产权代理事务所(普通合伙) 11855 | 代理人: | 董鸿柏 |
地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 合同文本 合规 智能 检查 方法 | ||
1.一种合同文本合规性智能检查方法,其特征在于,包括步骤:
S1:预处理,对合同文本进行预处理,构建合同文本语义表征向量;对检查清单进行预处理,构建检查清单语义表征向量;
S2:检查清单标注,根据多份合同文本对应的检查清单,构建海量合同文本数据集,对海量合同文本数据集中检查清单的各检查项进行分类,并且进行标注,得到合同正文检查项标签;根据合同文本语义表征向量和检查清单语义表征向量之间的相关性,构建多标签文本分类模型;
S3:在多标签文本分类模型中进行降维映射,将合同文本语义表征向量映射为合同文本低维特征向量,将检查清单语义表征向量映射为检查清单低维特征向量;
S4:在多标签文本分类模型中为合同文本低维特征向量添加字符位置编码,根据合同文本低维特征向量中的字符位置进行编码,得到新的合同文本低维特征向量;
S5:在多标签文本分类模型中提取合同文本语义信息,根据合同正文检查项标签对多标签文本分类模型进行有监督训练,在训练后的多标签文本分类模型中输入新的合同文本低维特征向量至多层全连接网络进行线性变换,得到多个全连接层特征向量,并根据多个全连接层特征向量计算自注意力相关性,得到合同文本语义特征向量;
S6:在多标签文本分类模型中计算合同文本与检查清单之间的相关性,将合同文本语义特征向量经过全连接网络进行线性变换,得到合同文本变换向量;将检查清单低维特征向量经过单全连接网络进行线性变换,得到检查清单变换向量;根据合同文本变换向量和检查清单变换向量进行计算,得到合同文本与检查清单之间的相关性;
S7:在多标签文本分类模型中计算合同文本合规性概率,根据合同文本与检查清单之间的相关性,得到合同文本合规概率,若概率大于阈值,则合同文本合规,否则合同文本不合规。
2.根据权利要求1所述的一种合同文本合规性智能检查方法,其特征在于,S1中,构建合同文本语义表征向量和检查清单语义表征向量的具体步骤为:
通过独热编码对合同文本进行预处理,采用GB2312编码,将合同文本的字符在GB2312编码中对应的序号索引数值设为1,其余数值为0,构建合同文本语义表征向量,记为,所述合同文本语义表征向量的尺寸为(
通过独热编码对检查清单进行预处理,采用GB2312编码,将检查清单的检查项在GB2312编码中对应的序号索引数值设为1,其余数值为0,构建检查清单语义表征向量,记为,所述检查清单语义表征向量的尺寸为(
3.根据权利要求2所述的一种合同文本合规性智能检查方法,其特征在于,S2中,得到所述合同正文检查项标签的具体步骤为:
对于S1中的检查清单包含多个检查项,多个检查项存在合规、不合规两种分类,采用独热编码,将合规的检查项编码为1,不合规的编码为0,对编码后的检查项进行标签标注,得到合同正文检查项标签,所述合同正文检查项标签为向量,记为
4.根据权利要求3所述的一种合同文本合规性智能检查方法,其特征在于,S3中,进行降维映射的具体步骤为:
将合同文本语义表征向量进行一维宽卷积运算,映射为合同文本低维特征向量,所述合同文本低维特征向量的尺寸为(
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市迪博企业风险管理技术有限公司,未经深圳市迪博企业风险管理技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111540264.2/1.html,转载请声明来源钻瓜专利网。