[发明专利]合同条款风险智能识别方法、装置、电子设备及存储介质在审
申请号: | 202011302890.3 | 申请日: | 2020-11-19 |
公开(公告)号: | CN112232088A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 徐健;高昊江;杨飞 | 申请(专利权)人: | 京北方信息技术股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06K9/00;G06K9/62;G06N3/08;G06Q10/06;G06Q50/18 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100089 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 合同条款 风险 智能 识别 方法 装置 电子设备 存储 介质 | ||
1.一种合同条款风险识别方法,其特征在于,应用于合同法律风险审批领域,包括:
获取待识别的合同条款文本,将所述待识别的合同条款文本转换为文本序列;
基于条款风险识别模型对所述文本序列进行风险识别,得到所述条款风险识别模型输出的条款风险识别结果,其中,所述条款风险识别模型包括依次设置的文本序列处理网络层、语义关系提取网络层、语义特征提取网络层和风险分类网络层。
2.根据权利要求1所述的方法,其特征在于,所述将所述待识别的合同条款文本转换为文本序列,包括:
对所述待识别的合同条款文本进行预处理,其中,所述预处理包括去除合同条款文本中的不可读字符与空格;
将预处理后的合同条款文本进行文本令牌序列转换处理,并在转换得到的初始文本序列的起始位置添加文本任务标识,生成所述合同条款文本对应的文本序列,其中,所述文本序列公式表述为:Tokenseq=Concat(Tokentask,Tokeninput);其中,Tokenseq表示所述合同条款完整的文本序列;Tokentask表示所述合同条款的识别任务标识;Tokeninput表示所述合同条款的文本内容。
3.根据权利要求1所述的方法,其特征在于,所述获取待识别的合同条款文本,包括:
获取待识别的合同文本,并对所述合同文本中的合同条款进行拆分,确定所述合同文本中的各待识别的合同条款文本。
4.根据权利要求1所述的方法,其特征在于,所述基于条款风险识别模型对所述文本序列进行风险识别,包括:
基于所述文本序列处理网络层确定输入的文本序列中的各文本令牌对应的至少一个词向量,得到所述文本序列对应的词向量序列;
基于所述语义关系提取网络层提取所述词向量序列中各词向量之间的语义关系,生成第一语义向量序列;
基于所述语义特征提取网络层对所述第一语义向量序列进行非线性处理,得到第二语义向量序列;
基于所述风险分类网络层对所述第一语义向量序列和所述第二语义向量序列进行风险识别,得到所述条款风险识别结果。
5.根据权利要求4所述的方法,其特征在于,所述基于所述风险分类网络层对所述第一语义向量序列和所述第二语义向量序列进行风险识别,得到所述条款风险识别结果,包括:
基于第一公式对所述第一语义向量序列和所述第二语义向量序列的和进行归一化处理,其中,所述第一公式为:其中,x表示本层归一化函数的输入;μ表示输入的平均值;σ表示输入的标准差;
基于所述风险分类网络层对归一化结果进行风险识别,得到所述条款风险识别结果,其中,所述识别结果为:其中,n表示风险类别的数量;xi表示第i维输入;xj表示第j维输入。
6.根据权利要求1所述的方法,其特征在于,所述条款风险识别模型的训练方法包括:
获取用于模型训练的历史合同条款,并确定各历史合同条款的风险标签,其中,历史合同条款包括正样本合同条款和负样本合同条款;
基于各所述历史合同条款对待训练的条款风险识别模型进行如下迭代训练,直到迭代训练的条款风险识别模型满足预设条件,得到训练完成的条款风险识别模型:
将任一历史合同条款输入至对待训练的条款风险识别模型,得到所述历史合同条款的风险预测结果;
基于所述风险预测结果和所述历史合同条款的风险标签生成损失函数,并基于所述损失函数对所述待训练的条款风险识别模型进行参数调节。
7.根据权利要求1所述的方法,其特征在于,所述条款风险识别结果包括:风险条款和无风险条款;
所述在得到所述条款风险识别模型输出的条款风险识别结果之后,还包括:
根据各合同条款文本的条款风险识别结果在待识别合同文本对各合同条款文本进行区别显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京北方信息技术股份有限公司,未经京北方信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011302890.3/1.html,转载请声明来源钻瓜专利网。