[发明专利]基于人工智能的合同关键条款提取方法、装置及存储介质有效
申请号: | 201910873470.1 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110765765B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 侯丽 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/289;G06F18/22;G06N3/0464;G06N3/08;G06Q50/18 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 合同 关键 条款 提取 方法 装置 存储 介质 | ||
1.一种基于人工智能的合同关键条款提取方法,其特征在于,所述方法包括:
接收合同文本,对所述合同文本进行去停用词和分词的预处理操作,得到标准合同文本;
利用关键词提取算法提取出所述标准合同文本中的关键词集,并将所述关键词集转换为词向量集,得到关键词向量集;
从合同条款信息库中获取预先确定的关键合同条款的文本集,并将所述关键合同条款的文本集转换为文本词向量集;
将所述关键词向量集与所述文本词向量集输入至预先构建的智能合同关键条款提取模型中,得到所述关键词向量集与所述文本词向量集的相似度集,当所述相似度集中存在大于预设阈值的相似度时,将对应的关键词向量作为所述合同文本的关键条款,并通过所述智能合同关键条款提取模型的输出层输出所述关键条款,并以预设方式突出显示所述关键条款,完成所述合同文本关键条款的提取。
2.如权利要求1所述的基于人工智能的合同关键条款提取方法,其特征在于,所述对所述合同文本进行去停用词和分词的预处理操作,得到标准合同文本,包括:
通过预先构建好的停用词表和所述合同文本中的字词进行一一匹配,得到所述合同文本中的停用词,并将所述停用词删除;
通过预设的匹配策略将去停用词后的所述合同文本中的字词与词典中的词条进行匹配,得到去停用词后的所述合同文本集的特征词,并将所述特征词用空格符号隔开,从而得到所述标准合同文本。
3.如权利要求2所述的基于人工智能的合同关键条款提取方法,其特征在于,所述利用关键词提取算法提取出所述标准合同文本中的关键词集,包括:
计算所述标准合同文本中任意两个特征词Wi和Wj的依存关联度:
其中,Dep(Wi,Wj)表示所述特征词Wi和Wj的依存关联度,len(Wi,Wj)表示所述特征词Wi和Wj之间的依存路径长度,b是超参数;
计算所述特征词Wi和Wj的引力:
其中,fgrav(Wi,Wj)表示特征词Wi和Wj的引力,tfidf(Wi)表示特征词Wi的TF-IDF值,tfidf(Wj)表示特征词Wj的TF-IDF值,TF表示词频,IDF表示逆文档频率指数,d是特征词Wi和Wj的词向量之间的欧式距离;
根据所述依存关联度和所述引力得到所述特征词Wi和Wj之间的关联强度为:
weight(Wi,Wj)=Dep(Wi,Wj)*fgrav(Wi,Wj)
根据所述关联强度计算出所述特征词Wi的重要度得分:
其中,是与顶点Wi有关的集合,η为阻尼系数;
根据所述特征词的重要度得分,从而得到所述标准合同文本中的关键词集。
4.如权利要求1至3中任意一项所述的基于人工智能的合同关键条款提取方法,其特征在于,所述将所述关键词向量集与所述文本词向量集输入至预先构建的智能合同关键条款提取模型中,得到所述关键词向量集与所述文本词向量集的相似度集,包括:
通过所述智能合同关键条款提取模型中的卷积层对所述关键词向量集与所述文本词向量集进行降维处理;
利用所述智能合同关键条款提取模型中的池化层对降维处理后的所述标关键词向量集与所述文本词向量集进行特征向量的提取;
通过所述智能合同关键条款提取模型中的全连接层计算提取特征向量后的所述关键词向量集与所述文本词向量集之间的相似度,从而得到所述相似度集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910873470.1/1.html,转载请声明来源钻瓜专利网。