[发明专利]基于人工智能的合同关键条款提取方法、装置及存储介质有效
申请号: | 201910873470.1 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110765765B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 侯丽 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/289;G06F18/22;G06N3/0464;G06N3/08;G06Q50/18 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 合同 关键 条款 提取 方法 装置 存储 介质 | ||
本发明涉及一种人工智能技术,揭露了一种基于人工智能的合同关键条款提取方法,包括:接收合同文本,对所述合同文本进行预处理操作,得到标准合同文本,提取所述标准合同文本中的关键词集,将所述关键词集转换为词向量集,得到关键词向量集;获取预先确定的关键合同条款的文本集,将所述文本集转换为文本词向量集;将所述关键词向量集与所述文本词向量集输入至预先构建的智能合同关键条款提取模型中,得到所述关键词向量集与所述文本词向量集的相似度集,当所述相似度集中存在大于预设阈值的相似度时,将对应的关键词向量作为所述合同文本的关键条款。本发明还提出一种基于人工智能的合同关键条款提取装置以及一种计算机可读存储介质。本发明实现了合同关键条款的高效提取。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的合同关键条款提取方法、装置及存储介质。
背景技术
随着网络时代的到来,在线合同文本开始涌现且其数量每天仍在急剧增加,面对如此浩大的合同文本的信息资源,有效地提取所述合同文本的关键条款显得十分重要。而在当前的商业合同中,其合同条款众多,但大多数都是格式化或者模板化的条款,对于合同中的重要信息条款没有突出显示,不利于合同的理解和认知。因此如何更高效地对合同文本的关键条款进行提取成为当今一大难题。
发明内容
本发明提供一种基于人工智能的合同关键条款提取方法、装置及存储介质,其主要目的在于当用户在进行合同关键条款提取时,给用户呈现高效的提取结果。
为实现上述目的,本发明提供的一种基于人工智能的合同关键条款提取方法,包括:
接收合同文本,对所述合同文本进行去停用词和分词的预处理操作,得到标准合同文本;
利用关键词提取算法提取出所述标准合同文本中的关键词集,并将所述关键词集转换为词向量集,得到关键词向量集;
从合同条款信息库中获取预先确定的关键合同条款的文本集,并将所述关键合同条款的文本集转换为文本词向量集;
将所述关键词向量集与所述文本词向量集输入至预先构建的智能合同关键条款提取模型中,得到所述关键词向量集与所述文本词向量集的相似度集,当所述相似度集中存在大于预设阈值的相似度时,将对应的关键词向量作为所述合同文本的关键条款,并通过所述智能合同关键条款提取模型的输出层输出所述关键条款,并以预设方式突出显示所述关键条款,完成所述合同文本关键条款的提取。
可选地,所述对所述合同文本进行去停用词和分词的预处理操作,得到标准合同文本,包括:
通过预先构建好的停用词表和所述合同文本中的字词进行一一匹配,得到所述合同文本中的停用词,并将所述停用词删除;
通过预设的匹配策略将去停用词后的所述合同文本中的字词与词典中的词条进行匹配,得到去停用词后的所述合同文本集的特征词,并将所述特征词用空格符号隔开,从而得到所述标准合同文本。
可选地,所述利用关键词提取算法提取出所述标准合同文本中的关键词集,包括:
计算所述标准合同文本中任意两个特征词Wi和Wj的依存关联度:
其中,Dep(Wi,Wj)表示所述特征词Wi和Wj的依存关联度,len(Wi,Wj)表示所述特征词Wi和Wj之间的依存路径长度,b是超参数;
计算所述特征词Wi和Wj的引力:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910873470.1/2.html,转载请声明来源钻瓜专利网。