[发明专利]自动合同审查方法、装置、介质以及电子设备有效
申请号: | 201910185697.7 | 申请日: | 2019-03-12 |
公开(公告)号: | CN110110320B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 鄢真;刘建;刘玉强;金明;李雯;叶素兰 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06V30/416;G06N20/00;G06Q10/10 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 合同 审查 方法 装置 介质 以及 电子设备 | ||
本公开是关于一种自动合同审查方法、装置、介质以及电子设备,属于机器学习应用技术领域,该方法包括:接收到目标类别的合同的审查指令,获取所述目标类别的合同的文本;定位到所述合同的文本中多个一级标题和各一级标题下的子标题;根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段;将所述合同的类别、一级标题、子标题和文本段的作为输入数据输入预先训练好的机器学习模型,得到所述文本段的审查结果。本公开利用合同主要特征要素训练机器学习模型,实现自动对合同文本段的审查,有效提高了审查的效率和准确率。
技术领域
本公开涉及机器学习应用技术领域,具体而言,涉及一种自动合同审查方法及装置。
背景技术
合同审查是指对各种合同、协议、履约凭证、函件等法律文件进行审查,进行合同审查时,通常对合同文件内的所有内容根据法律法规和规章制度进行判断是否违规等,例如,文件内容是否符合有关法律法规和监管规定,相关权利义务约定是否明确合理;公司的权益是否得到充分的保护,是否存在不利于公司权益的问题;文件涉及的法律要素是否齐全,是否违反有关法律法规的禁止性规定,是否符合相关监管规定。
目前,对合同的审核主要是人工进行,对文本中的每一段根据审查员的知识积累,审查经验进行判断分析,需要花费大量的时间,不仅效率低,而且容易受到各种外界因素的影响;所以一种可以自动对合同中的文本段进行审查的方法和装置意义重大,可以有效提高审查的准确率和效率,降低审核人员的工作负荷。
因此,需要提供一种自动合同审查方法及装置。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种自动合同审查方案,进而至少在一定程度上在减少审查人员的工作负荷的情况下,自动、准确、高效的实现合同的审核。
根据本公开的一个方面,提供一种自动合同审查方法,包括:
接收到目标类别的合同的审查指令,获取所述目标类别的合同的文本;
定位到所述合同的文本中多个一级标题和各一级标题下的子标题;
根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段;
将所述合同的类别、一级标题、子标题和文本段的作为输入数据输入预先训练好的机器学习模型,得到所述文本段的审查结果。
在本公开的一种示例性实施例中,所述获取所述目标类别的合同的文本,包括:
获取目标类别的合同的扫描图像;
利用光学字符识别从所述扫描图像中识别出所述目标类别的合同的文本。
在本公开的一种示例性实施例中,所述定位到所述合同的文本中多个一级标题和各一级标题下的子标题,包括:
获取目标类别的合同的合同模板,所述合同模板含有一级标题的位置信息和各一级标题下的各子标题位置信息;
利用多个所述一级标题的位置信息,定位合同的文本中的所述多个一级标题;
根据所述多个一级标题的定位结果和各一级标题下各子标题位置信息,定位所述合同的文本中各一级标题下的各子标题。
在本公开的一种示例性实施例中,所述根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段,包括:
利用所述子标题位置信息指向的位置后的第一个空位符和空位符后的第一个句号,获取该空位符和空位符后的第一个句号之间的第一文本段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910185697.7/2.html,转载请声明来源钻瓜专利网。