[发明专利]合同的风险表述定位方法、装置,计算机设备及存储介质在审
申请号: | 202111464274.2 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114139527A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 徐健;李晓娟;高昊江 | 申请(专利权)人: | 京北方信息技术股份有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/279;G06F40/166 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 高艳红 |
地址: | 100089 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 合同 风险 表述 定位 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了合同的风险表述定位方法、装置,计算机设备及存储介质。该方法包括:获取合同文本,其中,合同文本包括多个文本碎片;根据合同文本,得到合同文本向量,其中,合同文本向量包括多个文本碎片向量,文本碎片向量与文本碎片一一对应;对合同文本向量进行风险分析,获取目标文本碎片向量,其中,目标文本碎片向量为合同文本向量中具有风险表述的文本碎片向量;确定目标文本碎片向量中风险表述的位置。本发明提供的方案能够实现合同内风险表述的智能识别,提高合同审核的效率和准确性。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种合同的风险表述定位方法、装置,计算机设备及存储介质。
背景技术
合同是民事主体之间设立、变更、终止民事法律关系的协议。我国每年签订的各类合同数以亿计,法院每年受理的合同诉讼案件有500万之多,约占总民商事案件的一半以上,因合同纠纷而造成的经济损失超过1万亿元。风险审核是政府和企业规避合同风险的有力武器,合同签订前的风险审核更能有效地避免合同纠纷。
目前,对合同进行风险审核的工作主要依靠人工来进行,需要耗费大量的人力和物力,不仅为相关法律人员带来巨大的工作量,同时也使得整个审核过程的效率下降。对于非专业法律人员来说,去判定一个合同是否有风险更是存在一定困难。
发明内容
本发明提供一种合同的风险表述定位方法、装置,计算机设备及存储介质,能够实现合同内风险表述的智能识别,提高合同审核的效率和准确性。
第一方面,本发明实施例提供了一种合同的风险表述定位方法,包括:
获取合同文本,其中,合同文本包括多个文本碎片;
根据合同文本,得到合同文本向量,其中,合同文本向量包括多个文本碎片向量,文本碎片向量与文本碎片一一对应;
对合同文本向量进行风险分析,获取目标文本碎片向量,其中,目标文本碎片向量为合同文本向量中具有风险表述的文本碎片向量;
确定目标文本碎片向量中风险表述的位置。
可选的,获取合同文本,包括:
获取初始文本,其中,初始文本包括可识别字符、不可识别字符和空格;
去除初始文本中的不可识别字符和空格,得到合同文本;
按每M个可识别字符为一组,将合同文本划分出多个文本碎片,其中,M为正整数。
可选的,根据合同文本,得到合同文本向量,包括:
获取每个文本碎片的词向量序列,其中,词向量的维度为N,N为正整数;
对每个文本碎片的词向量序列进行语义分析,得到每个文本碎片对应的文本碎片向量。
可选的,对合同文本向量进行风险分析,获取目标文本碎片向量,包括:
依次确定每个文本碎片向量是否具有风险表述,并设置每个文本碎片向量的风险标识;
根据每个文本碎片向量的风险标识,确定目标文本碎片向量。
可选的,若文本碎片向量具有风险表述,则文本碎片向量的风险标识为第一标识;若文本碎片向量不具有风险表述,则文本碎片向量的风险标识为第二标识;
相应的,目标文本碎片向量是风险标识为第一标识的文本碎片向量。
可选的,确定目标文本碎片向量中风险表述的位置,包括:
对目标文本碎片向量进行语义分析,确定目标文本碎片向量中每个可识别字符的字符类型,其中,字符类型包括第一类型、第二类型和第三类型,第一类型代表可识别字符是风险表述的开始字符,第二类型代表可识别字符是风险表述的持续字符,第三类型代表可识别字符不是风险表述的字符;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京北方信息技术股份有限公司,未经京北方信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111464274.2/2.html,转载请声明来源钻瓜专利网。