[发明专利]一种合同标注方法及装置在审
申请号: | 201910752445.8 | 申请日: | 2019-08-15 |
公开(公告)号: | CN110705225A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 郭于丹;肖丰阳;陈卫 | 申请(专利权)人: | 平安信托有限责任公司 |
主分类号: | G06F40/169 | 分类号: | G06F40/169;G06F40/117;G06N3/04;G06N3/08 |
代理公司: | 11444 北京汇思诚业知识产权代理有限公司 | 代理人: | 冯晓平 |
地址: | 518000 广东省深圳市福田区福田街道益田路5033号平安金融中心27层(东北*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种合同标注方法及装置,本发明涉及人工智能技术领域,方法包括:从每个业务类型的合同中抽取至少一份合同样本,得到初始样本集;基于每个业务类型的合同样本构建并训练初始标注模型;获取预存的各个业务类型的多份合同,并分为样本扩充集和测试集;利用初始标注模型标注样本扩充集中的合同中的合同要素;将标注后的样本扩充集与初始样本集合并为训练样本集,并利用训练样本集优化训练初始标注模型,得到标注模型;将测试集输入标注模型,并获取标注模型输出的测试集中的合同的标注结果;根据测试集的标注结果判断是否需要继续优化标注模型。本发明实施例提供的技术方案能够解决现有技术中合同要素的标注准确率低的问题。 | ||
搜索关键词: | 标注 业务类型 测试集 合同 样本 训练样本集 合同样本 合同要素 人工智能技术 初始样本集 结果判断 样本集合 优化训练 准确率 构建 预存 抽取 测试 输出 优化 | ||
【主权项】:
1.一种合同标注方法,其特征在于,所述方法包括:/n从每个业务类型的合同中抽取至少一份合同样本,得到初始样本集,所述合同样本中包括多个人工标注的合同要素;/n基于每个所述业务类型的合同样本构建并训练初始标注模型;/n获取预存的各个所述业务类型的多份合同,并按照预设的比例分为样本扩充集和测试集;/n利用所述初始标注模型标注所述样本扩充集中的合同中的合同要素;/n将标注后的所述样本扩充集与所述初始样本集合并为训练样本集,并利用所述训练样本集优化训练所述初始标注模型,得到标注模型;/n将所述测试集输入所述标注模型,并获取所述标注模型输出的所述测试集中的合同的标注结果;/n根据所述测试集的标注结果判断是否需要继续优化所述标注模型,直至所述标注模型的标注准确率大于预设值。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安信托有限责任公司,未经平安信托有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910752445.8/,转载请声明来源钻瓜专利网。