[发明专利]一种基于语义相似度的类案推荐方法有效
申请号: | 202111019717.7 | 申请日: | 2021-09-01 |
公开(公告)号: | CN113688635B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 李佳静;郝亚鑫;尤红艳;张鑫洁;王鹏;贺翔;聂福回 | 申请(专利权)人: | 中国矿业大学(北京) |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F18/241;G06F18/22;G06F16/33;G06Q50/18 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱桢荣 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 相似 推荐 方法 | ||
本发明公开了一种基于语义相似度的类案推荐方法,具体如下:1,获得法律文书,得到案件文本;2,将预处理后的案件文本划分,形成案件样本集合;3,用案件样本集合训练文本分类模型;4,计算案件样本集合中两个案件文本的事实描述的语义相似度,从而生成语义相似度样本集合;5,采用语义相似度样本集合训练语义相似度计算模型;6,获得用户输入的查询文本,进行预处理;7,使用步骤3中的文本分类模型对预处理后的查询文本进行分类;8,根据步骤7的分类结果,使用步骤5生成的模型计算查询文本与对应类别中的案件文本的相似度,并推荐相似度数值最高的若干案件文本。本方法能够在没有法律专家知识的情况下有效地查询相似案件。
技术领域
本发明涉及人工智能技术领域,特别是一种基于语义相似度的类案推荐方法。
背景技术
随着数字化存储的法律案件文本数量的激增,法务工作者和普通大众可以更轻松的对这些资料进行查阅,但从这些文本中检索到有用的信息也会耗费大量时间,因此设计算法准确地查找信息非常有意义,相似案例推荐就是其中很重要的一环。
类案推荐作为司法智能化的主要基础任务之一,其能够在一定程度上辅助量刑决策、规范裁判标准。目前的类案推荐方法,大多数需要法律专家的参与,对各种不同类型的案件标记出其中的事实要素和结果要素等,因此只能针对特定的应用场景。同时人工划分的相似度依赖于专家的经验,可能存在不准确的情况。因此需要一种能针对不同应用场景的方法,在没有法律专家的知识时也能够进行类案推荐。
发明内容
本发明所要解决的技术问题是克服现有技术的不足而提供一种基于语义相似度的类案推荐方法,本方法对于用户给出的案件描述或者导入的裁判文书,在裁判文书库中进行检索,将检索到的类似案例按照文本语义的相似程度进行排序,并展示给用户。
本发明为解决上述技术问题采用以下技术方案:
根据本发明提出的一种基于语义相似度的类案推荐方法,包括以下步骤:
步骤1、获得多个法律文书,进一步得到其中的案件文本;
步骤2、对案件文本进行预处理,并进一步对预处理后的案件文本划分为事实描述、法律条款和裁判结果,划分后的案件文本形成案件样本集合;
步骤3、从案件文本的裁判结果中抽取罪名,将罪名作为类别,对案件文本划分出的事实描述进行分类;采用步骤2的案件样本集合训练文本分类模型;
步骤4、计算案件样本集合中两个案件文本的事实描述的语义相似度,从而生成语义相似度样本集合;语义相似度样本集合包括多个语义相似度样本,两个案件文本的事实描述及它们的语义相似度作为一个语义相似度样本;
步骤5、采用语义相似度样本集合训练语义相似度计算模型;
步骤6、获得用户输入的查询文本,并对其进行预处理;
步骤7、使用步骤3中训练好的文本分类模型对预处理后的用户输入的查询文本进行分类;
步骤8、根据步骤7的分类结果,使用步骤5训练好的语义相似度计算模型计算预处理后的查询文本与对应类别中的案件文本的事实描述的语义相似度,并推荐相似度数值最高的若干案件文本。
一种基于语义相似度的类案推荐方法,包括以下步骤:
步骤1、获得多个法律文书,进一步得到其中的案件文本;
步骤2、对案件文本进行预处理,并进一步对预处理后的案件文本划分为事实描述、法律条款和裁判结果,划分后的案件文本形成案件样本集合;
步骤3、从案件文本的裁判结果中抽取罪名,将罪名作为类别,对案件文本划分出的事实描述进行分类;采用步骤2的案件样本集合训练文本分类模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111019717.7/2.html,转载请声明来源钻瓜专利网。