[发明专利]案件相关度检测方法及终端设备在审
申请号: | 202011021188.X | 申请日: | 2020-09-25 |
公开(公告)号: | CN111966924A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 彭羿人 | 申请(专利权)人: | 平安直通咨询有限公司上海分公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/25;G06N3/04;G06N3/08;G06K9/62;G06Q50/18 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张全文 |
地址: | 200040 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 案件 相关 检测 方法 终端设备 | ||
本申请适用于信息处理技术领域,提供了案件相关度检测方法、装置及终端设备,该案件相关度检测方法包括:提取案件库中符合预设要求的各个第一案件的多个结构化数据,所有的第一案件构成目标案件集合;将每一第一案件的各个结构化数据转换为对应的词向量,得到目标案件集合对应的第一向量矩阵;基于第一向量矩阵确定目标案件集合在多维向量空间中的中心点;确定案件库中各个第二案件的第二向量矩阵,并基于第二向量矩阵和中心点确定各个第二案件与目标案件集合的相关度,第二案件为案件库中除去目标案件集合以外的案件;将相关度满足预设要求的第二案件的链接信息和/或相关文件发送给用户终端。本申请的案件相关度检测结果更加精准。
技术领域
本申请属于信息处理技术领域,尤其涉及案件相关度检测方法及终端设备。
背景技术
类案推荐是一种通过数据过滤、信息检索等方法向用户推荐特定案件的技术,能够从大量案件中筛选出相关案件。传统的类案推荐通常是通过基于静态数据和动态数据或者规则进行聚类,通过协同过滤等算法根据用户偏好将同类案件进行推荐。而协同过滤等算法在数据量比较大的推荐系统中存在严重的数据稀疏问题,用户浏览量对于内容总量只占很少一部分,大部分内容都没有点击数据,导致不同用户之间的交集很少,所以很难得到准确有效的推荐。
发明内容
为克服相关技术中存在的问题,本申请实施例提供了案件相关度检测方法及终端设备。
本申请是通过如下技术方案实现的:
第一方面,本申请实施例提供了一种案件相关度检测方法,包括:
提取案件库中符合预设要求的各个第一案件的多个结构化数据;其中,所有的所述第一案件构成目标案件集合;
将每一所述第一案件的各个结构化数据转换为对应的词向量,得到所述目标案件集合对应的第一向量矩阵;
基于所述第一向量矩阵确定所述目标案件集合在多维向量空间中的中心点;
确定所述案件库中各个第二案件的第二向量矩阵,并基于所述第二向量矩阵和所述中心点确定各个所述第二案件与所述目标案件集合的相关度;其中,所述第二案件为所述案件库中除去所述目标案件集合以外的案件;
将所述相关度满足预设要求的第二案件的链接信息和/或相关文件发送给用户终端。
在第一方面的一种可能的实现方式中,所述提取案件库中符合预设要求的各个第一案件的多个结构化数据,包括:
对训练文本数据进行标注;其中,所标注的信息包括多类信息;
将标注后的训练文本数据输入到目标网络中,确定各类信息对应的损失函数;
基于各类信息对应的损失函数训练所述目标网络;
将各个第一案件的文本输入至训练后的目标网络,提取出所述结构化数据。
在第一方面的一种可能的实现方式中,所述目标网络包括多个子网络,且每个子网络对应一类信息;
所述基于各种信息对应的损失函数训练所述目标网络,包括:
基于各类信息对应的损失函数,训练对应的子网络。
在第一方面的一种可能的实现方式中,所述基于各种信息对应的损失函数训练所述目标网络,包括:
计算各类信息对应的文本数量的比例;
根据各个损失函数与对应的比例的乘积之和,确定总损失函数;
基于所述总损失函数训练所述目标网络。
在第一方面的一种可能的实现方式中,所述提取目标案件集合中各个第一案件的多个结构化数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安直通咨询有限公司上海分公司,未经平安直通咨询有限公司上海分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011021188.X/2.html,转载请声明来源钻瓜专利网。