[发明专利]一种基于多维度语义联合建模的多用户案例检索系统有效
申请号: | 202010747457.4 | 申请日: | 2020-07-30 |
公开(公告)号: | CN111625626B | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 刘广峰;鲁思帆 | 申请(专利权)人: | 杭州识度科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/31;G06N3/04;G06Q50/18 |
代理公司: | 杭州华知专利事务所(普通合伙) 33235 | 代理人: | 束晓前 |
地址: | 310000 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 语义 联合 建模 多用户 案例 检索系统 | ||
本发明涉及一种基于多维度语义联合建模的多用户案例检索系统,包括知识构建模块:对现有的裁判文书进行信息提取,搭建裁判文书库,生成裁判文书画像库和与案人员画像库;要素识别模块:利用要素特征提取模型对用户提供的文本进行要素特征的抽取,用于提取咨询用户的用户人物特征;匹配查询模块:针对要素识别模块中抽取的要素特征以提出的用户人物特征分别在知识构建模块生成的裁判文书画像库和与案人员画像库中进行查询并匹配。本发明提供的技术方案能够适用于普通群众对法律案例的检索需求,且在一定程度上满足检索准确性的需求,提高律师或者普通群众在检索相似案例或者根据自身情形检索是否有对应类似裁判文书的检索准确性。
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于多维度语义联合建模的多用户案例检索系统。
背景技术
随着信息时代的到来,人民群众获取信息的渠道更加广泛,与此同时也提高了对于获取的信息质量的要求,尤其是在法律的案例检索领域。
目前人民群众遇到法律纠纷都倾向于先去网络上寻求相关案例,查看判决情况,然而目前市场上的案例检索系统大多是基于关键词的检索方式,并不能充分的捕捉用户的关注主体目标;其次大多数案例检索系统面向的是具有法律专业知识的用户,普通群众并不能很好地涉及这些检索系统;即使是涉及到具体语义分析的检索系统也仅仅是捕捉到浅层语义,并不能挖掘用户的深层信息,因此该类方法的检索准确率较低。
发明内容
为了解决上述问题,本发明提供了一种基于多维度语义联合建模的多用户案例检索系统,能够提高律师或者普通群众在检索相似案例或者根据自身情形检索是否有对应类似裁判文书的检索准确性。
本发明的技术方案如下所示:
一种基于多维度语义联合建模的多用户案例检索系统,包括:
知识构建模块:对现有的裁判文书进行信息提取,搭建裁判文书库,并根据裁判文书库生成裁判文书画像库和与案人员画像库;
要素识别模块:利用要素特征提取模型对用户提供的文本进行要素特征的抽取,用于提取咨询用户的用户人物特征;
匹配查询模块:针对要素识别模块中抽取的要素特征以提出的用户人物特征分别在知识构建模块生成的裁判文书画像库和与案人员画像库中进行查询并匹配。
优选的,所述裁判文书库的构建过程为:
S1:基于现有裁判文书,对裁判文书进行结构化分层操作;所述分层操作具体为:以裁判文书中的原告诉称,被告辩称、事实查明、本院查明、本院认为、判决如下、与案人员信息等信息分区来对裁判文书进行分层;
S2:基于现有裁判文书的领域,对裁判文书进行标注;
S3:基于上述信息建立裁判文书库。
优选的,所述裁判文书画像库的构建过程为:
S1:基于上述的裁判文书库,预先设计出裁判文书画像模型;
S2:基于裁判文书画像模型,对结构化后的裁判文书的各层信息进行提取;
S3:根据提取完成的裁判文书画像,构建裁判文书画像库。
优选的,所述与案人员画像库的构建过程为:
S1:基于现有的用户人物特征,预先设计出与案人员画像模型;
S2:基于用户画像模型,对裁判文书中的与案人员进行画像信息提取;
S3:基于上述信息初步建立与案人员画像库。
优选的,所述裁判文书画像的提取过程具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州识度科技有限公司,未经杭州识度科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010747457.4/2.html,转载请声明来源钻瓜专利网。