[发明专利]自动判案方法及系统在审
申请号: | 201711185363.7 | 申请日: | 2017-11-23 |
公开(公告)号: | CN108133436A | 公开(公告)日: | 2018-06-08 |
发明(设计)人: | 王宝鑫;李剑锋;王士进 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06Q50/18 | 分类号: | G06Q50/18;G06N5/02 |
代理公司: | 北京华圣典睿知识产权代理有限公司 11510 | 代理人: | 陈国伟 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本向量 先验知识 向量化 构建 向量 案件 先验知识库 知识背景 主观因素 分词 输出 司法 | ||
1.一种自动判案方法,其特征在于,包括:
获取待判案件相关资料;
对所述待判案件的描述信息进行分词及向量化处理,得到待判案件的文本向量;
对预先构建的先验知识库中的信息进行向量化处理,得到先验知识向量;
将所述先验知识向量及所述待判案件的文本向量输入预先构建的判案模型,根据所述判案模型的输出得到判案结果。
2.根据权利要求1所述的方法,其特征在于,按以下方式构建先验知识库:
收集大量针对不同判案任务的相关语料;
抽取所述语料中的关键词构建先验知识库。
3.根据权利要求1所述的方法,其特征在于,构建判案模型的过程包括:
确定判案模型的拓扑结构,所述判案模型的拓扑结构包括:输入层、表示层、全连接层和输出层,所述输入层包括文本输入层和知识输入层,所述表示层包括文本表示层和知识表示层;
收集训练数据,所述训练数据包括历史案件描述信息及对应的案件判案结果;
对所述历史案件描述信息进行分词及向量化处理,得到历史案件的文本向量;
对所述先验知识库中的信息进行向量化处理,得到先验知识向量;
根据所述历史案件的文本向量、所述先验知识向量、以及所述案件判案结果,训练得到模型参数。
4.根据权利要求3所述的方法,其特征在于,所述对所述历史案件描述信息进行分词及向量化处理还包括:
人名处理:对所述历史案件描述信息中的被告人和被害人的姓名进行识别,并将识别到的姓名用通用描述主体替代;和/或
数字处理:对所述历史案件描述信息中的数值信息进行归一化处理,然后将归一化处理后的数字转化为词向量。
5.根据权利要求4所述的方法,其特征在于,所述将归一化处理后的数字转化为词向量包括:
将归一化处理后的数字和设置的偏置量组成二维向量;
利用多层感知器将所述二维向量转换为词向量。
6.根据权利要求3所述的方法,其特征在于,
所述构建判案模型的过程还包括:
在对所述历史案件描述信息进行分词及向量化处理之前,提取所述历史案件描述信息中的案情要素,并将所述案情要素依次拼接作为所述历史案件描述信息;
所述方法还包括:
在对所述待判案件的描述信息进行分词及向量化处理之前,提取所述待判案件相关资料中的案情要素,并将所述案情要素依次拼接作为所述待判案件的描述信息。
7.根据权利要求1所述的方法,其特征在于,所述对所述待判案件的描述信息进行分词及向量化处理还包括:
人名处理:对所述待判案件的描述信息中的被告人和被害人的姓名进行识别,并将识别到的姓名用通用描述主体替代;和/或
数字处理:对所述待判案件的描述信息中的数值信息进行归一化处理,然后将归一化处理后的数字转化为词向量。
8.一种自动判案系统,其特征在于,包括:
资料获取模块,用于获取待判案件相关资料;
预处理模块,用于对所述待判案件相关资料进行分词及向量化处理,得到待判案件的文本向量;
先验知识处理模块,用于对所述先验知识库中的信息进行向量化处理,得到先验知识向量;
判案模块,用于将所述先验知识向量及所述待判案件的文本向量输入所述判案模型,根据所述判案模型的输出得到判案结果。
9.根据权利要求8所述的系统,其特征在于,所述系统还包括:
先验知识库构建模块,用于收集大量针对不同判案任务的相关语料,抽取所述语料中的关键词构建先验知识库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711185363.7/1.html,转载请声明来源钻瓜专利网。