[发明专利]自动判案方法及系统在审
申请号: | 201711185363.7 | 申请日: | 2017-11-23 |
公开(公告)号: | CN108133436A | 公开(公告)日: | 2018-06-08 |
发明(设计)人: | 王宝鑫;李剑锋;王士进 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06Q50/18 | 分类号: | G06Q50/18;G06N5/02 |
代理公司: | 北京华圣典睿知识产权代理有限公司 11510 | 代理人: | 陈国伟 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本向量 先验知识 向量化 构建 向量 案件 先验知识库 知识背景 主观因素 分词 输出 司法 | ||
本发明公开了一种自动判案方法及系统,该方法包括:获取待判案件相关资料;对所述待判案件相关资料进行分词及向量化处理,得到待判案件的文本向量;对预先构建的先验知识库中的信息进行向量化处理,得到先验知识向量;将所述先验知识向量及所述待判案件的文本向量输入预先构建的判案模型,根据所述判案模型的输出得到判案结果。利用本发明,可以提高判案效率,避免司法人员知识背景等主观因素的影响,提高判案的公正性和权威性。
技术领域
本发明涉及深度学习领域,具体涉及一种自动判案方法及系统。
背景技术
现有的司法判案大多还是由司法相关人员主导的判案,如基于专家规 则的判案方法,大致流程:对每种案件(如盗窃、抢劫等),人工定义影 响判案的各个要素,在实际判案过程中,需填写每一个要素信息,最后根 据要素信息得到对应的判案结果。
发明内容
本发明实施例提供一种自动判案方法及系统,以解决现有判案方法存 在的人力耗费大,公正性、权威性易受办案人员主观影响的问题。
为此,本发明提供如下技术方案:
一种自动判案方法,包括:
获取待判案件相关资料;
对所述待判案件的描述信息进行分词及向量化处理,得到待判案件的 文本向量;
对预先构建的先验知识库中的信息进行向量化处理,得到先验知识向 量;
将所述先验知识向量及所述待判案件的文本向量输入预先构建的判案 模型,根据所述判案模型的输出得到判案结果。
优选地,按以下方式构建先验知识库:
收集大量针对不同判案任务的相关语料;
抽取所述语料中的关键词构建先验知识库。
优选地,构建判案模型的过程包括:
确定判案模型的拓扑结构,所述判案模型的拓扑结构包括:输入层、表示 层、全连接层和输出层,所述输入层包括文本输入层和知识输入层,所述表示 层包括文本表示层和知识表示层;
收集训练数据,所述训练数据包括历史案件描述信息及对应的案件判案 结果;
对所述历史案件描述信息进行分词及向量化处理,得到历史案件的文本 向量;
对所述先验知识库中的信息进行向量化处理,得到先验知识向量;
根据所述历史案件的文本向量、所述先验知识向量、以及所述案件判 案结果,训练得到模型参数。
优选地,所述对所述历史案件描述信息进行分词及向量化处理还包括:
人名处理:对所述历史案件描述信息中的被告人和被害人的姓名进行 识别,并将识别到的姓名用通用描述主体替代;和/或
数字处理:对所述历史案件描述信息中的数值信息进行归一化处理, 然后将归一化处理后的数字转化为词向量。
优选地,所述将归一化处理后的数字转化为词向量包括:
将归一化处理后的数字和设置的偏置量组成二维向量;
利用多层感知器将所述二维向量转换为词向量。
优选地,所述构建判案模型的过程还包括:
在对所述历史案件描述信息进行分词及向量化处理之前,提取所述历史 案件描述信息中的案情要素,并将所述案情要素依次拼接作为所述历史案件描 述信息。
优选地,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711185363.7/2.html,转载请声明来源钻瓜专利网。