[发明专利]案卷事理图谱构建方法、电子装置及存储介质在审
申请号: | 201910957991.5 | 申请日: | 2019-10-10 |
公开(公告)号: | CN110895569A | 公开(公告)日: | 2020-03-20 |
发明(设计)人: | 吴良顺 | 申请(专利权)人: | 卓尔智联(武汉)研究院有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/279;G06F40/289;G06Q50/26 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 饶智彬 |
地址: | 430000 湖北省武汉市黄陂区盘龙城经*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 案卷 事理 图谱 构建 方法 电子 装置 存储 介质 | ||
1.一种案卷事理图谱构建方法,应用于电子装置中,其特征在于,所述方法包括:
将案卷进行预处理以生成电子文本;
提取所述电子文本中的事理关系,所述事理关系包括顺承关系以及因果关系之中至少一种;以及
根据所述事理关系建立事理图谱,所述事理图谱包括顺承关系图谱以及因果关系图谱之中至少一种。
2.如权利要求1所述的案卷事理图谱构建方法,其特征在于,所述“提取所述电子文本中的事理关系”包括:
将所述电子文本划分为长句;
基于预设的事理关系模板,提取所述长句中的事理关系以生成事理关联部分;
将所述事理关联部分进行短句处理以生成目标短句;
提取所述目标短句中谓词性短语;
根据所述谓词性短语在所述长句中出现的顺序生成每一个长句的谓词性短语有序集合;
将所述谓词性短语有序集合以滑窗方式构造事理关系事件对;以及
将所述事理关系事件对进行汇总以生成事理事件库。
3.如权利要求2所述的案卷事理图谱构建方法,其特征在于,所述“将所述电子文本划分为长句”包括:
以第一符号为划分依据,将所述电子文本划分为短语,其中,所述第一符号表示句子结尾;以及
判断所述短语所含中文字符个数是否大于预设数量;
如果所述短语所含中文字符个数大于预设数量,确定所述短语为长句。
4.如权利要求2所述的案卷事理图谱构建方法,其特征在于,所述“基于预设的事理关系模板,提取所述长句中的事理关系以生成事理关联部分”包括:
基于预设的顺承关系模板,提取所述长句中的顺承关系以生成所述事理关联部分,所述事理关联部分包括顺承前事件以及顺承后事件。
5.如权利要求2所述的案卷事理图谱构建方法,其特征在于,所述“基于预设的事理关系模板,提取所述长句中的事理关系以生成事理关联部分”包括:
基于预设的因果关系模板,按照因果关系规则提取所述长句中的因果关系以生成所述事理关联部分,所述事理关联部分包括原因事件以及结果事件,其中,所述因果关系模板包括表示因果关系的词语,所述因果关系包括由果溯因、由因到果、因果居中式、居中式精确、前端式模糊、居中式模糊、前端式精确、由果溯因居中式模糊中至少一种。
6.如权利要求4或5所述的案卷事理图谱构建方法,其特征在于,所述“将所述事理关联部分进行短句处理以生成目标短句”包括:
以第二符号为划分依据,将所述事理关联部分划分为短句,其中,所述第二符号表示句子间隔;以及
确定内容为非空的短句为所述目标短句。
7.如权利要求4所述的案卷事理图谱构建方法,其特征在于:
当所述顺承关系模板包括表示顺承关系的词语时,所述“提取所述长句中的顺承关系以生成所述事理关联部分,所述事理关联部分包括顺承前事件以及顺承后事件”包括:
采用正则表达式确定位于所述顺承关系的词语前半部分的长句为顺承前事件及位于所述顺承关系的词语后半部分的长句为顺承后事件;
当所述顺承关系模板包括时间先后规则时,所述“提取所述长句中的顺承关系以生成所述事理关联部分”包括:
按照时间先后顺序确定时间先的事理关联部分为顺承前事件以及时间后的事理关联部分为顺承后事件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卓尔智联(武汉)研究院有限公司,未经卓尔智联(武汉)研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910957991.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多维度信号眼图补偿电路
- 下一篇:一种仿麻纱线的制备方法