[发明专利]一种基于分类词库和启发式规则的案件手段抽取方法在审
申请号: | 201910193106.0 | 申请日: | 2019-03-14 |
公开(公告)号: | CN109933649A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 金勇 | 申请(专利权)人: | 武汉烽火普天信息技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F17/27 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 430000 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类词库 作案手段 抽取 启发式规则 案件 相似性分析 迭代学习 规则学习 刑事案件 自动抽取 常发性 接触性 启发式 文本 挖掘 建设 | ||
1.一种基于分类词库和启发式规则的案件手段抽取方法,其特征在于,所述方法包括:
S1、分类词库建设:根据预先进行的大量数据分析建立分类词库,所述词库包括行为词词库、主体词词库、主体附属词词库、形容词词库、方位词词库、行为结果词以及手段专有词词库;
S2、候选作案手段抽取:利用特定的句式结构抽取含有作案手段的文本,然后利用启发式规则结合分类词库抽取作案手段候选项;
S3、形成作案手段:对抽取的候选作案手段进行进一步过滤,去掉重复项或类似项,形成最终的作案手段集合;
S4、自主迭代学习:根据新发案件信息数据以及未登录词对词库和启发式规则进行丰富完善,建立自主迭代学习模型。
2.根据权利要求1所述的一种基于分类词库和启发式规则的案件手段抽取方法,其特征在于,所述启发式规则具体为:
a、利用手段专有词库判断文本是否含有相关专有词,如有,则提取出相关手段词;
b、利用作案动词作为触发词去抽取可能存在的关于作案手段的描述。
3.根据权利要求1所述的一种基于分类词库和启发式规则的案件手段抽取方法,其特征在于,利用启发式规则进行抽取前还包括对案件文本进行过滤,以排出出现的否定的情况。
4.根据权利要求1所述的一种基于分类词库和启发式规则的案件手段抽取方法,其特征在于:所述作案手段具体通过分类字或词库的抽取按照语法结构进行重组,其中,所述语法结构包括主动式结构、被字结构以及将字结构。
5.根据权利要求1所述的一种基于分类词库和启发式规则的案件手段抽取方法,其特征在于,还包括:所述词库、启发式规则以及语法结构在运营中不断的交互校验,然后对算法进行迭代优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉烽火普天信息技术有限公司,未经武汉烽火普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910193106.0/1.html,转载请声明来源钻瓜专利网。