[发明专利]一种警情要素提取系统及其提取方法在审
申请号: | 202011195713.X | 申请日: | 2020-10-30 |
公开(公告)号: | CN112347249A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 桑燕五;吕晓宝;张睿超;孙亚文;龚茂杰;王元兵;王海荣 | 申请(专利权)人: | 中科曙光南京研究院有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06Q50/26 |
代理公司: | 南京泰普专利代理事务所(普通合伙) 32360 | 代理人: | 窦贤宇 |
地址: | 211102 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 要素 提取 系统 及其 方法 | ||
1.一种警情要素提取系统,其特征是,包括:
用于进行对时间词提取的时间要素提取模块;
用于进行对地点要素提取的地点要素提取模块;
用于进行对人物要素提取的人物要素提取模块;
用于进行对事件要素提取的事件要素提取模块;
用于进行对物品要素提取的物品要素提取模块;
用于进行对结果要素提取的结果要素提取模块;
以及用于进行对手段要素提取的手段要素提取模块。
2.根据权利要求1所述的一种警情要素提取系统,其特征是:所述时间要素提取模块主要进行完成对接处警文本的分词、词性标注,进而筛选出词性标注为“时间词”的词语;
筛选出的时间类词会存在将一段完整的时间词进行拆分,如将“2020年10月19日10点19分”拆分为“2020年”、“10月19日”、“10点10分”;
因此需要根据其在文本中的位置信息对时间词进行合并、拼接;当两个时间词同时满足以下两个条件时,将两个词合并成一个词:
1、两个词在原文中处在相邻的位置;
2、后一个词的时间量词维度小于前一个词的时间量词维度;
所述时间量词维度从高到低为“年”、“月”、“日/号”、“上午/早上/中午/下午/晚上/凌晨”、“时/点”、“分”,进而完成对时间要素的提取。
3.根据权利要求1所述的一种警情要素提取系统,其特征是:所述地点要素提取模块主要进行完成对接处警文本的分词、词性标注,进行筛选出地点类的词;
地点类的词包括词性为“地名”、词性为“机构团体”,以及包含新城、花园、中心、花苑、家园、小区、公司、酒店,并且字符长度大于3的名词;
对筛选出的地点类词,当两个词在原文本中是在一句话中,且两个词间隔的字符不超过2个,则进行将两个地点类词合并;对合并之后的每个词,在原来的接处警文本中找到包含该词的句子,进而在所述句子中提取路牌号、楼栋号、门牌号、房内位置、方位词地点要素;
所述路牌号包括XX号、XX组、XX区、XX单元;
所述楼栋号包括XX栋、XX幢、XX座;
所述门牌号包括XX室;
所述房内位置包括宿舍、卧室、厨房、客厅、书房、房间、站台、停车场、厕所、卫生间、加油站;
所述方位词包括边上、楼上、附近、里面、外面、里、外、口、下、前、后、边、内;
将提取到的地址要素与原地点类词依次拼接,形成一条完整的地点要素;
如果从原接处警文本中提取到多条地点要素,则将地点要素按出现顺序依次判定为报警地址、第一案发地址、第二案发地址。
4.根据权利要求1所述的一种警情要素提取系统,其特征是:所述人物要素提取模块主要进行完成对接处警文本中与警情相关的人员身份证号信息提取,所述警情相关人员包括报案人、当事人;
警情相关的人员身份证号信息提取判定规则为:
第1位为数字1-9;
第2~6位为任意数字;
第7~8位为18或19或20;
第9~10位为任意数字;
第11~12位为下列情况任意一种:
5.1第11位为0,第12位为1-9的任意数字;
5.2 10或11或12;
第13~14位为下列情况任意一种:
6.1 第一位为0或1或2,第二位为1~9;
6.2 10或20或30或31;
第15~17位为任意数字;
第18位为0~9中任意数字或X或x;
将上述规则用正则表达式表示为:
“[1-9]\\d{5}(18|19|20)\\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\\d{3}[0-9Xx]”;
根据身份证号正则表达式提取接处警文本中的身份证号,然后将身份证号左边距离最近的左括号,所述左括号包括“(”和“(”,及身份证号右边距离最近的右括号,所述右括号包括 “)”和“)”的中间的内容截取出来;
将左括号前面四个字符与中文人名的正则表达式相匹配,提取出人员姓名;对截取出括号间的文本内容,通过手机号正则表达式提取人员手机号码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科曙光南京研究院有限公司,未经中科曙光南京研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011195713.X/1.html,转载请声明来源钻瓜专利网。