[发明专利]一种新大数据标签生产方法及装置在审
申请号: | 201810223467.0 | 申请日: | 2018-03-19 |
公开(公告)号: | CN108427661A | 公开(公告)日: | 2018-08-21 |
发明(设计)人: | 邱晓贤;林国强;章武盛;周义豪;罗以攀;黄文杰;赵亨利;王松林;袁伟林 | 申请(专利权)人: | 广州汇智通信技术有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张春水;唐京桥 |
地址: | 510639 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 目标对象 标签生产 分析数据 大数据 公安技侦 海量数据 人类大脑 要素标签 挖掘 构建 算法 预置 语种 认知 预测 支撑 统计 建设 | ||
本发明实施例公开了一种新大数据标签生产方法及装置,其中,该方法包括:获取涉嫌目标对象的待分析数据;提取待分析数据的事实标签,事实标签包括涉嫌目标对象的属性、行为、关系和轨迹;对事实标签进行挖掘,得到模型标签,模型标签包括涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;将模型标签输入预置模型中,得到涉嫌目标对象的预测标签。本发明基于本体论的理论(实体‑关系‑标签)和人类大脑认知世界的过程作为依据,以涉嫌目标对象的海量数据源为支撑,利用前沿算法为工具,实现标签体系的挖掘建设,为公安技侦构建了一套新的标签体系。
技术领域
本发明涉及技侦技术领域,尤其涉及一种新大数据标签生产方法及装置。
背景技术
目前公安技侦行业已实现对资源数据通过物理重组或逻辑映射的方式进行重新分类形成价值信息库,形成了人员、物品、群体、行为、轨迹、关系、区域、案件等八大库。原始数据来源包括了运营商分光数据、电子围栏、运营商电查、寄递、开户资料和公安网资源等。标签的数据来源与技侦要素资源库的八大类资源,需要将之按照标签体系的分层分类结构进行映射。
现有技术的体系多侧重于广告、电商、内容类的互联网商业体系,以社会安全公安技侦领域的标签体系在现有行业还处于单一模型、零散挖掘、部分缺失、尚未成体系的分散状态。因此,在技侦领域内,还缺乏一种全面准确生成标签的方法。
发明内容
本发明实施例提供了一种新大数据标签生产方法及装置,为公安技侦提供了一套新的标签体系。
根据本发明的一个方面,提供一种新大数据标签生产方法,包括:
获取涉嫌目标对象的待分析数据;
提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;
对所述事实标签进行挖掘,得到模型标签,所述模型标签包括所述涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;
将所述模型标签输入预置模型中,得到所述涉嫌目标对象的预测标签。
优选地,所述根据所述事实标签进行挖掘具体包括:
S1:将所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容与语言库中的预置文本进行匹配,得到所述涉嫌目标对象的语种标签;
S2:对所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容进行要素提取,得到所述涉嫌目标对象的要素标签;
S3:对所述涉嫌目标对象的行为的次数进行统计运算,得到所述涉嫌目标对象的统计标签;
S4:获取与所述涉嫌目标对象相关的伴随者和/或伴随物品,确定所述伴随者和/或伴随物品的轨迹为第二轨迹,确定所述涉嫌目标对象的轨迹为第一轨迹,根据所述第一轨迹和所述第二轨迹的吻合度确定所述涉嫌目标对象的伴随标签;
S5:将所述统计标签、所述要素标签、所述语种标签和所述伴随标签组成所述涉嫌目标对象的模型标签。
优选地,本发明提供的一种新大数据标签生产方法还包括:
获取所述涉嫌目标对象的自定义标签,所述自定义标签包括所述涉嫌目标对象的自定义属性、自定义行为、自定义关系和自定义轨迹;
选择所述自定义标签与所述事实标签存在区别的部分标记更新至所述事实标签中。
优选地,所述预置模型为朴素贝叶斯或逻辑回归模型或相关向量机模型或随机森林模型。
根据本发明的另一个方面,提供一种新大数据标签生产装置,包括:
第一获取模块,用于获取涉嫌目标对象的待分析数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州汇智通信技术有限公司,未经广州汇智通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810223467.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种响应式大屏展示方法和装置
- 下一篇:非法信息的展示方法和装置