[发明专利]基于知识图谱的车辆画像方法、计算机设备和存储介质有效
申请号: | 202010912546.X | 申请日: | 2020-09-03 |
公开(公告)号: | CN111767440B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 刘建林 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/33;G06F16/36 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 毛丹 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 车辆 画像 方法 计算机 设备 存储 介质 | ||
本申请涉及一种基于知识图谱的车辆画像方法、计算机设备和存储介质,所述方法包括:获取原始车辆数据的数据结构化程度,根据数据结构化程度确定原始车辆数据的分类,根据与不同分类对应的预处理方式,对相应原始车辆数据进行数据处理,生成对应的三元组车辆数据。对三元组车辆数据进行知识融合,生成对车辆的完整描述知识,基于完整描述知识,构建车辆图谱知识库。基于各车辆图谱知识库,进行知识计算确定车辆的缺失标签,结合缺失标签和初始车辆标签,生成车辆画像结果。采用本方法实现对车辆数据和关联信息的扩展,结合已有标签和缺失标签得到车辆数据的完整标签,并得到完整的车辆画像,提高根据完整车辆画像结果进行车辆分类的准确度。
技术领域
本申请涉及大数据处理技术领域,特别是涉及一种基于知识图谱的车辆画像方法、计算机设备和存储介质。
背景技术
随着互联网和大数据技术的广泛应用,针对车辆数据和图片数据日益增多的情形,为实现对海量车辆数据资源的分析处理,从而提升交警实施车辆管理和分析的效率,需要对车辆数据进行快速分类。
传统上多通过采用画像技术将不同数据抽象出的一个标签化的车辆模型,从而对车辆进行基于标签的分类和抽取,来实现的车辆分类和搜索。其中,传统的基于标签的对象画像方法,可以理解为首先需要为各个对象分配多个标签,每个标签设置对应的权重,用权重代表对象在这个方面兴趣的强烈程度,从而获得针对对象的画像数据。
然而传统的画像方式,对于产生各个画像的来源数据存在一定偏差,数据不够全面,以至于得到画像不够完整,无法很明确地描述出对象的特征,导致对各对象进行分类的分类结果不够准确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升车辆分类准确度的基于知识图谱的车辆画像方法、计算机设备和存储介质。
一种基于知识图谱的车辆画像方法,所述方法包括:
获取原始车辆数据的数据结构化程度,并根据所述数据结构化程度,确定原始车辆数据的分类;
根据与不同分类的原始车辆数据对应的预处理方式,对相应原始车辆数据进行数据处理,生成对应的三元组车辆数据;
对所述三元组车辆数据进行知识融合处理,生成对车辆的完整描述知识;
基于所述完整描述知识,构建车辆图谱知识库;
基于所构建的各所述车辆图谱知识库,进行知识计算,确定对应车辆的缺失标签;
结合所确定的车辆的缺失标签以及预先获取的初始车辆标签,生成车辆画像结果。
在其中一个实施例中,所述原始车辆数据的分类包括半结构化车辆数据、结构化车辆数据和非结构化车辆数据;所述根据与不同分类的原始车辆数据对应的预处理方式,对相应原始车辆数据进行数据处理,生成对应的三元组车辆数据,包括:
获取所述非结构化车辆数据对应的抽取对象;所述抽取对象包括实体、实体的属性信息以及各实体间的关联关系;
根据所述抽取对象,确定与所述非结构化车辆数据对应的第一预设处理方式;
根据所述第一预设处理方式,从所述非结构化车辆数据中抽取出已命名的各所述实体、各所述实体的属性信息以及各所述实体之间的关联关系;
根据已命名的各所述实体、与各所述实体分别对应的属性信息、以及各所述实体间的关联关系,生成与所述非结构化车辆数据对应的三元组车辆数据;
根据与所述半结构化车辆数据对应的第二预处理方式,将所述半结构化车辆数据从网页页面抽取出来,并调用预设包装器,将所抽取的半结构化车辆数据还原成结构化车辆数据;
根据与所述结构化车辆数据对应的第三预处理方式,将所述结构化车辆数据转换成三元组车辆数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010912546.X/2.html,转载请声明来源钻瓜专利网。