[发明专利]一站式数据处理的方法、装置、存储介质及电子设备有效
申请号: | 202010392157.9 | 申请日: | 2020-05-11 |
公开(公告)号: | CN111581479B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 刘震 | 申请(专利权)人: | 北京精准沟通传媒科技股份有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 柳欣 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一站式 数据处理 方法 装置 存储 介质 电子设备 | ||
本发明提供了一种一站式数据处理的方法、装置、存储介质及电子设备,其中,该方法包括:获取不同数据源的多个车辆数据,对多个车辆数据进行关系映射,确定不同数据源的统一映射对应关系;根据统一映射对应关系对多个车辆数据进行统计分析,确定车辆的销量数据,并确定车辆的评价标签;根据评价标签生成车辆的车辆画像信息。通过本发明实施例提供的技术方案,可以对多个数据源的车辆数据进行汇总,能够汇聚海量数据;基于不同数据源的统一映射对应关系将不同数据源的车辆数据进行统一映射,从而能够准确确定车辆的销量数据,并生成相应的车辆画像,方便用户快速查询获取到所需的信息,能够为用户提供高效、准确的车辆信息。
技术领域
本发明涉及数据处理的技术领域,具体而言,涉及一种一站式数据处理的方法、装置、存储介质及电子设备。
背景技术
随着互联网技术的发展,多个主流媒体建立了不同的社区和网站,其分别发布汽车的销量数据、新闻等,也进而分散了用户对汽车的评价内容。当用户需要了解某车型的信息时,需要浏览多个网站才能够比较全面地获知所需的信息。而不同网站之间的内容存在重复,浪费了用户时间,效率较低;且在缺乏适当引导的情况下,用户由于缺乏对数据的熟悉,也增加了准确获知信息的难度,使得用户花费了大量时间和精力后仍然可能错过许多有用信息。
发明内容
为解决上述问题,本发明实施例的目的在于提供一种一站式数据处理的方法、装置、存储介质及电子设备。
第一方面,本发明实施例提供了一种一站式数据处理的方法,包括:
获取不同数据源的多个车辆数据,对多个所述车辆数据进行关系映射,确定不同数据源的统一映射对应关系;
根据所述统一映射对应关系对多个所述车辆数据进行统计分析,确定车辆的销量数据,并确定所述车辆的评价标签;
根据所述评价标签生成所述车辆的车辆画像信息。
在一种可能的实现方式中,所述获取不同数据源的多个车辆数据包括:
基于不同爬取方式分别对所述数据源进行爬取处理,爬取所述数据源的车辆数据,所述车辆数据包括车辆销售数据、车辆曝光数据、车辆点击数据、车辆搜索数据、车辆评论数据中的一项或多项,所述爬取方式用于爬取所述车辆数据中的一项数据。
在一种可能的实现方式中,所述对多个所述车辆数据进行关系映射,确定不同数据源的统一映射对应关系,包括:
分别确定不同所述数据源的车辆数据中的关键字,所述关键字包括车辆关键字和/或评价关键字;
基于反链接和笛卡尔积对所述车辆数据中的关键字进行关系映射,生成所述关键字的统一映射对应关系。
在一种可能的实现方式中,所述确定所述车辆的评价标签包括:
对所述车辆数据进行句法依存处理,提取出所述车辆的评价标签。
在一种可能的实现方式中,根据所述评价标签生成所述车辆的车辆画像信息包括:
预先确定层级化的评价参数,并确定与所述车辆的最底层评价参数相对应的评价标签;
对与所述最底层评价参数相对应的所有所述评价标签进行统计处理,将数量最多的评价标签作为所述最底层评价参数的有效评价标签,并根据所述车辆的所有最底层评价参数的有效评价标签生成所述车辆的车辆画像信息。
在一种可能的实现方式中,在所述确定不同数据源的统一映射对应关系之后,该方法还包括:
根据所述统一映射对应关系对多个所述车辆数据进行统计分析,确定车辆的指数信息;其中,车辆数据包括车辆曝光数据、车辆点击数据、车辆搜索数据、车辆评论数据中的一项或多项,所述指数信息相应地包括曝光指数、活跃指数、搜索指数、关注指数中的一项或多项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京精准沟通传媒科技股份有限公司,未经北京精准沟通传媒科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010392157.9/2.html,转载请声明来源钻瓜专利网。