[发明专利]一种汽车信息处理方法及其设备、计算机存储介质有效
申请号: | 201811192288.1 | 申请日: | 2018-10-12 |
公开(公告)号: | CN109492023B | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 周宝成 | 申请(专利权)人: | 咪咕文化科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/36;G06F16/332 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 姚文娴;张颖玲 |
地址: | 100032 北京市西城区德*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 汽车 信息处理 方法 及其 设备 计算机 存储 介质 | ||
本发明实施例提供一种汽车信息处理方法及其设备、计算机存储介质,其中,所述方法包括:基于爬取的汽车信息,确定第一记录库和第二记录库,其中,所述第一记录库中包括品牌的信誉值大于第一阈值的汽车信息,所述第二记录库中包括品牌的信誉值不大于第一阈值的汽车信息;根据所述第一记录库中的品牌信息,对所述第二记录库中汽车信息进行修正,得到修正后的第二记录库;对所述第一记录库和修正后的第二记录库中的汽车信息进行数据融合,以得到汽车知识库。
技术领域
本发明涉及汽车信息处理技术领域,涉及但不限于一种汽车信息处理方法及其设备、计算机存储介质。
背景技术
随着生活水平的不断提高,汽车的普及率和保有量也呈现出巨大的增长。由于汽车属于大宗商品,所以用户在购买汽车之前,通常都希望对汽车的各项细节进行全面了解。而随着通信技术的迅猛发展,用户可以通过各种类型的汽车网站对汽车信息进行了解。
但是,在各大Web站点上不仅有经过行业专家编辑发布的页面,更多的是由Web用户提交的内容。内容复杂多样、质量不一,导致从Web站点上提取有效信息成为挑战。汽车交易领域涉及的Web站点众多,如何从众多的Web站点中提取客观有效、真实的数据、目前尚未有很好的解决方案。
发明内容
有鉴于此,本发明实施例期望提供一种汽车信息处理方法及其设备、计算机存储介质,解决了现有技术中汽车信息真实性、有效性不高的技术问题,能够得到数据完备、准确且冗余性低的汽车知识库。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种汽车信息处理方法,所述方法包括:
基于爬取的汽车信息,确定第一记录库和第二记录库,其中,所述第一记录库中包括品牌的信誉值大于第一阈值的汽车信息,所述第二记录库中包括品牌的信誉值不大于第一阈值的汽车信息;
根据所述第一记录库中的品牌信息,对所述第二记录库中汽车信息进行修正,得到修正后的第二记录库;
对所述第一记录库和修正后的第二记录库中的汽车信息进行数据融合,得到汽车知识库。
本发明实施例再提供一种汽车信息处理设备,所述设备至少包括:存储器、通信总线和处理器,其中:
所述存储器,用于存储汽车信息处理程序;
所述通信总线,用于实现处理器和存储器之间的连接通信;
所述处理器,用于执行存储器中存储的汽车信息处理程序,以实现本发明其他实施例提供的汽车信息处理方法的步骤。
本发明实施例提供一种计算机存储介质,所述计算机存储介质上存储有汽车信息处理程序,所述汽车信息处理程序被处理器执行时实现本发明其他实施例提供的汽车信息处理方法的步骤。
本发明实施例提供一种汽车信息处理方法及其设备、计算机存储介质,其中,首先,基于爬取的汽车信息,确定第一记录库和第二记录库,其中,所述第一记录库中包括品牌的信誉值大于第一阈值的汽车信息,所述第二记录库中包括品牌的信誉值不大于第一阈值的汽车信息;然后根据所述第一记录库中的品牌信息,对所述第二记录库中汽车信息进行修正,得到修正后的第二记录库;最后分别对所述第一记录库和修正后的第二记录库中的汽车信息进行数据融合,得到汽车知识库。如此,通过根据信誉值较高的第一记录库中的品牌信息对信誉值较低的第二记录库中的品牌信息进行修正,不仅能够保证修正后的记录库中信息的准确性,并且能够保证数据处理的完备性,进而再对汽车信息进行融合,将重复或本质相同的汽车信息进行删除,从而以得到准确且冗余性低的汽车知识库。
附图说明
图1为本发明实施例网络架构示意图;
图2为本发明实施例汽车信息处理方法的实现流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司,未经咪咕文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811192288.1/2.html,转载请声明来源钻瓜专利网。