[发明专利]一种数据处理方法及装置在审

申请号：	201910655989.2	申请日：	2019-07-19
公开（公告）号：	CN110347702A	公开（公告）日：	2019-10-18
发明（设计）人：	孟宾	申请（专利权）人：	浙江齐治科技股份有限公司
主分类号：	G06F16/2452	分类号：	G06F16/2452;G06F17/27
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	刘晓菲
地址：	310012 浙江省杭州***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	分词结果目标数据重复数据目标数据库存储数据数据处理匹配存储设备匹配数据存储请求待存储数据存储请求响应数据分词预设数据库申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供了一种数据处理方法及装置，在获取到对待存储数据的数据存储请求后，可以对待存储数据进行分词，得到第一分词结果，根据第一分词结果判断目标数据库中是否存在与待存储设备匹配的目标数据，目标数据具有第二分词结果，第二分词结果与第一分词结果的匹配值大于或等于第一预设值，若是，说明待存储数据是目标数据的重复数据，则可以拒绝响应数据存储请求，由于重复数据是根据分词结果的匹配值确定的，具有一定的准确性，从而有效防止目标数据库中重复数据的增加，提高数据库的利用率。

技术领域

本发明涉及计算机领域，特别是涉及一种数据处理方法及装置。

背景技术

随着信息化时代的到来，人们面临越来越多的数据，通过数据库可以对数据进行存储和管理，用户可以向数据库中存储数据，也可以通过检索词查询与检索词相关的数据，例如可以查找包括检索词的数据作为查找结果。

目前，在用户向数据库中存储数据时，可以通过数据库对数据的唯一性限制，防止完全匹配的数据的增加，例如待存储数据的名称与已有数据的名称一致，则可以不进行该数据的存储。然而，这种方式并不能有效防止重复数据的增加，容易导致数据库中存在冗余数据。

发明内容

为解决上述技术问题，本申请实施例提供一种数据处理方法及装置，降低数据库中的重复数据，提高数据库的利用率。

本申请实施例提供了一种数据处理方法，包括：

获取对待存储数据的数据存储请求，所述数据存储请求指示将所述待存储数据存储至目标数据库；

对所述待存储数据进行分词，得到第一分词结果；

根据所述第一分词结果，判断所述目标数据库中是否存在与所述待存储数据匹配的目标数据，所述目标数据具有第二分词结果，所述第二分词结果与所述第一分词结果的匹配值大于或等于第一预设值；

若是，则拒绝响应所述数据存储请求。