[发明专利]一种数据处理方法、装置及电子设备有效
申请号: | 201710165468.X | 申请日: | 2017-03-20 |
公开(公告)号: | CN108628883B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 吴家旭;史军 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 马苗苗 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 电子设备 | ||
本发明公开了一种数据处理方法、装置及电子设备,该方法包括:获得待处理元素集中每个元素所属的所有目标集合;依据待处理元素集中所有元素对应的所有目标集合,获取所有元素的所有目标集合能够组合形成的所有组合交集、以及每个组合交集包含的元素数;获得用于表征各个目标集合之间的从属关系的关系链;根据关系链和每个组合交集包含的元素数,通过容斥原理计算获得任一目标集合包含的元素总数。在上述技术方案中,组合交集的元素数不受关系链的影响,在关系链发生变化时,不用对各个元素所属集合及其祖先集合进行重新计数,进而解决了现有技术中元素数更新效率低下的技术问题,提高了元素数更新效率。
技术领域
本发明涉及软件技术领域,特别涉及一种数据处理方法、装置及电子设备。
背景技术
现如今,有很多需要对标签进行计数的地方如网站,网站会设定标签,而每个标签可以包含若干子标签,层层推进构成标签关系链,例如:标签“物理”可以包含子标签:核物理、天体物理、高分子物理等,每个标签、子标签下面可以对应多个元素,每个元素(商品、问题、词条等等)可以属于若干个标签,例如:电视机可以属于生活、电器、大件商品等标签。
当增加一个新元素时,会影响到这个元素所属标签,以及每个标签的所有祖先标签的计数。对这种标签计数需求的传统解决方法是:每一个新增的元素,对其所属标签以及这些所属标签的所有祖先标签,计数都加1,例如:标签A的子标签包含B、C、D,标签C的子标签为D,那么D中新增一元素,那么标签D、C、A中的元素数均需要加1。
这种方法存在的问题:如果标签关系链发生变化,原统计得到的结果也不再具备正确性。因为每一个新增元素所影响到的标签都是由当时的标签关系链所决定的;一旦标签关系链发生变化,过去依赖的旧关系链与新关系链的差异将会导致过去的统计结果不可信,若要纠错则需依赖新的关系链将所有元素重新做一次统计,大大降低了元素数的更新效率。
发明内容
本发明实施例提供一种数据处理方法、装置及电子设备,用于解决现有技术中元素数更新效率低下的技术问题,提高元素数更新效率。
本发明实施例提供一种数据处理方法,该方法包括:
获得待处理元素集中每个元素所属的所有目标集合;
依据所述待处理元素集中所有元素对应的所有目标集合,获取所述所有元素的所有目标集合能够组合形成的所有组合交集、以及每个所述组合交集包含的元素数;
获得用于表征各个所述目标集合之间的从属关系的关系链;
根据所述关系链和所述每个所述组合交集包含的元素数,通过容斥原理计算获得任一所述目标集合包含的元素总数。
可选的,所述根据所述关系链和所述每个所述组合交集包含的元素数,通过容斥原理计算获得任一所述目标集合包含的元素总数,包括:
根据所述关系链,获得任一所述目标集合对应的目标组合交集;
根据所述目标组合交集和每个所述目标组合交集包含的元素数,通过容斥原理计算获得任一所述目标集合包含的元素总数。
可选的,所述根据所述关系链,获得任一所述目标集合对应的目标组合交集,包括:
根据所述关系链,获得从属于所述目标集合的所有目标子集;
获得从属于所述目标集合的所有目标子集能够组合形成的组合交集,作为所述目标集合对应的目标组合交集。
可选的,所述根据所述关系链和所述每个所述组合交集包含的元素数,通过容斥原理计算获得任一所述目标集合包含的元素总数,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710165468.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于预判问题的方法和系统
- 下一篇:一种复杂事件处理方法、系统及其装置