[发明专利]一种信息处理方法、装置和存储介质有效
申请号: | 201910234219.0 | 申请日: | 2019-03-26 |
公开(公告)号: | CN111752984B | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 邓杰 | 申请(专利权)人: | 中移(苏州)软件技术有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/248 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张振伟;张颖玲 |
地址: | 215163 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 存储 介质 | ||
本公开实施例公开了一种信息处理方法,包括:获取服务信息;根据所述服务信息携带的设置字段确定每一所述服务信息对应的属性标签及与所述属性标签对应的属性值;基于所述属性值计算待分析服务信息之间的属性相似度;将所述属性相似度大于设置的相似度阈值的所述待分析服务信息作为相似服务信息,这样,在业务系统进行所述服务信息的再利用时,能够准确获知所述确定的相似服务信息,有利于减少冗余信息,提升业务系统的服务信息处理效率。本公开实施例进一步公开了一种信息处理装置和存储介质。
技术领域
本公开实施例涉及数据处理领域,尤其涉及信息处理方法、装置和存储介质。
背景技术
在电信领域,各个省市运营商每天运行着大量的业务支撑系统,如客户关系管理系统(CRM),业务运营支撑系统(BOSS),业务支撑网运营管理系统(BOMC)等。经过多年的业务快速发展,这些系统自身包含了大量的服务信息,在当前大连接战略指引以及互联网+与集中化思想引领下,对这些服务信息进行集中化管控是实现高效运营的重要保证。现如今处于大数据共享时代,如果能够对这些服务信息进行集中化存储与管控,建立统一开放平台,并对服务信息进行相似性分析,则能够更好的指导各个运营商对服务的格式标准化和统一化管理。并且,在服务信息再利用时,基于相似性分析的结论可以有效降低各个运营商的运营成本,减少运营商之间提供的服务信息冗余度。
但是,目前的相似性分析方法没有通过建立适当的数学模型对服务信息进行定量分析,无法准确确定相似服务信息,会直接导致服务信息的冗余度较高,最终导致服务信息利用时的处理成本较高。
发明内容
为解决现有存在的技术问题,本公开实施例提供一种能够准确确定相似服务信息的信息处理方法、装置和存储介质。
为达到上述目的,本公开实施例的技术方案是这样实现的:
第一方面,本公开实施例提供一种信息处理方法,包括:
获取服务信息;
根据所述服务信息携带的设置字段确定每一所述服务信息对应的属性标签及与所述属性标签对应的属性值;
基于所述属性值计算待分析服务信息之间的属性相似度;
将所述属性相似度大于设置的相似度阈值的所述待分析服务信息作为相似服务信息。
其中,在基于所述属性值计算待分析服务信息之间的相似度之前,还包括:
根据所述服务信息对应的所述属性标签和所述属性值确定所述服务信息的分布密度;
根据所述分布密度确定服务信息抽样样本,将所述服务信息抽样样本作为所述待分析服务信息。
其中,所述根据所述服务信息对应的所述属性标签和所述属性值确定所述服务信息的分布密度,包括:
以所述服务信息对应的属性标签为维度建立矩阵;
根据每一所述服务信息的属性值确定每一所述服务信息在所述矩阵中对应的位置;
根据不同位置的所述服务信息的数量,确定所述服务信息的分布密度。
其中,所述根据不同位置的所述服务信息的数量,确定所述服务信息的分布密度,包括:
将所述矩阵对应的多维空间划分为多个子空间,统计每个所述子空间中所述服务信息的数量,获得所述服务信息的分布密度。
其中,所述根据所述分布密度确定服务信息抽样样本,将所述服务信息抽样样本作为所述待分析服务信息,包括:
根据所述分布密度的大小,按照设置比例从不同分布密度对应的服务信息集中抽样不同数量的所述服务信息,将所述服务信息作为所述待分析服务信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(苏州)软件技术有限公司;中国移动通信集团有限公司,未经中移(苏州)软件技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910234219.0/2.html,转载请声明来源钻瓜专利网。