[发明专利]移动互联网的业务识别方法及装置有效
申请号: | 201610446549.2 | 申请日: | 2016-06-16 |
公开(公告)号: | CN107517140B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 黄昭文;叶家恒;全俊斌 | 申请(专利权)人: | 中国移动通信集团广东有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张振伟;蒋雅洁 |
地址: | 510623 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 移动 互联网 业务 识别 方法 装置 | ||
本发明实施例公开了一种移动互联网的业务识别方法,包括:针对单一业务从拨测数据中获取原始统一资源定位符URL数据;对所述原始URL数据进行多元组拆分,得到至少两个元组;将所述至少两个元组中的符合条件的元素按照预设合并规则进行合并,得到至少一个整合规则;将不属于所述单一业务的至少一个第三方整合规则从所述至少一个整合规则中剔除,得到优化后的至少一个整合规则。本发明实施例同时还公开了一种移动互联网的业务识别装置。
技术领域
本发明涉及移动通信的数据分析技术,尤其涉及一种移动互联网的业务识别方法及装置。
背景技术
在移动互联网时代,移动互联网的绝大部分应用服务,如即时通信、搜索、网络视频、网络音乐等,目前在移动终端中的渗透比例非常大,相对于传统互联网,移动互联网更加贴近用户生活;由于其贴近用户生活的特点,移动互联网网络流中包含着大量的用户使用习惯、网站访问统计及应用服务使用情况等大量业务数据,这些业务数据对于优化网络服务、病毒防治、精确服务推送等有着巨大的潜在价值。
对于移动互联网业务识别是规则的建立,现有技术方案是根据工作人员的经验通过测试装置拨测,利用抓包工具进行抓包来研究移动网络流量,截取数据包和会话协议,针对单个业务提取出多次拨测均出现的规则。
由于现有技术依赖测试人员的经验,局限性大,对测试人员的个人水平要求高,也无法灵活扩展识别规则,且移动业务种类繁多,同时具有业务流量大、网络请求复杂、识别方法复杂多样等特点,所以在快速响应目前移动互联网复杂性的业务需求的过程中,现有技术容易造成业务识别的质量低下而影响工作效率。
发明内容
有鉴于此,本发明实施例期望提供一种移动互联网的业务识别方法及装置,以提高业务识别的质量以及业务识别的工作效率。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供一种移动互联网的业务识别方法,所述方法包括:
针对单一业务从拨测数据中获取原始统一资源定位符URL数据;
对所述原始URL数据进行多元组拆分,得到至少两个元组;
将所述至少两个元组中的符合条件的元素按照预设合并规则进行合并,得到至少一个整合规则;
将不属于所述单一业务的至少一个第三方整合规则从所述至少一个整合规则中剔除,得到优化后的至少一个整合规则。
上述方案中,所述将所述至少两个元组中的符合条件的元素按照预设合并规则进行合并之前,所述方法还包括:
根据所述元组中的每个元素的访问数量得到在所述元组中的每个元素的可信度;
判断所述元素的可信度是否大于等于所在元组的可信度阈值,若所述元素的可信度大于等于所在元组的可信度阈值,则将所述元素确定为符合条件的元素。
上述方案中,所述将所述至少两个元组中的符合条件的元素按照预设合并规则进行合并,得到至少一个整合规则,包括:
判断所述至少两个元组中的下一级元组中的符合条件的元素是否是由上一级元组中的符合条件的元素派生的,若下一级元组中的符合条件的元素是由上一级元组中的符合条件的元素派生的,则将所述下一级元组中的符合条件的元素通过整合工具整合成所述上一级元组中的符合条件的元素,直至所述上一级元组中的符合条件的元素为域名信息为止;
判断所述域名信息中的主体是否相同,且所述域名信息中是否仅包括有不同的数字,若所述域名信息中的主体相同,且所述域名信息中仅包括有不同的数字,则将所述域名信息合并,得到所述至少一个整合规则。
上述方案中,所述针对单一业务从拨测数据中获取多个原始统一资源定位符URL数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团广东有限公司,未经中国移动通信集团广东有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610446549.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法及系统、设备测试系统及节点测试系统
- 下一篇:一种骑行头盔