[发明专利]基于流量分析识别用户行为对象的方法和装置在审
申请号: | 201510713401.6 | 申请日: | 2015-10-28 |
公开(公告)号: | CN106650760A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 党倩 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司11205 | 代理人: | 杨贝贝,黄健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 流量 分析 识别 用户 行为 对象 方法 装置 | ||
技术领域
本发明实施例涉及流量识别技术,尤其涉及一种基于流量分析识别用户行为对象的方法和装置。
背景技术
近年来,数据业务呈现爆炸式的增长,对用户的数据流进行识别则是运营商进行网络管理和服务优化的重要研究内容。
目前,数据流识别主要是采用机器学习的方法来实现,具体为:根据数据流中包含的用户上网日志和用户网络通信数据包等,分析数据流的持续时长、端口号、包长和时间间隔等统计特征,并根据统计特征对数据流进行分类识别,从而研究用户的兴趣偏好,例如,针对端口号的分布,采用信息熵特征和数据挖掘技术对多种数据流进行分类识别;或者,通过考察数据流的持续时长和时间间隔的相关系数对语音流量进行分类识别等。
但是,对于经过端口地址转换、隐私保护等技术处理过的数据流,运营商无法通过分析用户网络通信数据包来获取数据流的统计特征,即运营商无法通过数据流识别来研究用户的兴趣偏好,导致运营商不能根据用户的兴趣偏好为用户提供数据业务,严重影响了数据业务的服务质量。
发明内容
本发明实施例提供一种基于流量分析识别用户行为对象的方法和装置,使得运营商可以根据行为对象研究用户的兴趣偏好,从而根据用户的兴趣偏好为用户提供数据业务,提高数据业务的服务质量。
第一方面,本发明实施例提供一种基于流量分析识别用户行为对象的方法,包括:获取用户数据流中的上网日志;根据预设的用户知识库,识别所述上网日志对应的上网行为,并对所述上网日志进行语义化标注,得到标注后的上网日志;其中,所述标注后的上网日志包括用户标识、上网时间、行 为名称和行为对象;根据所述标注后的上网日志中的上网时间和行为名称,确定所述标注后的上网日志中的第一日志和第二日志为关联事件;其中,所述第二日志对应的行为对象为空;根据所述关联事件生成中间事件,所述中间事件包括所述用户标识、所述第二日志对应的上网时间和所述第一日志对应的行为对象。其中,用户数据流为运营商服务器获取到的用户的移动终端的数据流,用户知识库中包括URL的解析规则、关键字符串与行为ID之间的对应关系、行为ID与行为名称之间的对应关系、关键字符串与行为对象之间的对应关系等,上网日志对应的上网行为至少包括行为名称和行为对象,语义化标注指的是为上网日志的上网行为打标签,关联事件为行为之间具有必然联系、且连续发生的多个事件,行为对象为空指的是根据用户知识库无法获取到该上网日志对应的行为对象,中间事件用于研究用户的偏好信息。本实施例提供的基于流量分析识别用户行为对象的方法,根据用户数据流中的上网日志识别用户的行为和行为对象,便于运营商根据行为对象研究用户的兴趣偏好,从而根据用户的兴趣偏好为用户提供数据业务,提高数据业务的服务质量。
结合第一方面,在第一方面的第一种可能实现方式中,所述根据所述标注后的上网日志中的上网时间和行为名称,确定所述标注后的上网日志中的第一日志和第二日志为关联事件,具体为:根据所述第二日志对应的行为名称,确定所述第二日志为关键事件;根据所述第一日志对应的上网时间和所述第二日志对应的上网时间,确定所述第一日志和所述第二日志为连续产生的上网日志。在本实施例中,关键事件为用于决定用户偏好的事件,运营商服务器确定关键事件后,再确定第一日志和第二日志为连续产生的上网日志,从而找出关联事件,由于关联事件中的行为对象为空,根据第一日志和第二日志之间的关联关系可以推测出关键事件中的行为对象,从而可以根据关键事件的行为对象研究用户偏好,为用户提供感兴趣的数据业务,方便用户及时获取所需的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510713401.6/2.html,转载请声明来源钻瓜专利网。