[发明专利]基于多特征混合神经网络的内容传播热区预测方法有效
申请号: | 202011644100.X | 申请日: | 2020-12-31 |
公开(公告)号: | CN112822045B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 王晓飞;张恒;黄少远;彭国政;张宇熙;沙宇恒;马云高;宋卓;赵娟;朱克平;谢颖捷;王铁铮 | 申请(专利权)人: | 天津大学 |
主分类号: | H04L41/147 | 分类号: | H04L41/147;H04W28/14;H04L67/568;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 鄢功军 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 混合 神经网络 内容 传播 预测 方法 | ||
本发明公开了一种基于多特征混合神经网络的内容传播热区预测方法,包括:对内容的传播数据进行分类和筛选,确定传播数据的GPS信息;通过Geohash编码算法对GPS信息进行编码;根据传播数据的Geohash编码构建静态内容传播图;根据静态内容传播图构建内容传播时空图;将内容传播时空图与内容传播时空图的空间特征矩阵输入到GCN模型中进行特征提取和融合,输出表征向量;将表征向量输入到LSTM模型中进行计算,输出热区预测矩阵。本发明能够准确的内容传播热点预测,指导服务器部署和内容缓存策略制定,改善用户体验,减轻蜂窝网络传输压力。
技术领域
本发明涉及计算机网络技术领域,尤其涉及一种基于多特征混合神经网络的内容传播热区预测方法。
背景技术
随着智能终端设备的普及和网络技术的飞速发展,人们在移动终端和各种通信业务上花费的时间日渐增多。移动通信产生的数据流量爆炸式增长,给现有的移动网络体系结构带来了巨大的冲击和挑战。网络及移动通信中的数据流量大部分产生自重复的文件下载和内容浏览,为了加快内容传输和减小服务延迟,降低对信道资源的消耗,提高用户体验,许多网络通信业务中都引入了类似计算机缓存的内容缓存技术,例如CDN的内容缓存机制,移动通信中的缓存网络等。
目前针对通讯内容传播的缓存策略大多基于对历史数据的统计分析和人为总结经验,而移动社交网络下用户间对不同内容的传播需求及传播过程的时空社交特征间接反映了用户对不同通信业务的需求分布规律,若可以基于此通过相关算法预测用户对不同通信业务的需求空间分布情况,通信服务商或内容提供商就可以更加精准地部署边缘服务器,制定更加精确的内容缓存策略,以此达到缓解蜂窝网络传输压力、提高用户通信体验的目的。
发明内容
有鉴于此,本发明的主要目的在于提供一种基于多特征混合神经网络的内容传播热区预测方法,以实现准确的内容传播热点预测,指导服务器部署和内容缓存策略制定,改善用户体验,减轻蜂窝网络传输压力。
在本上下文中,本发明的实施方式期望提供一种基于多特征混合神经网络的内容传播热区预测方法。
在本发明实施方式的第一方面中,提供了一种基于多特征混合神经网络的内容传播热区预测方法,包括:
对内容的传播数据进行分类和筛选,确定上述传播数据的GPS信息;
通过Geohash编码算法对上述GPS信息进行编码;
根据上述传播数据的Geohash编码构建静态内容传播图;
根据上述静态内容传播图构建内容传播时空图;
将上述内容传播时空图与上述内容传播时空图的空间特征矩阵输入到GCN模型中进行特征提取和融合,输出表征向量;
将上述表征向量输入到LSTM模型中进行计算,输出热区预测矩阵。
在本发明的一个实施例中,上述对内容的传播数据进行分类和筛选包括:
根据应用的类别对上述传播数据进行分类;
根据上述传播数据的MD5和上述传播数据的大小对上述传播数据进行筛选。
在本发明的另一个实施例中,上述根据上述传播数据的MD5和上述传播数据的大小对上述传播数据进行筛选包括:
若上述传播数据的MD5为空或上述传播数据大小为0时,将上述传播数据删除;
若上述传播数据中存在用户ID缺失或乱码、无效时间戳、无效地理位置信息中的至少一项时,将上述传播数据删除。
在本发明的又一个实施例中,上述根据上述传播数据的Geohash编码构建静态内容传播图包括:
将上述GPS信息作为节点,依次判断每个上述传播数据的两个上述节点的发生时间的先后顺序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011644100.X/2.html,转载请声明来源钻瓜专利网。