[发明专利]即时通讯消息提示的全排序方法有效
申请号: | 201910142909.3 | 申请日: | 2019-02-26 |
公开(公告)号: | CN109936498B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 陈超 | 申请(专利权)人: | 企知道网络技术有限公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;H04L12/24;H04L29/08;G06F16/75 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东省深圳市南山区西丽*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 即时通讯 消息 提示 排序 方法 | ||
1.即时通讯消息提示的全排序方法,其特征在于,包括行为分析和排序网络两个步骤:
行为分析,根据大数据统计和区分用户感兴趣的消息和不感兴趣的消息;
排序网络,基于行为分析评估用户对接收到的消息的兴趣度,当新的通讯消息到达时,根据朴素贝叶斯网络获取兴趣度结果,并经排序网络输出;
所述行为分析步骤包括:
S101:将消息定义为消息向量(A[1],A[2],…,A[N]),其中向量的坐标A[1]、A[2]、…、A[N]对应根据消息的特征定义分配的向量特征;
S102:判断任意消息间的相似性,根据消息间的相似性得到消息的聚类;
所述S101中,每个消息向量的坐标均包括接收时间、内容类型及点击频率三个向量特征,定义每个向量特征的区间为[0,100];
时间特征按照24小时制时间段映射至区间,其中0代表0时,50代表12时,100代表24时;
内容类型特征根据其分类映射至区间,其中类型Ⅰ为0-100/N,类型Ⅱ为100/N-100/N×2,…,类型N为100/N×(N-1)-100,其中N为内容类型的总量;
点击频率特征的频度数值越大代表越频繁;
所述排序网络步骤包括:
S201:基于用户点击消息的行为,根据点击消息的时间、被点击消息的内容类型以及点击的频率,把点击的消息划分至具有对应向量特征的聚类,以实现消息的归类;
S202:预测用户的点击倾向,得到用户在某个时间段内倾向于点击的消息的内容类型;
S203:当新的消息来到时,根据朴素贝叶斯网络预测用户对该消息是否感兴趣;
S204:根据对新消息预测的兴趣度对新消息进行排序输出。
2.根据权利要求1所述的即时通讯消息提示的全排序方法,其特征在于,所述S102中,采用球面K均值的方式判断任意消息间的相似性,采用两个消息向量之间余弦大小来度量,任意两个消息向量间余弦夹角越小则越相似。
3.根据权利要求1所述的即时通讯消息提示的全排序方法,其特征在于,所述S202包括:
S2021:按照时间段统计,用户在规定的时间段内未点击某一内容类型的消息,且未点击时长超出阀值T,则认为该用户对该内容类型的消息不感兴趣,具体公式为:
Ti:U(Mi)∧(Tn–Tmi)T
其中,Ti表示第i个统计时间段,U表示未点击Mi类消息,Tn表示当前时间,Tmi表示该类消息的最新时间。
4.根据权利要求3所述的即时通讯消息提示的全排序方法,其特征在于,所述S202还包括:
S2022:把用户的点击行为按照时间特征和内容类型特征进行分解分别得到特征置信度:
时间特征记为T,计算:
P(T)=COUNT(Ti)/COUNT(T)
COUNT表示数量统计运算,Ti表示第i个时间段,其概率记为P(T);
内容类型特征记为C,与时间特征一样的运算方式,其概率记为P(C);
假设时间与内容类型是独立的概率关系,则可利用时间特征和内容类型特征作为特征置信度初始值,其组合置信度可直接采用乘法法则计算:
P(TC)=P(T)P(C)
P(T|C)=P(TC)/P(C)。
5.根据权利要求4所述的即时通讯消息提示的全排序方法,其特征在于,所述S203中预测公式如下:
其中P(c)表示用户兴趣度,P(d)表示特征置信度,P(d|c)表示组合置信度。
6.根据权利要求5所述的即时通讯消息提示的全排序方法,其特征在于,对n条消息预测的结果生成一个兴趣度数组,记为F=(F1,F2,…,Fn),对应用户对每条消息感兴趣的程度,排序网络对结果兴趣数组F输出,按照感兴趣的程度由高到低排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于企知道网络技术有限公司,未经企知道网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910142909.3/1.html,转载请声明来源钻瓜专利网。