[发明专利]社交网络账号识别方法、装置及电子设备有效
申请号: | 202010843882.3 | 申请日: | 2020-08-20 |
公开(公告)号: | CN114077710B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 刘刚 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络 账号 识别 方法 装置 电子设备 | ||
1.一种社交网络账号识别方法,其特征在于,包括:
接收社交网络账号发布的多个信息、以及对应的类别和发布时间;
根据所述多个信息的发布时间的先后顺序,将所述多个信息的类别组合成类别序列;
从所述类别序列中提取表征至少一种维度的变异特征,其中,所述变异特征表征所述社交网络账号所发布的信息的变异程度,所述至少一个维度的变异特征包括以下至少之一:类别波动特征、类别差异特征以及类别匹配特征,所述类别波动特征表征所述多个信息之间的垂类波动程度,所述类别差异特征表征所述多个信息之间的差异变化程度,所述类别匹配特征表征所述多个信息与所述社交网络账号的匹配程度;
根据所述至少一种维度的变异特征,确定所述社交网络账号的原创识别结果。
2.根据权利要求1所述的方法,其特征在于,
当所述至少一个维度的变异特征包括所述类别波动特征时;
所述从所述类别序列中提取表征至少一种维度的变异特征,包括:
对所述类别序列进行第一轮采样处理,得到多个第一子序列;
根据每个所述第一子序列中末尾类别的出现次数,确定与所述出现次数负相关的第一波动特征;
对所述类别序列进行第二轮采样处理,得到多个第二子序列;
确定每个所述第二子序列对应的信息与相邻子序列对应的信息之间的类别相似度;
确定与所述类别相似度负相关的第二波动特征;
将每个所述第一子序列对应的第一波动特征进行融合处理,和/或,将每个所述第二子序列对应的第二波动特征进行融合处理,并将融合处理结果作为所述类别序列的类别波动特征;
其中,所述相邻子序列是所述第二子序列之后首个被采集到的子序列。
3.根据权利要求2所述的方法,其特征在于,
所述对所述类别序列进行第一轮采样处理,得到多个第一子序列,包括:
通过第一采样窗口对所述类别序列进行多次滑动采样,将每次滑动后所述第一采样窗口内的多个类别作为采样得到的第一子序列;
其中,所述第一采样窗口的长度小于所述类别序列的长度,且所述第一轮采样窗口的滑动步长小于所述第一采样窗口的长度;
所述对所述类别序列进行第二轮采样处理,得到多个第二子序列,包括:
通过第二采样窗口对所述类别序列进行多次滑动采样,将每次滑动后所述第二采样窗口内的多个类别作为采样得到的第二子序列;
其中,所述第二采样窗口的长度小于所述类别序列的长度,且所述第二轮采样窗口的滑动步长等于所述第二采样窗口的长度。
4.根据权利要求2所述的方法,其特征在于,所述确定每个所述第二子序列对应的信息与相邻子序列对应的信息之间的类别相似度,包括:
针对每个所述第二子序列执行以下处理:
将所述第二子序列包括的每个类别对应的词向量组合,得到所述第二子序列的词向量,并
将所述相邻子序列包括的每个类别对应的词向量组合,得到所述相邻子序列的词向量;
将所述第二子序列的词向量与所述相邻子序列的词向量之间的余弦距离,确定为所述第二子序列对应的信息与所述相邻子序列对应的信息之间的类别相似度。
5.根据权利要求2所述的方法,其特征在于,所述确定每个所述第二子序列对应的信息与相邻子序列对应的信息之间的类别相似度,包括:
针对每个所述第二子序列执行以下处理:
生成所述第二子序列的词表,其中,所述第二子序列的词表包括所述第二子序列对应的多个信息中每个词语的出现次数,并
生成所述相邻子序列的词表,其中,所述相邻子序列的词表包括所述相邻子序列对应的多个信息中每个词语的出现次数;
将所述第二子序列的词表与所述相邻子序列的词表之间的相似度,确定为所述子序列对应的信息与相邻子序列对应的信息之间的类别相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010843882.3/1.html,转载请声明来源钻瓜专利网。