[发明专利]账号识别、显示方法、装置、服务器、终端及存储介质有效
申请号: | 201810288695.6 | 申请日: | 2018-03-30 |
公开(公告)号: | CN110321546B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 卓居超 | 申请(专利权)人: | 深圳市腾讯计算机系统有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;H04L9/40 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 账号 识别 显示 方法 装置 服务器 终端 存储 介质 | ||
1.一种账号识别方法,其特征在于,包括:
确定待识别发文账号;
获取与所述待识别发文账号的发文行为相关的第一信息;所述第一信息包括所述待识别发文账号发表的文章序列;
获取与所述待识别发文账号的账号属性相关的第二信息;
依据所述第一信息中的文章序列中的文章的排序,顺序获取每篇所述文章中依次排序的每个词,生成所述文章序列的词序列;
将所述词序列中的每个词转换成词向量,得到与所述词序列对应的词向量序列;
将所述文章序列的所述词向量序列输入至发文账号识别模型,基于所述发文账号识别模型对所述词向量序列进行处理,输出作为第一识别信息的所述文章序列的表示;
将所述第一识别信息与所述第二信息输入至注意力机制模型,根据所述第二信息对所述文章序列的表示进行处理,得到所述文章序列中每篇所述文章的评分;
基于所确定的每篇文章的评分对所述文章序列的表示进行处理,得到作为第二识别信息的所述文章序列的最终表示,所述第二识别信息用于账号识别。
2.根据权利要求1所述的方法,其特征在于,所述获取与所述待识别发文账号的账号属性相关的第二信息,包括:
确定所述待识别发文账号的至少一个账号属性以及所述至少一个账号属性中每个所述账号属性的属性值;
根据所述账号属性的属性值确定与所述账号属性对应的属性参数;
基于所确定的所述至少一个账号属性中每个所述账号属性对应的属性参数,生成第二信息,所述至少一个账号属性中每个所述账号属性对应的属性参数为所述第二信息中的一个元素。
3.根据权利要求1所述的方法,其特征在于,还包括:
确定至少一个发文账号训练样本;
获取与所述发文账号训练样本的发文行为相关的第一信息和与所述发文账号训练样本的账号属性相关的第二信息;
基于所述发文账号训练样本的第一信息确定所述发文账号训练样本的词向量序列,将所述词向量序列输入至循环神经网络模型,基于所述循环神经网络模型对所述词向量序列进行处理,得到第一识别信息;
将所述第一识别信息和第二信息输入至注意力机制模块,基于所述注意力机制模块对所述第一识别信息和第二信息进行处理,得到第二识别信息;
对所述第二识别信息进行分类预测,得到分类预测结果;
基于所述分类预测结果反向调节所述循环神经网络模型中用于对所述词向量序列进行处理的参数和所述注意力机制模块中用于对所述第一识别信息和第二信息进行处理的参数,以生成与所述循环神经网络模型对应的发文账号识别模型以及与所述注意力机制模块对应的注意力机制模型。
4.根据权利要求3所述的方法,其特征在于,所述对所述第二识别信息进行分类预测,得到分类预测结果,包括:
将所述第二识别信息输入至softmax函数,对所述第二识别信息进行分类预测,得到分类预测结果。
5.一种账号显示方法,其特征在于,包括:
接收发文账号显示请求;
获取所述发文账号显示请求指示的各个发文账号;
确定每个所述发文账号所属的发文账号类别,所述发文账号类别为垃圾发文账号类别或非垃圾发文账号类别;
基于与所述发文账号类别相关的发文账号显示规则,显示各个所述发文账号;其中,基于权利要求1~4任意一项所述的账号识别方法得到的识别结果,实现对各个所述发文账号的显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810288695.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种办公文档排版的方法和装置
- 下一篇:一种命名实体确定方法及装置