[发明专利]一种评论分类方法、装置、设备及存储介质有效
申请号: | 202210646589.7 | 申请日: | 2022-06-09 |
公开(公告)号: | CN115168677B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 甘心;肖冠正 | 申请(专利权)人: | 天翼爱音乐文化科技有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 陈嘉乐 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评论 分类 方法 装置 设备 存储 介质 | ||
本发明公开了一种评论分类方法、装置、设备及存储介质,本发明通过获取评论数据,评论数据包括用户评论、所述用户评论对应的评论时间、用户属性、用户IP地址,根据所述用户评论、所述用户属性以及自然语言处理模型,得到第一真实概率,根据所述评论时间确定预设时间范围内与所述用户IP地址相同的评论数量,并根据所述评论数量以及函数模型,计算得到第二真实概率,根据所述第一真实概率以及所述第二真实概率确定评论分类结果,基于评论时间、用户IP地址以及函数模型辅助自然语言模型得到评论分类结果,提高了评论分类的准确性;自动生成评论分类结果而不需要人工干预,提高了准确率以及效率,本发明可广泛应用于自然语言处理技术领域。
技术领域
本发明涉及自然语言处理领域,尤其是一种评论分类方法、装置、设备及存储介质。
背景技术
目前,随着互联网技术的发展,各类平台的用户数量逐渐增长,用户在平台中观看或收听相应的内容如视频、音乐、视频彩铃等可以在评论区发表自己的评论表达自己的感受。而实际上用户的评论可能会存在如机器生成等虚假评论,从而影响评论的真实性,因此需要辨别真假评论,而现今辨别真假评论通常通过人工检测,视频彩铃评论数量众多,若采用人工检测则需要无休止地投入大量的人力和时间,成本高,实时性差、效率低且准确率低。
发明内容
有鉴于此,为了解决上述技术问题的至少之一,本发明的目的是提供一种评论分类方法、装置、设备及存储介质,提高准确率和效率。
本发明实施例采用的技术方案是:
一种评论分类方法,包括:
获取评论数据;所述评论数据包括用户评论、所述用户评论对应的评论时间、用户属性、用户IP地址;
根据所述用户评论、所述用户属性以及自然语言处理模型,得到第一真实概率;
根据所述评论时间确定预设时间范围内与所述用户IP地址相同的评论数量,并根据所述评论数量以及函数模型,计算得到第二真实概率;
根据所述第一真实概率以及所述第二真实概率确定评论分类结果。
进一步,所述根据所述用户评论、所述用户属性以及自然语言处理模型,得到第一真实概率,包括:
将所述用户属性进行第一编码处理,得到第一矩阵;
将所述用户评论进行第二编码处理,得到第二矩阵;
将所述第一矩阵以及所述第二矩阵进行拼接,通过全连接层以及sigmoid函数对拼接结果进行转化,得到第一真实概率。
进一步,所述将所述用户属性进行第一编码处理,得到第一矩阵,包括:
通过词向量模型将所述用户属性编码为第一向量;
通过GRU编码器将所述第一向量编码为上下文相关向量;
对所述上下文相关向量进行拼接处理,得到第一矩阵。
进一步,所述将所述用户评论进行第二编码处理,得到第二矩阵,包括:
通过词向量模型将所述用户评论编码为第二向量;
根据所述第二向量与第一权重构造Query向量、根据所述第二向量与第二权重构造Key向量、根据所述第二向量与第三权重构造Value向量;
将所述Query向量、所述Key向量以及所述Value向量统一处理至预设长度;
根据预设长度的所述Query向量、预设长度的所述Key向量以及预设长度的所述Value向量计算带自注意力的矩阵表达,得到第二矩阵。
进一步,所述根据所述评论数量以及函数模型,计算得到第二真实概率,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼爱音乐文化科技有限公司,未经天翼爱音乐文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210646589.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种外科用便携式存储设备
- 下一篇:一种城市供水管道维修用堵水设备