[发明专利]评论信息的确定方法、装置、电子设备及存储介质在审
申请号: | 202010398921.3 | 申请日: | 2020-05-12 |
公开(公告)号: | CN111782761A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 申世伟 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F16/34;G06F16/435 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 李娜 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评论 信息 确定 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供了一种评论信息的确定方法、装置、电子设备及存储介质。该方法包括:从多个多媒体对象中,确定出不相似对象对;获取每一个不相似对象对中的多媒体对象的评论信息中的相同评论信息,并确定为候选信息;获取候选信息的出现次数;根据候选信息的出现次数,从候选信息中选出至少部分信息,并确定为通用型评论;剔除多个多媒体对象的评论信息中出现的所述通用型评论,并将剩余的评论信息确定为目标评论信息,因此,本发明的方案,可以解决现有技术中从多媒体对象的评论信息中,提取通用型评论的准确度较低,从而不利于后续对多媒体对象的分析和理解的问题。
技术领域
本公开涉及计算机技术领域,尤其涉及一种评论信息的确定方法、装置、电子设备及存储介质。
背景技术
各短视频平台上的视频在被用户评论后,经常出现很多没有意义的通用型评论比如“666”、“赞赞赞”、“玫瑰玫瑰”。这些评论对视频的分析和理解是不利的。因此,可以借助算法的能力识别并剔除掉这些通用型评论,然后保留与视频有较大信息关联的评论,从而帮助后续的视频理解和分析。
其中,现有技术中,为了获取上述通用型的评论,往往将全部视频下的评论进行计数统计,然后取评论数最多的前几条评论作为通用型评论信息。然而,此种方式所提取的通用型评论中往往也会包括较多与视频有较大信息关联的相似评论,从而在将这些评论也当作通用型评论剔除时,不便于后续对视频的理解和分析。
由此可见,现有技术中,从多媒体对象的评论信息中,提取通用型评论的准确度较低,从而不利于后续对多媒体对象的分析和理解。
发明内容
本发明实施例提供一种评论信息的确定方法、装置、电子设备及存储介质,以解决现有技术中从多媒体对象的评论信息中,提取通用型评论的准确度较低,从而不利于后续对多媒体对象的分析和理解的问题。
根据本发明实施例的第一方面,提供一种评论信息的确定方法,包括:
从多个多媒体对象中,确定出不相似对象对,其中,一个不相似对象对中包括两个所述多媒体对象,且一个所述不相似对象对中包括的两个所述多媒体对象的相似度小于第一预设阈值;
获取每一个所述不相似对象对中的所述多媒体对象的评论信息中的相同评论信息,并确定为候选信息;
获取所述候选信息中的每一种候选信息的出现次数;
根据所述出现次数,从所述候选信息中选出至少一种候选信息,并确定为通用型评论;
剔除所述多个多媒体对象的评论信息中出现的所述通用型评论,并将剩余的评论信息确定为目标评论信息。
可选的,所述从多个多媒体对象中,确定出不相似对象对,包括:
获取每一个所述多媒体对象的特征信息;
根据所述特征信息,确定所述多媒体对象的特征向量;
获取所述多个多媒体对象中,每两个所述多媒体对象的特征向量的相似度;
将小于所述第一预设阈值的相似度对应的两个所述多媒体对象,确定为一个不相似对象对。
可选的,所述获取所述多个多媒体对象中,每两个所述多媒体对象的特征向量的相似度,包括:
采用余弦相似度算法,获取所述多个多媒体对象中,每两个所述多媒体对象的特征向量的相似度。
可选的,所述根据所述出现次数,从所述候选信息中选出至少一种候选信息,并确定为通用型评论,包括:
将所述候选信息中出现次数大于第二预设阈值的候选信息,确定为通用型评论。
可选的,所述根据所述出现次数,从所述候选信息中选出至少一种候选信息,并确定为通用型评论,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010398921.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种回收炉渣的标准化数据分析系统
- 下一篇:菜品信息推送方法、装置、电子设备
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置