[发明专利]内容质量评价方法、装置、介质及电子设备在审
申请号: | 202111671403.5 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114428837A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 李博文;曹延泽;陆可;孙海伦;刘长虹;吴迪;郑铭鑫;韩宇;孙浩 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/216;G06F40/289;G06K9/62 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 魏嘉熹 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内容 质量 评价 方法 装置 介质 电子设备 | ||
本公开涉及一种内容质量评价方法、装置、介质及电子设备,所述方法包括:获取目标用户针对目标内容的第一评价结果和评价文本;根据所述评价文本,确定所述目标内容的第二评价结果;确定所述目标用户和所述目标内容对应的匹配度;根据所述第一评价结果、所述第二评价结果和所述匹配度,确定所述目标用户针对所述目标内容的质量评价结果。由此结合上述三者确定质量评价结果可以充分考虑用户输入的评价分数和评论文本,以使得确定出的质量评价结果与用户输入的评价文本之间保持一致性。同时结合用户与内容之间的匹配度可以在一定程度上降低用户的主观影响,保证该质量评价结果的准确性和客观性,提高该质量评价结果与该目标内容之间的匹配程度。
技术领域
本公开涉及数据处理领域,具体地,涉及一种内容质量评价方法、装置、介质及电子设备。
背景技术
文本情感分析是指用自然语言处理技术、文本挖掘以及计算机语言学等方法对带有情感色彩的主观性文本进行分析、处理和抽取的过程。
针对于电影、电视剧等内容质量评价系统,观众用户会给出自己的对于该内容的评价文本和以及评价分数,从而实现对该内容的质量评价,以对其他用户进行相应的内容推荐。然而在上述评价方式中,评分通常采用五分制,用户直接输入评分时很容易直接给出满分的评价,然而可能该用户对应的评价文本并非完全正面,即在一定程度上来说用户输入的评价评分和评价文本往往是不匹配的,从而使得许多内容的评价分数往往是虚高的,难以为用户提供准确的内容查看参考。
发明内容
本公开的目的是提供一种准确的、客观的内容质量评价方法、装置、介质及电子设备。
为了实现上述目的,根据本公开的第一方面,提供一种内容质量评价方法,所述方法包括:
获取目标用户针对目标内容的第一评价结果和评价文本;
根据所述评价文本,确定所述目标内容的第二评价结果;
确定所述目标用户和所述目标内容对应的匹配度;
根据所述第一评价结果、所述第二评价结果和所述匹配度,确定所述目标用户针对所述目标内容的质量评价结果。
可选地,所述确定所述目标用户和所述目标内容对应的匹配度,包括:
基于所述目标用户的历史评价文本,确定所述目标用户对应的用户向量;
基于所述目标内容对应的多个评价文本,确定所述目标内容对应的内容向量;
根据所述用户向量和所述内容向量,确定所述匹配度。
可选地,所述基于所述目标用户的历史评价文本,确定所述目标用户对应的用户向量,包括:
对所述历史评价文本进行聚类,获得所述历史评价文本对应的多个聚类簇;
针对每一所述聚类簇,将该聚类簇中文本长度小于预设的长度阈值的历史评价文本进行拼接,获得至少一个拼接文本;
基于各个聚类簇中的拼接文本、以及文本长度不小于所述长度阈值的历史评价文本、和主题生成模型,确定所述目标用户对应的主题词,并基于所述主题词对应的向量,确定所述用户向量。
可选地,所述基于所述目标内容对应的多个评价文本,确定所述目标内容对应的内容向量,包括:
确定所述目标内容对应的多个评价文本中的每一分词对应的词频和逆向文档频率,以及所述分词对应的文本长度比例,其中,所述分词对应的文本长度比例为所述分词所属的评价文本的长度与所述多个评价文本的平均文本长度的比值;
针对每一所述分词,将所述分词对应的词频、逆向文档频率和所述分词对应的文本长度比例的乘积确定为所述分词对应的目标参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111671403.5/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法