[发明专利]文章质量评估方法、文章推荐方法及其对应的装置有效
申请号: | 202010279491.3 | 申请日: | 2020-04-10 |
公开(公告)号: | CN111488931B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 王艺如;黄申;黎功福;徐进;廖东亮 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06F40/30;G06V30/414;G06V30/416 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章 质量 评估 方法 推荐 及其 对应 装置 | ||
1.一种文章质量评估方法,其特征在于,包括:
获取待评估文章;
提取所述待评估文章的多模态特征,所述多模态特征包括排版外观特征、写作风格特征或文本语义特征中的至少两项,所述至少两项包括所述写作风格特征或所述文本语义特征中的至少一项;
基于所述多模态特征确定所述待评估文章的文章质量;
其中,所述写作风格特征是通过以下方式得到的:
获取所述待评估文章中所包含内容的至少两种写作特征;
对于每种所述写作特征,基于该写作特征与各所述写作特征之间的关联关系,确定各所述写作特征对应于该写作特征的权重,基于各所述写作特征对应于该写作特征的权重对各所述写作特征进行融合,得到该写作特征的关联特征;
基于各所述写作特征的关联特征,得到所述待评估文章的写作风格特征;
所述文本语义特征是通过以下方式得到的:
对所述待评估文章的文本内容进行分句处理,得到所述待评估文章所包含的各分句;
确定所述待评估文章中各分词的语义特征;
对于每个分句中的每个分词,基于该分词的语义特征与该分句中的各分词的语义特征之间的关联关系,确定该分句中的各分词对应于该分词的权重,基于该分句中的各分词的语义特征和各分词对应于该分词的权重,得到该分词对应的关联特征;
基于各所述分词的语义特征和各所述分词对应的关联特征,确定各分句的语义特征;
对于每个分句,基于该分句的语义特征与各所述分句的语义特征之间的关联关系,确定各所述分句对应于该分句的权重,基于各所述分句的语义特征和各所述分句对应于该分句的权重,确定该分句对应的关联特征;
基于各所述分句的语义特征和各所述分句对应的关联特征,确定所述待评估文章的文本语义特征。
2.根据权利要求1所述的方法,其特征在于,所述多模态特征包括所述排版外观特征,所述提取所述待评估文章的多模态特征,包括:
获取所述待评估文章的页面截图;
基于所述页面截图,通过图片处理模型,提取所述待评估文章中的排版外观特征。
3.根据权利要求2所述的方法,其特征在于,所述基于所述页面截图,通过图片处理模型,提取所述待评估文章中的排版外观特征,包括:
通过所述图片处理模型,确定各页面截图中每两个页面截图之间的关联特征,基于各页面截图和各关联特征,确定所述待评估文章中的排版外观特征,其中,所述关联特征表征页面截图之间的时序特征。
4.根据权利要求1所述的方法,其特征在于,所述写作特征为标题特征、正文特征、配图特征、插入视频特征或篇章结构特征中的至少一项。
5.根据权利要求1所述的方法,其特征在于,所述基于所述多模态特征确定所述待评估文章的文章质量,包括:
确定所述多模态特征中各特征的权重;
基于所述多模态特征中各特征的权重对各特征进行加权;
基于加权后的特征,确定所述待评估文章的文章质量。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述基于所述多模态特征确定所述待评估文章的文章质量是通过质量评估模型实现的,所述质量评估模型包括多模态特征提取网络和质量确定模块;
所述多模态特征提取网络用于提取所述待评估文章中的所述多模态特征;所述质量确定模块用于基于所述多模态特征确定所述待评估文章的文章质量。
7.根据权利要求6所述的方法,其特征在于,所述质量评估模型是通过以下方式训练得到的:
获取样本文章,所述样本文章携带有质量标注结果,质量标注结果用于标识样本文章的文章质量;
基于所述样本文章对初始网络模型进行训练,直至所述初始网络模型的损失函数收敛,将训练结束时的模型作为质量评估模型;
其中,所述损失函数的值表征了文章对应的质量预测结果和质量标注结果的差异程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010279491.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于医学护理实验的模型结构
- 下一篇:一种基于电场效应硅基内腔成形的方法