[发明专利]文章质量检测方法和装置有效
申请号: | 201910552246.2 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110162797B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张小彬;付志宏;杨宇鸿;赖佳伟;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F16/35 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章 质量 检测 方法 装置 | ||
1.一种文章质量检测方法,其特征在于,包括以下步骤:
提取待检测文章在目标结构部分的内容,所述目标结构部分包括:标题部分、主体内容部分;
将所述内容输入与所述目标结构部分对应的分类模型,获取所述分类模型输出的文章类型;
获取与所述文章类型对应的第一质量评测模型;
将所述待检测文章输入所述第一质量评测模型,获取质量检测结果;或者
将所述文章类型和所述待检测文章输入至第二质量评测模型,获取所述质量检测结果。
2.如权利要求1所述的方法,其特征在于,当所述目标结构部分包含标题部分时,所述将所述内容输入与所述目标结构部分对应的分类模型,获取所述文章分类模型输出的文章类型,包括:
将所述待检测文章的标题输入第一分类模型,以使所述第一分类模型通过所述标题提取标题向量并根据所述标题向量生成并输出所述文章类型。
3.如权利要求1所述的方法,其特征在于,当所述目标结构部分包含主体内容部分时,所述将所述内容输入与所述目标结构部分对应的分类模型,获取所述文章分类模型输出的文章类型,包括:
将所述待检测文章的主体内容输入第二分类模型,以使所述第二分类模型提取所述主体内容多个局部特征并将所述多个局部特征拼接后,将拼接后的多个局部特征输出池化层获取主体内容向量并根据所述主体内容向量生成并输出所述文章类型。
4.如权利要求1所述的方法,其特征在于,在所述将所述内容输入与所述目标结构部分对应的分类模型之前,包括:
根据文章主旨建立文章分类体系,其中,所述文章分类体系包括多个文章类型及与所述多个文章类型中每个文章类型对应的子类型;
获取文章类型覆盖所述文章分类体系的训练文章样本;
根据所述训练文章样本训练所述分类模型,直至所述分类模型输出的文章类型与输入的训练文章样本一致时,完成对所述分类模型的训练。
5.如权利要求4所述的方法,其特征在于,所述获取文章类型覆盖所述文章分类体系的训练文章样本,包括:
获取与所述文章分类体系中的文章类型对应的多个网站地址;
根据所述多个网站地址确定与所述文章类型对应的训练文章样本。
6.一种文章质量检测装置,其特征在于,包括:
提取模块,用于提取待检测文章在目标结构部分的内容,所述目标结构部分包括:标题部分、主体内容部分;
第一获取模块,用于将所述内容输入与所述目标结构部分对应的分类模型,获取所述分类模型输出的文章类型;
生成模块,用于根据所述文章类型生成对所述待检测文章的质量检测结果;
所述生成模块,具体用于:
获取与所述文章类型对应的第一质量评测模型;
将所述待检测文章输入所述第一质量评测模型,获取所述质量检测结果;或者用于:
将所述文章类型和所述待检测文章输入至第二质量评测模型,获取所述质量检测结果。
7.如权利要求6所述的装置,其特征在于,还包括:
建立模块,用于根据文章主旨建立文章分类体系,其中,所述文章分类体系包括多个文章类型及与所述多个文章类型中每个文章类型对应的子类型;
第二获取模块,用于获取文章类型覆盖所述文章分类体系的训练文章样本;
训练模块,用于根据所述训练文章样本训练所述分类模型,直至所述分类模型输出的文章类型与输入的训练文章样本一致时,完成对所述分类模型的训练。
8.一种计算机设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-5中任一项所述的文章质量检测方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的文章质量检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910552246.2/1.html,转载请声明来源钻瓜专利网。