[发明专利]论坛内容筛选方法、装置、计算机设备和存储介质在审
申请号: | 201811050669.6 | 申请日: | 2018-09-10 |
公开(公告)号: | CN109241433A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 李月明 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 筛选 论坛 内容筛选 内容特征 互动性 计算机设备 存储介质 发布内容 准确率 作弊 空洞 申请 | ||
1.一种论坛内容筛选方法,其特征在于,包括:
获取待筛选论坛内容;
从所述待筛选论坛内容中提取楼主发布内容的内容特征和互动性特征;以及
根据所述楼主发布内容的内容特征和互动性特征对所述待筛选论坛内容进行筛选。
2.如权利要求1所述的论坛内容筛选方法,其特征在于,所述根据所述楼主发布内容的内容特征和互动性特征对所述待筛选论坛内容进行筛选,包括:
根据所述内容特征获取所述待筛选论坛内容的内容质量得分;
根据所述互动性特征和所述内容质量得分判断所述待筛选论坛内容是否为优质内容;
如果不为所述优质内容,则将所述待筛选论坛内容过滤;以及
如果为所述优质内容,则将所述优质内容保存。
3.如权利要求2所述的论坛内容筛选方法,其特征在于,还包括:
获取所述楼主的用户特征;
根据所述楼主的用户特征对所述优质内容进行修正。
4.如权利要求2所述的论坛内容筛选方法,其特征在于,所述互动性特征包括互动次数、回复间隔时间以及回复内容的回复质量,其中,根据所述互动性特征和所述内容质量得分判断所述待筛选论坛内容是否为优质内容,包括:
判断所述内容质量得分是否大于预设质量阈值;
如果大于所述预设质量阈值,则进一步判断所述互动次数是否大于预设次数阈值;
如果大于所述预设次数阈值,则进一步判断回复间隔时间是否小于预设时间阈值;
如果所述回复间隔时间小于所述预设时间阈值,则对所述回复内容进行打分以生成回复内容质量评分值;
如果所述回复内容质量评分值大于预设质量评分阈值,则判断所述待筛选论坛内容为优质内容。
5.如权利要求3所述的论坛内容筛选方法,其特征在于,所述楼主的用户特征包括楼主发帖数和楼主粉丝数,所述根据所述楼主的用户特征对所述优质内容进行修正,包括:
如果所述楼主发帖数大于预设帖数阈值,且所述楼主粉丝数大于所述预设粉丝数阈值,则判断所述待筛选论坛内容为优质内容;
如果所述楼主发帖数小于或等于所述预设帖数阈值,或所述楼主粉丝数小于或等于所述预设粉丝数阈值,则判断所述待筛选论坛内容不为优质内容。
6.一种论坛内容筛选装置,其特征在于,包括:
第一获取模块,用于获取待筛选论坛内容;
提取模块,用于从所述待筛选论坛内容中提取楼主发布内容的内容特征和互动性特征;以及
筛选模块,用于根据所述楼主发布内容的内容特征和互动性特征对所述待筛选论坛内容进行筛选。
7.如权利要求6所述的论坛内容筛选装置,其特征在于,所述筛选模块包括:
获取单元,用于根据所述内容特征获取所述待筛选论坛内容的内容质量得分;
判断单元,用于根据所述互动性特征和所述内容质量得分判断所述待筛选论坛内容是否为优质内容;
过滤单元,用于在所述待筛选论坛内容不为所述优质内容时,将所述待筛选论坛内容过滤;以及
保存单元,用于在所述待筛选论坛内容为所述优质内容时,将所述优质内容保存。
8.如权利要求7所述的论坛内容筛选装置,其特征在于,还包括:
第二获取模块,用于获取所述楼主的用户特征;
修正模块,用于根据所述楼主的用户特征对所述优质内容进行修正。
9.一种计算机设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-5中任一所述的论坛内容筛选方法。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的论坛内容筛选方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811050669.6/1.html,转载请声明来源钻瓜专利网。