[发明专利]推广行为的检测方法及装置在审
申请号: | 201610037932.2 | 申请日: | 2016-01-20 |
公开(公告)号: | CN105718564A | 公开(公告)日: | 2016-06-29 |
发明(设计)人: | 李昕;刘奕群;茹立云;张敏;马少平;汪萌;洪日昌 | 申请(专利权)人: | 清华大学;北京搜狗科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100084 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推广 行为 检测 方法 装置 | ||
技术领域
本发明涉及网络信息智能处理技术领域,尤其涉及一种推广行为的检测方法及装置。
背景技术
问答社区作为一个供用户寻求和提供知识的平台而广泛流行,在问答社区中,用户可以提出一个问题,称为开放问题,其他用户可以对于该问题给出各自的答案,如果提问者对于某个答案满意的话,那么可以将此答案选为满意答案并关闭问题,关闭以后其他用户不可以继续回答。对于每个答案,问答社区用户可以投票赞成或者不赞成。问答社区也为搜索引擎用户提供了更多的搜索结果。例如,常用的问答社区在国外有Yahoo!Answers、Quora等,国内有百度知道、搜狗问问等。不同问答社区的组成部分大致相同,以搜狗问问为例,主要包括问题、答案、用户三个部分。
但是,有研究表明,问答社区中有较高比例的答案是低质量的,作弊者会在问答社区中将推广信息展示给用户以增加他们的商业利益,例如,在答案的前半部分包含了一些给提问者的高质量的建议,但是在答案的最后,回答者推广了一个产品,并给出了产品的购买链接,使得它成为了推广行为的一部分。这个答案可能会被现有的质量评估方法识别为高质量答案,因为它确实包含了一些有用的信息。但是,和有用信息同时提供的推广信息可能是有误导性的。因此,如何快速、并更加准确地从问答社区中检测推广作弊行为已成为亟待解决的问题。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种推广行为的检测方法,该方法能够通过抓取种子推广渠道来找到问答平台中具有推广行为的答案,有效并快速地检测出推广作弊行为,提升了问答社区用户体验,减小了用户的损失。
本发明的第二个目的在于提出一种推广行为的检测装置。
为达上述目的,本发明第一方面实施例提出了一种推广行为的检测方法包括:基于众包网站,获取所述众包网站中针对多个第一用户发布的多个推广任务信息,并根据所述多个推广任务信息获取N个第一推广渠道,以及将所述N个第一推广渠道作为种子推广渠道,其中,N为正整数;基于问答平台,获取所述问答平台中的多个答案信息、多个问题信息、以及多个第二用户信息,并确定所述多个答案信息以及多个问题信息中的M个第二推广渠道,其中,所述M个第二推广渠道包含所述种子推广渠道和非种子推广渠道,且M为正整数;根据所述M个第二推广渠道、多个答案信息、以及多个第二用户信息构建用户-渠道的二部图;根据所述种子推广渠道和用户-渠道的二部图计算所述二部图中每个用户与每个渠道分别对应的分数值;以及根据所述二部图中每个用户与每个渠道分别对应的分数值对所述多个答案信息进行推广行为检测。
根据本发明实施例的推广行为的检测方法,获取众包网站中多个第一用户发布的多个推广任务信息,并从中抓取出N个第一推广渠道以作为种子推广渠道,并获取问答平台中的多个答案信息、多个问题信息和第二用户信息,并确定这些答案和问题信息中所包含的第二推广渠道,之后,根据第二推广渠道、答案信息、以及第二用户信息构建用户-渠道的二部图,并根据种子推广渠道和用户-渠道的二部图计算二部图中每个用户与每个渠道对应的分数值,并根据该分数值对多个答案信息进行推广行为检测。该方法能够通过抓取种子推广渠道来找到问答平台中具有推广行为的答案,有效并快速地检测出推广作弊行为,提升了问答社区用户体验,减小了用户的损失。
在本发明的一个实施例中,所述N个第一推广渠道和所述M个第二推广渠道包括URL地址、电话号码、和/或社交媒体账号。
在本发明的一个实施例中,所述根据所述M个第二推广渠道、多个答案信息、以及多个第二用户信息构建用户-渠道的二部图,包括:根据所述多个第二用户信息确定多个第二用户;以所述多个第二用户、M个第二推广渠道作为所述二部图的节点,如果所述多个答案信息中包含第i第二推广渠道,其中,i为正整数,且1≤i≤M,则确定所述多个答案信息对应的第二用户,并建立所述多个答案信息对应的第二用户与所述第i第二推广渠道之间的对应关系,以所述构建用户-渠道的二部图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京搜狗科技发展有限公司,未经清华大学;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610037932.2/2.html,转载请声明来源钻瓜专利网。