[发明专利]一种识别垃圾信息的方法与装置在审
申请号: | 201410128835.5 | 申请日: | 2014-04-01 |
公开(公告)号: | CN103970832A | 公开(公告)日: | 2014-08-06 |
发明(设计)人: | 刘昊;施鹏;张书娟;王坚;牛章鹏 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙) 11370 | 代理人: | 罗朋;赵晶 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 垃圾 信息 方法 装置 | ||
技术领域
本发明涉及网络信息技术领域,尤其涉及一种识别垃圾信息的技术。
背景技术
当前,在互联网社区产品中,如百度贴吧、新浪微博等,普遍存在垃圾信息,这些垃圾信息中包含恶意推广、甚至欺诈的内容,从而会伤害用户正常使用互联网社区产品的体验。
现有技术中,识别垃圾信息的方式主要包括以下2种:1)采用单纯的技术手段来进行识别,然而,由于垃圾信息的发布者会发布包含各种内容的垃圾信息,因此,采用这种方式不能完全有效地识别全部垃圾信息,且具有一定的滞后性;2)人工进行识别,然而,人工审核成本较高,且效率较低。
发明内容
本发明的目的是提供一种识别垃圾信息的方法与装置。
根据本发明的一个方面,提供了一种识别垃圾信息的方法,该方法包括:
-将已识别信息和待识别信息提供给一个或多个用户来进行垃圾信息判断;
-获取所述一个或多个用户所反馈的对所述已识别信息和所述待识别信息的判断结果;
-根据其中每个用户对所述已识别信息的判断结果,来确定每个用户判断垃圾信息的准确率;
-根据所述一个或多个用户对所述待识别信息的判断结果,并结合所述一个或多个用户判断垃圾信息的准确率,来确定所述待识别信息是否属于垃圾信息。
根据本发明的另一个方面,还提供了一种识别垃圾信息的装置,该装置包括:
-用于将已识别信息和待识别信息提供给一个或多个用户来进行垃圾信息判断的装置;
-用于获取所述一个或多个用户所反馈的对所述已识别信息和所述待识别信息的判断结果的装置;
-用于根据其中每个用户对所述已识别信息的判断结果,来确定每个用户判断垃圾信息的准确率的装置;
-用于根据所述一个或多个用户对所述待识别信息的判断结果,并结合所述一个或多个用户判断垃圾信息的准确率,来确定所述待识别信息是否属于垃圾信息的装置。
与现有技术相比,本发明通过将已识别信息和待识别信息提供给用户来进行垃圾信息判断,并根据其中每个用户判断垃圾信息的准确率来确定待识别信息是否属于垃圾信息。根据本发明的识别垃圾信息的方案,其一方面可以解决采用单纯的技术手段不能全面识别垃圾信息的问题,以提供更加纯净的网络环境,提升用户的使用体验;另一方面,可以使得企业不再需要雇佣审查专员来进行垃圾信息识别的工作,降低了企业成本,同时提高了垃圾信息的识别效率。进一步地,本发明通过确定用户对已识别信息进行垃圾信息判断的准确率,还可以解决一部分用户误判的问题,提升整体判断待识别信息是否属于垃圾信息的准确度。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的一种识别垃圾信息的方法的流程图;
图2示出根据本发明另一个方面的一种识别垃圾信息的装置的示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
本发明中对垃圾信息的识别通过网络设备和用户设备的交互来实现。具体地,网络设备将已识别信息和待识别信息提供给一个或多个用户设备;接着,用户设备对已识别信息和待识别信息进行呈现,以供用户进行垃圾信息判断;随后,用户设备将用户所反馈的对待识别信息和已识别信息的判断结果提供给网络设备,相应地,网络设备获取这些判断结果;接着,网络设备根据其中每个用户对已识别信息的判断结果,来确定每个用户判断垃圾信息的准确率;随后,网络设备根据用户对待识别信息的判断结果,并结合用户判断垃圾信息的准确率,来确定待识别信息是否属于垃圾信息。
在此,用户设备包括但不限于任何一种可与用户通过键盘、触摸板以及声控设备等输入设备进行人机交互的电子产品,例如计算机、手机、智能手机、PDA、平板电脑等。
在此,网络设备包括但不限于网络主机、单个网络服务器、多个网络服务器集合或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集合组成的一个超级虚拟计算机。
进一步地,本发明中,多个网络设备可作为整体或由其中部分网络设备,甚至装置于一个或多个网络设备中的特定装置,如信息识别装置,来与用户设备进行交互并获取其所提供的判断结果进而识别垃圾信息。如无特别说明,本文中网络设备与信息识别装置等同使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410128835.5/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置