[发明专利]基于搜索的3C类UGC数据的推荐方法及装置在审
申请号: | 201611213542.2 | 申请日: | 2016-12-23 |
公开(公告)号: | CN106649740A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 王艳丽;陈营营;马华蓉;佟思颖;高苏丹 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙)11391 | 代理人: | 康正德,盛惠华 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 搜索 ugc 数据 推荐 方法 装置 | ||
技术领域
本发明涉及互联网应用技术领域,特别是一种基于搜索的3C类UGC数据的推荐方法及装置。
背景技术
现代网络有大量的UGC(User Gernerated Content,用户生成内容),其也被称为UCC(User Created Content,用户创建内容),如论坛帖、微信公众号、头条号、兴趣部落帖子等,其中可以包括用户录制的视频、音频,用户拍摄的图片以及用户创作的文字内容等,这些内容里不乏优质资讯,但在各家搜索引擎产品中没有被充分挖掘出来,并添加到相关结果中。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于搜索的3C类UGC数据的推荐方法及相应的装置。
依据本发明的一方面,提供了一种基于搜索的3C类UGC数据的推荐方法,包括:
基于针对3C类的一个或多个热门词汇,从关于3C类的多个UGC网站中抓取所述一个或多个热门词汇各自对应的UGC数据;
当接收到与3C类相关的目标搜索词时,将所述目标搜索词与所述一个或多个热门词汇进行匹配,得到匹配的热门词汇对应的UGC数据;
将得到的UGC数据聚合至所述目标搜索词对应的搜索结果页的推荐项。
可选地,在基于针对3C类的一个或多个热门词汇,从关于3C类的多个UGC网站中抓取所述一个或多个热门词汇各自对应的UGC数据之前,所述方法还包括:
抓取指定网站中推荐的针对3C类的一个或多个热门词汇。
可选地,抓取指定网站中推荐的针对3C类的一个或多个热门词汇,包括:
抓取指定网站中推荐的针对3C类的一个或多个热门词汇,并生成包含所述一个或多个热门词汇的词表;
当根据第一指定抓取频率下一次抓取到指定网站中推荐的针对3C类的热门词汇时,利用所述下一次抓取到的热门词汇更新生成的所述词表。
可选地,基于针对3C类的一个或多个热门词汇,从关于3C类的多个UGC网站中抓取所述一个或多个热门词汇各自对应的UGC数据,包括:
基于生成的所述词表,按照第二指定抓取频率从关于3C类的多个UGC网站中抓取所述词表中的热门词汇各自对应的UGC数据。
可选地,所述关于3C类的多个UGC网站包括:从网络中的多个UGC网站中筛选出的关于3C类的至少一个优质UGC网站。
可选地,从网络中的多个UGC网站中筛选出关于3C类的至少一个优质UGC网站,包括:
收集网络中的关于3C类的多个UGC网站;
根据一个或多个衡量因子衡量出所述多个UGC网站的质量情况,并从中筛选出质量满足指定质量条件的至少一个UGC网站作为优质UGC网站。
可选地,当衡量因子包括多个时,根据多个衡量因子衡量出所述多个UGC网站的质量情况,包括:
基于权重策略确定所述多个衡量因子各自的权重;
获取所述多个UGC网站的所述多个衡量因子各自的数值;
将所述多个UGC网站的所述多个衡量因子各自的数值与权重进行加权求和,得到综合数值;
根据所述多个UGC网站各自的综合数值衡量出所述多个UGC网站的质量情况。
可选地,所述一个或多个热门词汇各自对应的UGC数据包括多条,则在基于针对3C类的一个或多个热门词汇,从关于3C类的多个UGC网站中抓取所述一个或多个热门词汇各自对应的UGC数据之后,所述方法还包括:
获取UGC数据的属性信息;
基于获取的属性信息对所述一个或多个热门词汇各自对应的多条UGC数据进行排序,得到排序后的UGC数据,从而在后续匹配上热门词汇时,提供该热门词汇的排序后的UGC数据。
可选地,所述属性信息包括下列至少之一:
发布时间、用户阅读数、用户评论数、用户转载数、有无图片。
可选地,所述推荐项位于所述搜索结果页的右侧区域。
可选地,若所述搜索结果页的右侧区域包含其他推荐数据,将得到的UGC数据聚合至所述目标搜索词对应的搜索结果页的推荐项,包括:
根据所述其他推荐数据对得到的UGC数据进行去重处理,将去重处理后的UGC数据聚合至所述目标搜索词对应的搜索结果页的推荐项。
可选地,将得到的UGC数据聚合至所述目标搜索词对应的搜索结果页的推荐项,包括:
将得到的UGC数据以轮播图和/或文字链接的形式聚合至所述目标搜索词对应的搜索结果页的推荐项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611213542.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多轮交互信息继承识别方法、装置以及交互系统
- 下一篇:茶几(89915)
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置