[发明专利]在搜索结果页中聚合人物类资讯信息的方法及装置在审
申请号: | 201611213441.5 | 申请日: | 2016-12-23 |
公开(公告)号: | CN106649738A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 王艳丽;陈营营;马华蓉;佟思颖;高苏丹 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙)11391 | 代理人: | 康正德,孙晓芳 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 结果 聚合 人物 资讯 信息 方法 装置 | ||
1.一种在搜索结果页中聚合人物类资讯信息的方法,包括:
接收到用户在搜索引擎上输入的与人物类相关的目标搜索词;
判断所述目标搜索词是否命中人物类预设词表,其中,所述人物类预设词表中记录了N个人物类预设词,N为整数,且N大于1;
若是,在从互联网中搜索所述目标搜索词的同时,在结构化的人物类资讯内容数据库中查找与所述目标搜索词匹配的资讯信息,其中,所述人物类资讯内容数据库按如下步骤生成:收集针对人物类的多个用户生成内容UGC网站,并从所述多个UGC网站中抓取与所述人物类预设词表中各个人物类预设词相关的资讯信息;对抓取的所述资讯信息进行处理,按照每条资讯信息相关的人物类预设词进行分类,生成具有人物类预设词和资讯属性的所述结构化的人物类资讯内容数据库;
将所述匹配的资讯信息聚合至所述目标搜索词对应的搜索结果页展现给用户。
2.根据权利要求1所述的方法,其中,接收到用户在搜索引擎上输入的与人物类相关的目标搜索词之前,所述方法还包括:
获取预定数据库中点击率和/或搜索率排名最靠前的N个人物类预设词,组成所述人物类预设词表。
3.根据权利要求1所述的方法,其中,对抓取的所述资讯信息进行处理,按照每条资讯信息相关的人物类预设词进行分类,生成具有人物类预设词和资讯属性的所述结构化的人物类资讯内容数据库,包括:
按照抓取的每条资讯信息相关的人物类预设词进行分类,并根据每条资讯信息的资讯属性进行优化排序,生成具有人物类预设词和资讯属性的所述结构化的人物类资讯内容数据库。
4.根据权利要求3所述的方法,其中,所述资讯属性包括:资讯发布时间和/或资讯的评论数。
5.根据权利要求1至4任一项所述的方法,其中,对于专业信息发布平台类的UGC网站,从所述多个UGC网站中抓取与所述N个人物类预设词相关的资讯信息,包括:
在所述专业信息发布平台类的UGC网站的搜索框内分别输入所述N个人物类预设词,按发布时间抓取所述N个人物类预设词中各个人物类预设词相关的资讯信息;或者,
在所述专业信息发布平台类的UGC网站发布的资讯信息中标注人物类资讯,从标注的人物类资讯中抓取与所述N个人物类预设词相关的资讯信息。
6.根据权利要求1至4任一项所述的方法,其中,对于网络主题社区类的UGC网站,从所述多个UGC网站中抓取与所述N个人物类预设词相关的资讯信息,包括:
针对所述N个人物类预设词中的每个人物类预设词,在所述主题类的UGC网站中确定该人物类预设词对应的用户所在的主题社区,从该人物类预设词对应的用户所在的主题社区中最大主题社区中抓取名称title或正文包含该人物类预设词的资讯信息。
7.根据权利要求1至4任一项所述的方法,其中,对于网络问答社区类的UGC网站,从所述多个UGC网站中抓取与所述N个人物类预设词相关的资讯信息,包括:
判断所述网络问答社区类的UGC网站中每个发表的问题的类别是否与人物类相关,如果是,则判断该发表的问题及该问题的回答中是否包含有与所述N个人物类预设词中一个或多个对应的关键词,如果有,则抓取该发表的问题及该问题的回答作为所述N个人物类预设词中一个或多个人物类预设词相关的资讯信息。
8.根据权利要求1至4任一项所述的方法,其中,将所述匹配的资讯信息聚合至所述目标搜索词对应的搜索结果页展现给用户,包括:
在所述搜索结果页的左侧展现从互联网上搜索所述目标搜索词的结果;
判断所述匹配的资讯信息中是否有与所述搜索结果页左侧展现的结果中相同的资讯信息,如果有,则将所述匹配的资讯信息中的所述相同的资讯信息去除;
将去除所述相同的资讯信息后的所述匹配的资讯信息聚合至所述目标搜索词对应的搜索结果页的右侧区域展现给用户。
9.根据权利要求1至4任一项所述的方法,其中,将所述匹配的资讯信息聚合至所述目标搜索词对应的搜索结果页展现给用户之后,所述方法还包括:
统计用户针对所述搜索结果页上展现的所述匹配的资讯信息的触发操作,得到统计结果;
根据所述统计结果确定在后续搜索请求对应的页面中是否展现所述匹配的资讯信息。
10.一种在搜索结果页中聚合人物类资讯信息的装置,包括:
接收模块,用于接收到用户在搜索引擎上输入的与人物类相关的目标搜索词;
判断模块,用于判断所述目标搜索词是否命中人物类预设词表,其中,所述人物类预设词表中记录了N个人物类预设词,N为整数,且N大于1;
搜索模块,用于在所述判断模块确定所述目标搜索词是否命中人物类预设词表的情况下,在从互联网中搜索所述目标搜索词的同时,在结构化的人物类资讯内容数据库中查找与所述目标搜索词匹配的资讯信息,其中,所述人物类资讯内容数据库按如下步骤生成:收集针对人物类的多个用户生成内容UGC网站,并从所述多个UGC网站中抓取与所述人物类预设词表中各个人物类预设词相关的资讯信息;对抓取的所述资讯信息进行处理,按照每条资讯信息相关的人物类预设词进行分类,生成具有人物类预设词和资讯属性的所述结构化的人物类资讯内容数据库;
展现模块,用于将所述匹配的资讯信息聚合至所述目标搜索词对应的搜索结果页展现给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611213441.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:针对综艺类query的搜索结果的推送方法及装置
- 下一篇:床头柜(云)