[发明专利]优化搜索结果标题的处理方法及装置在审
申请号: | 201510964509.2 | 申请日: | 2015-12-21 |
公开(公告)号: | CN105574175A | 公开(公告)日: | 2016-05-11 |
发明(设计)人: | 郑思晴;王洁;王艳丽;吴凯 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲;刘云贵 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 优化 搜索 结果 标题 处理 方法 装置 | ||
技术领域
本发明涉及计算机软件领域,具体涉及一种优化搜索结果标题的处理方 法及装置。
背景技术
用户输入搜索词进行搜索时,现有搜索模式下,搜索结果中的标题大多 直接使用搜索引擎抓取到的网页标题,出于搜索引擎优化及其他原因并没有 做太多的处理,因此搜索结果的标题会出现冗余、不必要的字段,使标题过 长,文字密集堆砌,既模糊了标题要表达的主题,又在标题显示时占用较多 屏幕空间,标题文字需要折行显示,影响用户的阅读感受。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分 地解决上述问题的优化搜索结果标题的处理方法及装置。
根据本发明的一个方面,提供了一种优化搜索结果标题的处理方法,其 包括:根据用户输入的搜索词,得到与所述搜索词匹配的搜索结果项,提取 所述搜索结果项对应的标题数据段;去除所述标题数据段中的冗余信息,而 后对所述标题数据段进行优化处理,得到优化后的搜索结果标题;基于所述 优化后的搜索结果标题生成搜索结果项加载到搜索结果页中。
进一步,所述去除标题数据段中的冗余信息进一步包括:去除所述标题 数据段中的重复字段;和/或,去除所述标题数据段中站点名后缀内容;和/ 或,去除所述标题数据段中频道及类型名称。
进一步,所述去除标题数据段中的冗余信息还包括:对于以智能摘要形 式展示的视频标题数据段,去除属性描述字段。
进一步,所述去除标题数据段中的冗余信息还包括:对于包含搜索结果 来源图标的标题数据段,去除所述标题数据段中的来源描述字段。
进一步,所述对标题数据段进行优化处理进一步包括:将所述标题数据 段中所有的冗余符号替换为空格。
进一步,所述冗余符号包括:分隔符,下划线,中括号,标点符号,和/ 或“”符号。
进一步,所述对标题数据段进行优化处理进一步包括:对于标题数据段 中省略号前只有一个字且不是搜索相关的字,将该字连同省略号一起去除。
进一步,所述方法还包括:抓取到所述搜索结果项对应的搜索结果缩略 图;所述将搜索结果项以及所述处理后的搜索结果标题加载到搜索结果页中 进一步包括:将所述搜索结果项、所述处理后的搜索结果标题以及所述搜索 结果缩略图加载到搜索结果页中。
根据本发明的另一方面,提供了一种搜索结果标题的处理装置,其包括: 搜索模块,适于根据用户输入的搜索词,得到与所述搜索词匹配的搜索结果 项,并抓取到所述搜索结果项对应的标题数据段;处理模块,适于去除所述 标题数据段中的冗余信息,而后对所述标题数据段进行优化处理,得到处理 后的搜索结果标题;加载模块,适于将所述搜索结果项以及所述处理后的搜 索结果标题加载到搜索结果页中。
进一步,所述处理模块进一步包括:去除单元,适于去除所述标题数据 段中的重复字段;和/或,去除所述标题数据段中站点名后缀内容;和/或, 去除所述标题数据段中频道及类型名称。
进一步,所述去除单元还适于:对于以智能摘要形式展示的视频标题数 据段,去除属性描述字段。
进一步,所述去除单元还适于:对于包含搜索结果来源图标的标题数据 段,去除所述标题数据段中的来源描述字段。
进一步,所述处理模块进一步包括:优化单元,适于将所述标题数据段 中所有的冗余符号替换为空格。
进一步,所述冗余符号包括:分隔符,下划线,中括号,标点符号,和/ 或“”符号。
进一步,所述优化单元还适于:对于标题数据段中省略号前只有一个字 且不是搜索相关的字,将该字连同省略号一起去除。
进一步,所述搜索模块还适于:抓取到所述搜索结果项对应的搜索结果 缩略图;所述加载模块进一步适于:将所述搜索结果项、所述处理后的搜索 结果标题以及所述搜索结果缩略图加载到搜索结果页中。
根据本发明的优化搜索结果标题的处理方法及装置,可以将搜索结果项 对应的标题数据段中的冗余信息去除,并进行优化处理。优化后的搜索结果 标题生成搜索结果项加载到搜索结果页中。这样使搜索结果的标题不再冗余, 去除掉不必要的字段后,可以使标题要表达的主题更加精简、突出,同时节 省了标题显示时占用的屏幕空间,用户阅读时可以一目了然,提高用户的阅 读效率,节省用户查询和阅读的时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510964509.2/2.html,转载请声明来源钻瓜专利网。