[发明专利]一种对查询词分类的方法、装置及搜索引擎系统有效
申请号: | 200710304182.1 | 申请日: | 2007-12-25 |
公开(公告)号: | CN101211368A | 公开(公告)日: | 2008-07-02 |
发明(设计)人: | 张智敏;张阔;茹立云 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 郑自群;逯长明 |
地址: | 100084北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 查询 分类 方法 装置 搜索引擎 系统 | ||
技术领域
本发明涉及搜索查询领域,特别是涉及一种对查询词分类的方法、装置及包含该装置的搜索引擎系统。
背景技术
随着计算机技术、互联网技术的飞速发展,互联网带给人们生活的改变越来越大,越来越多人的生活离不开计算机、离不开互联网络。搜索引擎就是伴随着互联网的发展而发展起来的,使用搜索引擎,人们可以很方便的获取其想要知道的信息。在使用搜索引擎查询信息之前,首先得输入查询词。通过对查询词进行定位分析,才能定位至与查询词有关的信息,再提供给用户。查询词的分类对于搜索引擎非常重要,比如“苹果”这个词,既属于水果,又是一种电脑。确定一个查询词都属于哪些类别,一方面可以使搜索结果趋于多样化,另一方面可以避免出现无关的结果,更精确的定位查询消息,提高查询效率。并且,可以根据查询词的分类及各分类所占的比例搜索出对应的网页内容信息,从而提高搜索查询效率。对用户输入的查询词进行分类是一项非常复杂的技术。现有的查询词分类一般是使用人工的方式,确定某一个词属于哪一个类别,但是互联网用户的查询词数量极大,每天需要处理的查询词可能上千万,对这么大数量的查询词进行人工分类显然是不可能的,因此现在进行的手动查询词分类针对仅仅能满足小范围的分类,并且进行手动查询词分类,会造成资源的大量浪费,成本高、并且效率非常低,不能充分的发挥计算机、互联网的优势。因此,迫切需要一种自动对用户的查询词进行分类的方法。
发明内容
本发明所要解决的技术问题是提供一种对查询词分类的方法及装置,本发明还提供一种包括所述装置的搜索引擎系统。
为了解决上述问题,本发明公开了一种对查询词分类的方法,包括:
获取用户输入的查询词;
记录用户利用该查询词点击的网页;
获取所述网页的分类信息;
依据分类参数确定所述查询词的分类结果,所述分类参数包括网页的分类信息。
其中,所述网页的分类信息包括网页的简单分类或者网页分类的比例,所述查询词的分类结果对应包括简单分类或分类比例。
其中,所述分类参数还包括所述查询词指向所述网页的访问次数或者访问比例。
进一步,还包括:
对网页进行分类,创建网页分类库。
进一步,还包括:
用户输入查询词时,根据所述查询词的分类结果确定搜索网页内容信息。
本发明还公开了一种对查询词分类的装置,包括:
接收单元,用于获取用户输入的查询词;
记录单元,用于记录用户利用查询词点击的网页;
获取单元,用于获取所述网页的分类信息;
确定单元,用于依据分类参数确定所述查询词的分类结果,所述分类参数包括网页的分类信息。
其中,所述网页的分类信息包括网页的简单分类或者网页分类的比例,所述查询词的分类结果对应包括简单分类或分类比例。
其中,所述分类参数还包括所述查询词指向所述网页的访问次数或者访问比例。
进一步,还包括:
创建单元,用于对网页进行分类,创建网页分类库。
进一步,还包括:
第二确定单元,用于根据所述查询词的分类结果确定搜索网页内容信息。
本发明还公开了一种搜索引擎系统。
与现有技术相比,本发明具有以下优点:
本发明通过对查询词对应的网页分类确定查询词的分类,提高了查询词分类的效率,节约了资源;当用户利用查询词搜索网页信息时,根据本发明确定的查询词的分类以及各分类所占的比例,能够更加准确的定位到用户想获取的网页内容信息,避免了无关网页内容信息的产生,节约了网络资源,提高了查询效率。
附图说明
图1是本发明一种对查询词分类的方法第一实施例的流程图;
图2是本发明一种对查询词分类的方法第二实施例的流程图;
图3是本发明一种对查询词分类的方法第三实施例的流程图;
图4是本发明一种对查询词分类的装置第一实施例的结构框图;
图5是本发明一种对查询词分类的装置第二实施例的结构框图;
图6是本发明一种对查询词分类的装置第三实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、以及包括以上任何系统或设备的分布式计算环境等等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710304182.1/2.html,转载请声明来源钻瓜专利网。