[发明专利]一种搜索方法和装置有效
申请号: | 201010287639.4 | 申请日: | 2010-09-19 |
公开(公告)号: | CN102402561A | 公开(公告)日: | 2012-04-04 |
发明(设计)人: | 王全礼;肖巍;钟延辉 | 申请(专利权)人: | 中国移动通信集团四川有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 王一斌;王琦 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 方法 装置 | ||
1.一种搜索方法,其特征在于,该方法包括:
预处理用户输入的关键词,得到待搜索关键词;
将待搜索关键词对应的数字向量进行标准化处理得到待搜索关键词对应的特征向量;
依据所述特征向量采用协同神经网络模式识别得到序参量,由序参量在数据库中获取最佳关键词。
2.根据权利要求1所述搜索方法,其特征在于,所述预处理包括,对所述用户输入的关键词进行切词处理。
3.根据权利要求2所述搜索方法,其特征在于,当所述用户输入的关键词长度超过预先设置的阈值长度,所述预处理进一步包括,修改所述用户输入的关键词;然后,对修改后的关键词进行切词处理。
4.根据权利要求1所述搜索方法,其特征在于,所述标准化处理包括,查询国标码库将所述待搜索关键词转换为数字向量;对所述数字向量进行对齐处理后,再进行零均值处理和归一化处理得到所述特征向量。
5.根据权利要求1所述搜索方法,其特征在于,所述依据所述特征向量采用协同神经网络模式识别得到序参量包括依据所述特征向量采用协同神经网络模式识别与原型向量数据库中的原型向量匹配,得到所述序参量。
6.根据权利要求1所述搜索方法,其特征在于,所述依据所述特征向量采用协同神经网络模式得到序参量包括,根据所述特征向量的维数将原型向量数据库的原型向量的维数分为多个子类,依据所述特征向量采用协同神经模式识别与每个子类中的原型向量匹配,得到所述序参量。
7.根据权利要求6所述搜索方法,其特征在于,所述根据所述特征向量的维数将原型向量数据库的原型向量的维数分为多个子类包括,所述原型向量的维数与所述特征向量的维数的比值向上取整为所述子类的数目。
8.根据权利要求6所述搜索方法,其特征在于,当所述序参量等于1,所述由序参量在数据库中获取最佳关键词包括,由所述序参量直接在数据库中获取所述最佳关键词。
9.根据权利要求6所述搜索方法,其特征在于,当所述序参量小于1,所述由序参量在数据库中获取最佳关键词包括,由大于预先设置阈值的所述序参量在数据库中获取所述最佳关键词。
10.一种搜索装置,其特征在于,包括预处理模块、标准化模块和模式识别模块,
预处理模块,用于预处理用户输入的关键词,得到待搜索关键词;
标准化模块,用于标准化处理待搜索关键词得到待搜索关键词对应的特征向量;
模式识别模块,用于依据所述特征向量采用协同神经网络模式识别得到序参量,由序参量在数据库中获取最佳关键词。
11.根据权利要求10所述搜索装置,其特征在于,所述预处理模块包括切词单元,
切词单元,用于对用户输入的关键词进行切词处理。
12.根据权利要求11所述搜索装置,其特征在于,所述预处理模块进一步包括修改单元,
修改单元,用于当所述用户输入的关键词长度超过预先设置的阈值长度,修改所述用户输入的关键词;
所述切词单元,进一步用于对所述修改单元输出的用户输入的关键词进行切词处理。
13.根据权利要求10所述搜索装置,其特征在于,所述标准化模块包括查询单元、对齐单元和处理单元,
查询单元,用于查询国标码库将所述待搜索关键词转换为所述数字向量;
对齐单元,用于对齐处理所述数字向量;
处理单元,用于对所述对齐处理后的数字向量向后进行零均值处理和归一化处理得到所述特征向量。
14.根据权利要求10所述搜索装置,其特征在于,所述模式识别模块包括模式识别单元和搜索单元,
模式识别单元,用于依据所述特征向量采用协同神经网络模式识别与原型向量数据库中的原型向量匹配得到所述序参量;
搜索单元,用于由所述序参量在数据库中获取最佳关键词。
15.根据权利要求14所述搜索装置,其特征在于,所述模式识别模块进一步包括分组单元和控制单元,
分组单元,用于根据所述特征向量的维数将原型向量数据库的原型向量的维数分为多个子类;
模式识别单元,进一步用于依据所述特征向量采用协同神经模式识别与每个子类中的原型向量匹配,得到所述序参量;
控制单元,用于当所述序参量等于1,由所述序参量直接在数据库中获取所述最佳关键词;当所述序参量小于1,由大于预先设置阈值的所述序参量在数据库中获取所述最佳关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团四川有限公司,未经中国移动通信集团四川有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010287639.4/1.html,转载请声明来源钻瓜专利网。