[发明专利]拼音搜索方法有效
申请号: | 201010618367.1 | 申请日: | 2010-12-22 |
公开(公告)号: | CN102567406A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 陈千华 | 申请(专利权)人: | 北京新媒传信科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拼音 搜索 方法 | ||
技术领域
本发明涉及计算机汉字拼音识别与搜索技术领域,特别涉及一种拼音搜索方法。
背景技术
随着计算机应用的普及,网络即时通信软件成为人们日常生活中的常用软件之一,方便了大家的日常交流互通。各种即时通信软件中都会有联系人搜索功能,但是联系人的昵称或者姓名中可能会含有多音字,很多即时通信软件中并不支持多音字的多种读音,导致有时候搜索不出联系人。这种搜索有一些特点:联系人昵称、姓名都不会很长,数据量相对也不大,但是对搜索的效率要求比较高,否则会影响与用户的界面交互效果。而且最好还有一些易错拼音的容错处理,更方便用户的使用。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:在拼音搜索时,如何识别易错拼音、多音字,以增强容错能力和拼音搜索效率和查准率。
(二)技术方案
为解决上述技术问题,本发明提供了一种拼音搜索方法,包括以下步骤:
S1:根据输入的拼音串搜索预先生成的汉字拼音表,查找汉字串的拼音是否有与所述输入的拼音串相匹配的拼音串,若有,则展示所有匹配拼音串对应的汉字串,否则,执行步骤S2;
S2:检查所述拼音串中是否有拼写错误,若有,则进行纠错处理;
S3:按纠正后的拼音进行搜索,并显示搜索结果。
其中,所述步骤S1中汉字拼音表的生成步骤包括:
S1.1:根据搜索范围中的待搜素汉字串中的汉字查找多音字表,生成所述待搜索汉字串的目标拼音串,所述多音字表是以多音字为主键,多个拼音为内容的表;
S1.2:若在多音字表中查找不到,则利用GBK编码直接确定汉字串的拼音,生成目标拼音串;
S1.3:按照待搜索范围中的汉字串和其对应的目标拼音串的映射关系生成汉字拼音表。
其中,所述目标拼音串包括:待搜索汉字串的全拼和汉字拼音第一个字母组成的拼音串,包含多音字的待搜索汉字串的目标拼音串包含多音字或多音字组成的词语的每个读音的拼音串和第一个字母组成的拼音串。
其中,若待搜索汉字串中多音字超过预定个数,则按GBK编码直接确定汉字串的拼音串。
其中,所述预定个数为3。
其中,步骤S1.3之后还包括步骤:缓存所述汉字拼音表。
其中,所述步骤S2中纠错处理的方式为:
在纠错表中查找是否有拼写错误的拼音串和正确拼音串的对应关系表项,若有则用对应的正确拼音串替换拼写错误的拼音串。
(三)有益效果
本发明的拼音搜索方法中对拼音串进行了容错处理,增强了搜索过程中的容错能力;生成待搜索汉字串的目标拼音串,建立汉字拼音表并缓存,多音字串的目标拼音串中包含多音字的每个读音,从而提高了拼音搜索效率和查准率。
附图说明
图1是本发明实施例的一种拼音搜索方法流程图;
图2是图1中步骤S101和S105中搜索前生成目标拼音串的流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,为本发明实施例的一种拼音搜索方法流程图,包括:
步骤S101,根据输入的拼音串搜索预先生成的汉字拼音表,查找表中汉字串的拼音。本实施例中,汉字拼音表生成过程具体流程如图2所示,包括:
步骤S201,在多音字表中查找待搜索范围中的待搜索汉字串中汉字的拼音。为了保证查找速度,多音字表使用了map结构,以对应的汉字为主键,多个拼音为内容,多音字表中包括常用多音字。当读取一个汉字时,先从map表中查找。
步骤S202,判断在多音字表中是否查找到待搜索范围中的待搜索汉字串中汉字对应的拼音,若找到,则执行步骤S203;若没找到,则执行步骤S204。
由于多音字过多时,目标拼音串会很长,为了避免目标拼音串过长,本实施例中还判断查找到多音字是否超过预定个数,即步骤S203。
步骤S203,判断查找到多音字是否超过预定个数。该值可根据搜索的实际情况和对搜索效率的要求设定。如根据拼音搜索联系人,一般人的名字和昵称不超过3个,可以设定为3个。若未超过预定个数,则执行步骤S205,否则,执行步骤S204。
步骤S204,非多音字以及超过预定个数的多音字时利用汉字的GBK编码直接确定汉字的拼音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新媒传信科技有限公司,未经北京新媒传信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010618367.1/2.html,转载请声明来源钻瓜专利网。