[发明专利]一种中文拼音搜索的实现方法和系统在审
申请号: | 202011125475.5 | 申请日: | 2020-10-20 |
公开(公告)号: | CN112199576A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 张亚运;牛玉山;林帅 | 申请(专利权)人: | 山东浪潮商用系统有限公司 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F16/33;G06F40/151;G06F40/289 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 陈婷婷 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 拼音 搜索 实现 方法 系统 | ||
本发明公开了一种中文拼音搜索的实现方法和系统,属于文字索引技术领域,该方法通过构建汉字与拼音映射库,并构建简体中文与繁体中文映射表,将汉字与拼音映射、简体与繁体映射;将输入的关键字进行格式转换,实现字符统一;编写支持Internet Explorer 8的Polyfill;对输入的字符进行判断,若为IE8,则进行兼容IE8的代码处理;若判断字符含有拼音,则启动拼音搜索引擎,调用所述汉字与拼音映射库及简体中文与繁体中文映射表进行字符处理及目标搜索,并展示搜索结果。本发明能够支持汉字拼音搜索并且支持繁体中文的拼音搜索,提高搜索效率,适用性强,应用范围广。
技术领域
本发明涉及文字索引技术领域,具体涉及一种中文拼音搜索的实现方法和系统。
背景技术
目前在多数软件应用或检索类程序中,现有的中文搜索,尤其是汉字搜索,大多数缺少使用汉语拼音也能匹配的高级功能。少数即使支持拼音搜索汉字但缺少对繁体中文的拼音搜索支持,而且也不支持旧版本但仍有较高市场份额的Internet Explorer 8浏览器。
发明内容
本发明的技术任务是提供一种中文拼音搜索的实现方法和系统,能够支持汉字拼音搜索并且支持繁体中文的拼音搜索,提高搜索效率,提高适用性。
本发明解决其技术问题所采用的技术方案是:
一种中文拼音搜索的实现方法,通过构建汉字与拼音映射库,并构建简体中文与繁体中文映射表,将汉字与拼音映射、简体与繁体映射;
将输入的关键字进行格式转换,实现字符统一;
编写支持Internet Explorer 8的Polyfill;
对输入的字符进行判断,若为IE8,则进行兼容IE8的代码处理;若判断字符含有拼音,则启动拼音搜索引擎,调用所述汉字与拼音映射库及简体中文与繁体中文映射表进行字符处理及目标搜索,并展示搜索结果。
该方法能够支持拼音首字母或者完整拼音搜索,能显著提升检索目标功能菜单或者通用文本的便捷度与效率,并能适用于使用繁体中文的地区:香港特别行政区,澳门特别行政区,台湾省等,使软件系统的普遍适用性、可移植性显著增强,而无需更改相关源代码。同时,能够兼容Internet Explorer 8,适用性更强,应用范围广。
优选的,该方法中,对输入的字符进行分词处理,拆分词语,从而进行字符模式匹配。
优选的,该方法还包括多音字处理,构建多条汉字与拼音的映射行,在进行搜索时调用该映射行进行字符处理及目标搜索。某些汉字会有多个读音,通过构建多条汉字与拼音的映射行,以应对多音字的情况。
具体的,所述启动拼音搜索引擎包括以下操作:
处理繁体中文;
匹配字词首字母;
处理多音字;
拆分词语。
进一步的,通过高亮匹配字符颜色处理,将应用系统的搜索结果进行目标字符凸显处理。
优选的,该方法的具体实现过程如下:
1)、构建汉字与拼音映射库,
首先需要构建基础数据,将汉字与拼音准确地做好映射,形成基础映射库;
2)、编制简体中文与繁体中文映射表,
为了支持繁体中文的模式匹配,需要编制简体与繁体的对照映射表;
3)、转换字符大小写格式,将输入的关键字英文字符或者汉语拼音字符统一转成大写或者小写,便于字符的模式匹配;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮商用系统有限公司,未经山东浪潮商用系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011125475.5/2.html,转载请声明来源钻瓜专利网。