[发明专利]一种实现汉语同音字检索的方法有效
申请号: | 201210008298.1 | 申请日: | 2012-01-12 |
公开(公告)号: | CN102609455A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 王杰中;周海滨;邹娟;崔玉祥 | 申请(专利权)人: | 北京中科大洋科技发展股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周国城 |
地址: | 100094 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 汉语 同音字 检索 方法 | ||
1.一种实现汉语同音字检索的方法,其特征在于,该方法包括:
步骤1:建立常用汉字与其同音代表字之间的映射关系,并按照该映射关系对检索数据库中的原始全文内容进行映射,得到由多条映射记录构成的检索数据库;
步骤2:按照该映射关系对用户输入的原始检索关键词进行映射,得到对应于该原始检索关键词的同音代表字串;
步骤3:在由多条映射记录构成的检索数据库中对该同音代表字串进行检索,得到检索结果。
2.根据权利要求1所述的实现汉语同音字检索的方法,其特征在于,步骤1中所述建立常用汉字与其同音代表字之间的映射关系包括:
以国家质量技术监督局2001年宣布的计算机汉字信息交换标准GB18030为依据,建立常用汉字与其同音代表字之间的映射关系,其中GB18030共包括70244个汉字,从具有相同发音的多个汉字中选取同音代表字。
3.根据权利要求1所述的实现汉语同音字检索的方法,其特征在于,步骤1中所述建立常用汉字与其同音代表字之间的映射关系包括:
以国家语委汉字处制定的包括7000个汉字的现代汉语通用字表或以教育部目前正向社会征求意见的包括8300个汉字的通用规范汉字表为依据,建立常用汉字与其同音代表字之间的映射关系,从具有相同发音的多个汉字中选取同音代表字。
4.根据权利要求2或3所述的实现汉语同音字检索的方法,其特征在于,所述在从具有相同发音的多个汉字中选取同音代表字,是选用具有相同发音的任一个字做为其同音代表字。
5.根据权利要求4所述的实现汉语同音字检索的方法,其特征在于,所述在从具有相同发音的多个汉字中选取同音代表字,是选用具有相同发音的第一个字做为其同音代表字。
6.根据权利要求1所述的实现汉语同音字检索的方法,其特征在于,所述原始全文内容和同音代表字信息保存在同一个数据库表中,步骤1中所述映射记录包括以下字段:
记录标识、原始全文内容和同音代表字信息,其中原始全文内容与同音代表字信息按照所述映射关系一一对应。
7.根据权利要求6所述的实现汉语同音字检索的方法,其特征在于,所述步骤3包括:
以该同音代表字串为检索关键词,在检索数据库映射记录的同音代表字信息字段中进行检索,检索到与该同音代表字串匹配的同音代表字信息,然后根据该匹配的同音代表字信息确定检索到的映射记录,得到该映射记录中的原始全文内容为检索结果。
8.根据权利要求1所述的实现汉语同音字检索的方法,其特征在于,所述原始全文内容和同音代表字信息分别保存在不同的数据库表中,步骤1中所述映射记录包括以下字段:
记录标识、原始资源标识ID和同音代表字信息,其中原始资源标识ID与同音代表字信息按照所述映射关系一一对应,且在原始全文内容数据库表中原始资源标识ID对应于原始全文内容。
9.根据权利要求8所述的实现汉语同音字检索的方法,其特征在于,所述步骤3包括:
以该同音代表字串为检索关键词,在检索数据库映射记录的同音代表字信息字段中进行检索,检索到与该同音代表字串匹配的同音代表字信息,然后根据该匹配的同音代表字信息确定检索到的映射记录,得到该映射记录中的原始资源标识ID,然后根据该原始资源标识ID到原始全文内容数据库表中找到对应的记录,得到原始全文内容为检索结果。
10.根据权利要求1所述的实现汉语同音字检索的方法,其特征在于,步骤3中所述检索采用全文检索方式,该全文检索是指计算机索引程序通过扫描检索数据库中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。
11.根据权利要求1所述的实现汉语同音字检索的方法,其特征在于,该方法在步骤3之后还包括:
得到检索结果之后,对检索结果进行标红处理和生成动态摘要,并展现给用户;其中,标红处理是指对检索结果的条目内容中的检索关键词运用红色字体突出显示;生成动态摘要是指在检索结果的条目内容中提取检索关键词的上下文连接而成的摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科大洋科技发展股份有限公司,未经北京中科大洋科技发展股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210008298.1/1.html,转载请声明来源钻瓜专利网。