[发明专利]带有易混淆音识别的拼音检查系统和方法有效

专利信息
申请号: 200710149483.1 申请日: 2007-09-13
公开(公告)号: CN101388012A 公开(公告)日: 2009-03-18
发明(设计)人: 孙海涛;施行向 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海开祺知识产权代理有限公司 代理人: 费开逵
地址: 英属开曼群岛大开曼*** 国省代码: 开曼群岛;KY
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 带有 混淆 识别 拼音 检查 系统 方法
【权利要求书】:

1.一种带有易混淆音识别的拼音检查系统,用于根据输入的关键字得出其 对应的候选对象的词条,其特征在于,包括文件存储空间、拼音检查处理单元, 其中,

所述文件存储空间包括:

词库存储单元,用于存储作为候选对象的词,

汉字拼音存储单元,用于存储汉字对应的标准拼音,以及

汉字混淆音存储单元,用于存储所述汉字拼音存储单元中每个拼音对 应的易混淆拼音;

所述拼音检查处理单元包括:

汉字拼音索引处理子单元,用于接收用户输入的关键字,在所述汉字 拼音存储单元中搜索到对应的拼音;

汉字混淆音索引处理子单元,用于接收所述汉字拼音存储单元发送的 拼音,在所述汉字混淆音存储单元中搜索出对应的混淆拼音;

词库拼音索引处理子单元,用于接收所述汉字拼音索引处理子单元和所述 汉字混淆音索引处理子单元提供的拼音,在所述词库存储单元中搜索得到对应 的词,所述系统还包括索引存储空间,所述索引存储空间包括:

词库拼音索引文件:用以保存根据拼音在词库存储单元上找到所有对应词 的索引信息,

所述词库存储单元是按照词发音的哈希运算值从小到大或从大到小有顺序 排序;

所述词库拼音索引文件进一步包括:拼音哈希值索引子文件、列表地址索 引子文件,其中,

拼音哈希值索引子文件:用于根据拼音的哈希值从小到大或从大到小有顺 序地保存有每一哈希值在列表地址索引子文件中对应的列表地址;

列表地址索引子文件:用于保存每个列表地址对应的具有相同拼音的词个 数以及该些词在词库存储单元中对应的存储地址信息。

2.如权利要求1所述的系统,词库拼音索引处理子单元进一步包括:

哈希计算子单元:用于计算词拼音的哈希值;

哈希值索引处理子单元:用于将计算出来的哈希值在所述拼音哈希值索引 子文件中找到对应的列表地址;

列表地址处理子单元:用于将所述列表地址在列表地址索引子文件中找到 对应的词个数及每个词在词库存储单元的存储地址信息;

词库处理子单元:用于将列表地址处理子单元找到的该些词的存储地址信 息,在词库存储单元中找到对应的词。

3.如权利要求1所述的系统,其特征在于,还包括:

汉字拼音索引文件:用以保存根据汉字从汉字拼音存储单元中得到发音的 索引信息;

汉字易混淆音索引文件:用以保存根据拼音在所述汉字混淆音存储单元上 找到其对应的易混淆拼音的索引信息。

4.一种带有易混淆音识别的拼音检查方法,其特征在于,包括步骤,

(1)设置存储词的词库存储单元、存储汉字拼音的汉字拼音存储单元,和存 储易混淆拼音的汉字混淆音存储单元,步骤(1)中设置词库存储单元进一步为:按 照词发音的哈希运算值从小到大或从大到小有顺序地在词库存储单元中排序,并 且,步骤(1)还包括:

设置拼音哈希值索引子文件:根据拼音的哈希值从小到大或从大到小有顺 序地保存有每一哈希值在列表地址索引子文件中对应的列表地址;

设置列表地址索引子文件:保存每个列表地址对应的具有相同拼音的词个 数以及该些词在词库存储单元中对应的存储地址信息;

(2)接收用户输入的关键字,在所述汉字拼音存储单元中搜索到对应的拼音;

(3)接收所述汉字拼音存储单元发送的拼音,在所述汉字混淆音存储单元中 搜索出对应的混淆拼音;

(4)分别接收步骤(2)和步骤(3)提供的拼音,在所述词库存储单元中搜索得到 对应的词,步骤(4)中在所述词库存储单元中搜索得到对应的词进一步包括:

计算每个词拼音的哈希值;

将计算出来的哈希值在所述拼音哈希值索引子文件中找到对应的列表地 址;

将所述列表地址在列表地址索引子文件中找到对应的词个数及每个词在词 库存储单元的存储地址信息;

根据找到的该些词的存储地址信息在词库存储单元中找到对应的词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710149483.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top