[发明专利]中文文章侦错装置、中文文章侦错方法以及储存媒体有效
申请号: | 200810149253.X | 申请日: | 2008-09-22 |
公开(公告)号: | CN101685438A | 公开(公告)日: | 2010-03-31 |
发明(设计)人: | 谷圳;吴世弘;王文男;谢文泰;洪大弘 | 申请(专利权)人: | 财团法人资讯工业策进会 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 任默闻 |
地址: | 台湾省*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 文章 装置 方法 以及 储存 媒体 | ||
1.一种中文文章侦错方法,适用于处理多个中文字串,其特征在于,上 述中文字串是根据标点符号从一中文文章所切割而成,且上述中文字串包括一 第一中文字串,包括:
切割上述第一中文字串为多个第一字组,其中上述第一字组为上述第一中 文字串中任两个连续和不连续的字元所组成;
提供一数据库,其中上述数据库具有多个第一正确字串,以及对应于上述 第一正确字串的多个第一索引,其中上述第一索引为上述第一正确字串中任两 个连续和不连续的字元所组成;
根据上述第一字组取得对应于上述第一字组的上述第一索引,并根据所取 得的上述第一索引取得对应的上述第一正确字串;
根据所取得的上述第一正确字串产生一最佳候选句;以及
于一显示装置显示上述中文字串以及上述最佳候选句。
2.如权利要求1所述的中文文章侦错方法,其特征在于,上述最佳候选 句的产生是借着将上述中文字串中的上述第一中文字串以所取得的上述第一 正确字串取代。
3.如权利要求1所述的中文文章侦错方法,其特征在于,上述中文字串 更包括一第二中文字串,上述数据库更具有多个第二索引和上述第二索引所对 应的多个第二正确字串,并且上述方法更切割上述第二中文字串为多个第二字 组,并根据上述第二字组取得对应于上述第二字组的上述第二索引,并根据所 取得的上述第二索引取得对应的上述第二正确字串,更将所取得的上述第一正 确字串设定为一第一候选词,并将上述第二正确字串设定为一第二候选词。
4.如权利要求3所述的中文文章侦错方法,其特征在于,更包括判断上 述第二中文字串是否与上述第二索引相同。
5.如权利要求4所述的中文文章侦错方法,其特征在于,当上述第二中 文字串与上述第二索引的其中一者相同时,取得与上述第二中文字串相同的上 述第二索引所对应的上述第二正确字串,并将所取得的上述第二正确字串设定 为上述第二候选词。
6.如权利要求4所述的中文文章侦错方法,其特征在于,上述数据库更 具有上述第二索引所对应的多个特定字串,当上述第二中文字串与上述第二索 引的其中一者相同时,取得与上述第二中文字串相同的上述第二索引所对应的 上述特定字串,并判断上述中文字串之中是否包括所取得的上述特定字串。
7.如权利要求6所述的中文文章侦错方法,其特征在于,更包括当上述 中文字串之中包括所取得的上述特定字串时,取得相同于上述第二中文字串的 上述第二索引所对应的上述第二正确字串,并将所取得的上述第二正确字串设 定为上述第二候选词。
8.一种中文文章侦错装置,适用于处理多个中文字串,其特征在于,上 述中文字串是根据标点符号从一中文文章所切割而成,且上述中文字串包括一 第一中文字串,包括:
一文章切割模块,切割上述第一中文字串为多个第一字组,其中上述第一 字组为上述第一中文字串中任两个连续和不连续的字元所组成;
一数据库,具有多个第一正确字串以及对应于上述第一正确字串的多个第 一索引,其中上述第一索引为上述第一正确字串中任两个连续和不连续的字元 所组成;
一候选词产生模块,根据上述第一字组取得对应于上述第一字组的上述第 一索引,并根据所取得的上述第一索引取得对应的上述第一正确字串;
一候选句产生与评分模块,根据所取得的上述第一正确字串产生一最佳候 选句;以及
一显示装置,显示上述中文字串以及上述最佳候选句。
9.如权利要求8所述的中文文章侦错装置,其特征在于,上述最佳候选 句的产生是借着将上述中文字串中的上述第一中文字串以所取得的上述第一 正确字串取代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人资讯工业策进会,未经财团法人资讯工业策进会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810149253.X/1.html,转载请声明来源钻瓜专利网。