[发明专利]用于校正错别字的方法和装置有效
申请号: | 201810958900.5 | 申请日: | 2018-08-22 |
公开(公告)号: | CN109062903B | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 郭辰阳;吴家林;邵英杰;刘晓波 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 11204 北京英赛嘉华知识产权代理有限责任公司 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例公开了用于校正错别字的方法和装置。该方法的一具体实施方式包括:获取待校正内容;将待校正内容发送至搜索服务器,以及接收搜索服务器基于待校正内容发送的搜索结果集合;对于搜索结果集合中的搜索结果,确定该搜索结果与待校正内容间的内容关联度;根据搜索结果集合和所确定的内容关联度集合,确定待校正内容中是否存在错别字。该实施方式提高了对待校正内容进行错别字判断的灵活性。 | ||
搜索关键词: | 校正 搜索结果 错别字 集合 方法和装置 搜索服务器 内容发送 关联度 申请 | ||
【主权项】:
1.一种用于校正错别字的方法,包括:/n获取待校正内容;/n将所述待校正内容发送至搜索服务器,以及接收所述搜索服务器基于所述待校正内容发送的搜索结果集合;/n对于所述搜索结果集合中的搜索结果,确定该搜索结果与所述待校正内容间的内容关联度,包括:遍历搜索结果集合中的搜索结果,在访问当前搜索结果时执行以下操作:将当前搜索结果的第一个文字确定为目标文字,从当前搜索结果中选取以目标文字为首的连续的比对数量个文字形成文字组,存入文字组集合,将目标文字切换为当前搜索结果中当前的目标文字所在位置的下一个文字,以及继续执行从当前搜索结果中选取以目标文字为首的连续的比对数量个文字形成文字组、存入文字组集合的操作,直至所形成的文字组的最后一个文字为当前搜索结果的最后一个文字,输出文字组集合,其中,所述比对数量为所述待校正内容中的文字数量;计算文字组集合中各文字组分别与待校正内容的编辑距离,将计算获得的编辑距离中的最小者确定为当前搜索结果与待校正内容间的内容关联度;/n根据搜索结果集合和所确定的内容关联度集合,确定所述待校正内容中是否存在错别字。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810958900.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种文本语义表达方法及装置
- 下一篇:逻辑谓词提取方法和装置