[发明专利]一种基于CNN-LSTM的汉字拼写错别字改正方法有效
申请号: | 201711296509.5 | 申请日: | 2017-12-08 |
公开(公告)号: | CN107992211B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 张晋斌;潘嵘 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于CNN‑LSTM的汉字拼写错别字改正方法,该方法主要是利用了文本的上下文来纠错,即每一个汉字根据其上下文来判断该汉字正确与否,若该汉字是错别字的话则会根据其上下文来纠正错误。并且在模型训练中用到了随机改错的训练方式,提高了改正的准确率。 | ||
搜索关键词: | 一种 基于 cnn lstm 汉字 拼写 错别字 改正 方法 | ||
【主权项】:
一种基于CNN‑LSTM的汉字拼写错别字改正方法,其特征在于,包括以下步骤:S1:对于输入的句子进行编码,并对错别字进行过滤;S2:根据获得的过滤后的信息以及上下文信息解码出当前时间节点对应的正确的汉字。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711296509.5/,转载请声明来源钻瓜专利网。
- 上一篇:煤层储层敏感性试验装置
- 下一篇:一种土石坝土工膜缺陷渗流特性实验装置