[发明专利]一种基于多粒度融合与Bert筛选的中文文本自动校对方法在审
申请号: | 202110348599.8 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113221542A | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 张翔宇;张旭;王鹏;刘春阳;解峥;商建云;张华平;蔡佳豪;杜伦 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;北京理工大学 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/242;G06F40/284 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 100020*** | 国省代码: | 北京;11 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明涉及一种基于多粒度融合与Bert筛选的中文文本自动校对方法,属于自然语言处理技术领域;本发明通过结合字粒度与词粒度级别的校对模型,以期能够利用不同粒度级别的信息。字粒度模型采用集成规则生成候选集与Bert筛选的方法,词粒度采用传统方法,先构建候选集,然后使用N‑Gram模型计算句子困惑度取最佳候选。另外该方法还解决了多字少字等错误类型问题。实验结果验证了该方法能有效提高检错纠错的召回率,有效提升校对模型性能。对比现有技术,本发明规避了字粒度校对模型和词粒度校对模型带来的局限性,基于多粒度融合与Bert筛选通过两种粒度有效结合不同层次信息,通过N‑Gram LM打分与Bert进行筛选,能够有效提高错误的召回率和校对的准确率。 | ||
搜索关键词: | 一种 基于 粒度 融合 bert 筛选 中文 文本 自动 校对 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;北京理工大学,未经国家计算机网络与信息安全管理中心;北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110348599.8/,转载请声明来源钻瓜专利网。