[发明专利]标点符号的校正方法及设备、介质在审
申请号: | 201910927419.4 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110705264A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 沈大框;陈培华;陈成才 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232 |
代理公司: | 31327 上海知锦知识产权代理事务所(特殊普通合伙) | 代理人: | 潘彦君 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 标点符号的校正方法及设备、介质,所述方法包括:对待校正的文本进行去标点符号处理,得到待添加标点符号的文本;将所述待添加标点符号的文本输入完成迁移学习训练的标点符号标注模型,采用所述标点符号标注模型预测所述待添加标点符号的文本中的标点符号待添加位置及对应标点符号类型,并在所述标点符号待添加位置的前后分词单元处,采用所述标点符号类型对应的标签组合进行标注,输出对应的标点符号标注结果;根据所述标点符号标注结果,对所述待添加标点符号的文本添加相应的标点符号,得到相应的校正文本。上述方案可以提高标点符号预测的准确率,满足标点符号校正的需求。 | ||
搜索关键词: | 标点符号 文本 标注 校正 添加位置 标签组合 分词单元 模型预测 输入完成 学习训练 准确率 迁移 输出 预测 | ||
【主权项】:
1.一种标点符号的校正方法,其特征在于,包括:/n对待校正的文本进行去标点符号处理,得到待添加标点符号的文本;/n将所述待添加标点符号的文本输入完成迁移学习训练的标点符号标注模型,采用所述标点符号标注模型预测所述待添加标点符号的文本中的标点符号待添加位置及对应标点符号类型,并在所述标点符号待添加位置的前后分词单元处,采用所述标点符号类型对应的标签组合进行标注,输出对应的标点符号标注结果;/n根据所述标点符号标注结果,对所述待添加标点符号的文本添加相应的标点符号,得到相应的校正文本;/n其中,所述标点符号标注模型包括预训练的语言子模型,所述语言子模型为具有时间序列的神经网络模型。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910927419.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种字符信息的录入校验方法和存储介质
- 下一篇:合同条款风险识别方法以及装置