[发明专利]一种基于自然语言处理的古文标点符号修复方法在审
申请号: | 202210453137.7 | 申请日: | 2022-04-27 |
公开(公告)号: | CN115374751A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 黄煜哲;董启文;兰韵诗;钱卫宁;周傲英 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于自然语言处理的古文标点符号修复方法,该方法包括:获取古籍中的文本数据并进行基础的数据清洗;根据古籍的内容分为不同的藏部体系分类;对文本进行向量化表示;利用各个分类中已有的存在标点符号的文本作为完成标注的训练数据;训练命名实体识别模型;将待标点的古籍文本对应的向量输入预先训练好的命名实体识别模型中;得到模型结果进行标点。本发明与现有技术相比可以将古籍细分为不同的藏部分别训练模型进行标点,提高命名实体识别模型的精度,获得更加准确的标点符号,对修复古籍和古籍的解读具有很高的价值。 | ||
搜索关键词: | 一种 基于 自然语言 处理 古文 标点符号 修复 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210453137.7/,转载请声明来源钻瓜专利网。
- 上一篇:具有用于灯的保持夹的灯座
- 下一篇:一种高产γ-氨基丁酸的短乳杆菌及其应用