[发明专利]一种使用重叠拆分规则的文本序列标注算法有效
申请号: | 201911248256.3 | 申请日: | 2019-12-09 |
公开(公告)号: | CN110929518B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 朱利;崔诚煜;李元伟;陈杭 | 申请(专利权)人: | 朱利 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/295;G06F40/253 |
代理公司: | 南京中律知识产权代理事务所(普通合伙) 32341 | 代理人: | 沈振涛 |
地址: | 610212 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种使用重叠拆分规则的文本序列标注算法,经验上,完成一个基于深度学习的序列标注任务模型,在训练阶段,其最大序列长度固定为有限值;而在预测阶段,自然文本序列长度常常超过模型最大序列长度,此时会造成模型的F1值降低。采用重叠拆分规则方式,对于待预测文本长度超过模型最大序列长度时,将超长文本拆分为若干不大于最大序列长度的子序列,各个子序列之间设置重叠区域,即重叠拆分处理。重叠拆分方式规则能够适用于不同类型的特征抽取器模型,可以在一定程度上提升模型预测效果,同时对于RNN特征抽取器,可以大幅度提升处理效率,在我们已完成的序列标注任务工程上有广泛的、非常好的应用。 | ||
搜索关键词: | 一种 使用 重叠 拆分 规则 文本 序列 标注 算法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于朱利,未经朱利许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911248256.3/,转载请声明来源钻瓜专利网。