[发明专利]一种可扩展的基于神经网络的序列标注方法有效
申请号: | 201711026809.1 | 申请日: | 2017-10-27 |
公开(公告)号: | CN107894971B | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 孙栩;张艺;杨洋 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06N3/02 |
代理公司: | 11200 北京君尚知识产权代理有限公司 | 代理人: | 司立彬<国际申请>=<国际公布>=<进入 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种可扩展的基于神经网络的序列标注方法。本方法为:创建一层叠n阶模型,该层叠n阶模型的训练过程为:首先根据训练语料中各标注单元的标签生成多个标签集合,包括一阶至n阶n个标签集合;标注单元i的标签与其邻近n‑1个标注单元的标签合并在一起作为标注单元i的n阶标签,n阶标签集合为各标注单元的n阶标签构成的标签集合;然后利用得到的各阶标签集合分别训练神经网络,分别得到n个模型,即一阶神经网络模型至n阶神经网络模型;利用该层叠n阶模型对给定的序列进行标签预测,得到一标签序列。本发明显著减少了模型过拟合风险,提高了序列标注任务效果。 | ||
搜索关键词: | 一种 扩展 基于 神经网络 序列 标注 方法 | ||
【主权项】:
1.一种可扩展的基于神经网络的序列标注方法,其步骤包括:/n1)创建一层叠n阶模型,该层叠n阶模型的训练过程为:首先根据训练语料中各标注单元的标签生成多个标签集合,包括一阶至n阶n个标签集合;其中,一阶标签集合为各标注单元的标签构成的标签集合;标注单元i的标签与其邻近n-1个标注单元的标签合并在一起作为标注单元i的n阶标签,n阶标签集合为各标注单元的n阶标签构成的标签集合;然后利用得到的各阶标签集合分别训练神经网络,分别得到n个模型,即一阶神经网络模型至n阶神经网络模型;/n2)利用该层叠n阶模型对给定的序列(x1,x2,…xt,…xT)进行标签预测,得到一标签序列(y1,y2,…yt,…,yT);其中,yt表示第t个标注单元xt的标签。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711026809.1/,转载请声明来源钻瓜专利网。