[发明专利]命名实体识别模型训练方法及装置在审
申请号: | 202110137392.6 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112818691A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 弓源;李长亮 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06N3/08 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 刘晓楠 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供命名实体识别模型训练方法及装置,其中所述命名实体识别模型训练方法包括:获取有标注训练数据和无标注训练数据;根据所述有标注训练数据训练目标命名实体识别模型;将所述无标注训练数据输入至所述目标命名实体识别模型,获得所述目标命名实体识别模型输出至少一个实体词和每个实体词对应的置信度分值;根据每个实体词对应的置信度分值确定目标实体词,并根据所述目标实体词对所述无标注训练数据进行标注,生成新增有标注训练数据;根据所述新增有标注训练数据继续训练所述目标命名实体识别模型,本方法通过弱监督学习的方式,扩充了有标注训练数据的数量,有效防止模型训练过拟合,同时减少了人工标注有标注训练数据的成本。 | ||
搜索关键词: | 命名 实体 识别 模型 训练 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110137392.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种环己双胍盐酸盐及其制备方法
- 下一篇:一种奥司他韦的新合成方法