[发明专利]一种基于对抗学习的文本标注方法和设备有效
申请号: | 201910342500.6 | 申请日: | 2019-04-26 |
公开(公告)号: | CN110110327B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 蔡子健;李金锋 | 申请(专利权)人: | 网宿科技股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 北京华智则铭知识产权代理有限公司 11573 | 代理人: | 王昌贵 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种基于对抗学习的文本标注方法和设备,属于自然语言处理技术领域。所述方法包括:文本标注设备利用字符标注模型对待标注文本进行标注处理,生成包含标注词语的字符标注结果;文本标注设备通过预设的词语分割模型对待标注文本进行分词处理,生成包含分词词语的分词结果;若根据字符标注结果确定分词结果可信,文本标注设备则基于分词词语对字符标注结果重新进行字符标注,得到融合标注结果并输出;若根据字符标注结果确定分词结果不可信,文本标注设备则输出字符标注结果。采用本发明,可以提高文本标注的准确率和召回率。 | ||
搜索关键词: | 一种 基于 对抗 学习 文本 标注 方法 设备 | ||
【主权项】:
1.一种基于对抗学习的文本标注方法,其特征在于,所述方法包括:利用字符标注模型对待标注文本进行标注处理,生成包含标注词语的字符标注结果;通过预设的词语分割模型对所述待标注文本进行分词处理,生成包含分词词语的分词结果;若根据所述字符标注结果确定所述分词结果可信,则基于所述分词词语对所述字符标注结果重新进行字符标注,得到融合标注结果并输出;若根据所述字符标注结果确定所述分词结果不可信,则输出所述字符标注结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网宿科技股份有限公司,未经网宿科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910342500.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于主题信息的文本切割方法
- 下一篇:文本处理方法及装置