[发明专利]一种中文命名实体提取方法及其系统在审
申请号: | 201910815302.7 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110516256A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 张亮 | 申请(专利权)人: | 的卢技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04;G06N3/08 |
代理公司: | 32272 南京禹为知识产权代理事务所(特殊普通合伙) | 代理人: | 王晓东<国际申请>=<国际公布>=<进入 |
地址: | 211100 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种中文命名实体提取方法及其系统,包括以下步骤,数据模块采集数据制作数据集并形成训练测试数据;提取模型下载BERT模型及预训练代码;所述BERT模型基础上增加BILSTM+CRF算法模块;训练所述提取模型,当所述提取模型收敛达到精度指标时,将它部署进行实体提取。本发明的有益效果:基于BERT的中文命名实体提取技术,精度较之前的方法更高,同时泛化性能更好;自动识别实体不需要建立字典匹配、不需要总是增加文本来维护匹配的字典.较于其他深度学习方法,BERT有更强的表征能力,因此整个算法会具有更好的泛化性能。 | ||
搜索关键词: | 泛化性能 命名实体 匹配 字典 表征能力 采集数据 精度指标 模型基础 模型下载 实体提取 数据模块 算法模块 训练测试 自动识别 数据集 中文 算法 收敛 制作 部署 维护 学习 | ||
【主权项】:
1.一种中文命名实体提取方法,其特征在于:包括以下步骤,/n数据模块(100)采集数据制作数据集并形成训练测试数据;/n提取模型(200)下载BERT模型(201)及预训练代码;/n所述BERT模型基础上增加BILSTM+CRF算法模块(202);/n训练所述提取模型(200),当所述提取模型(200)收敛达到精度指标时,将它部署进行实体提取。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于的卢技术有限公司,未经的卢技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910815302.7/,转载请声明来源钻瓜专利网。