[发明专利]文本的实体识别方法、设备及存储介质在审

申请号：	201911013316.3	申请日：	2019-10-23
公开（公告）号：	CN110738055A	公开（公告）日：	2020-01-31
发明（设计）人：	邸凡祎	申请（专利权）人：	北京字节跳动网络技术有限公司
主分类号：	G06F40/295	分类号：	G06F40/295;G06F40/242;G06F16/35
代理公司：	31340 上海光栅知识产权代理有限公司	代理人：	马雯雯
地址：	100041 北京市石景山区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本公开实施例提供一种文本的实体识别方法、设备及存储介质，通过获取待处理文本；识别待处理文本中的机构实体全称，根据预设的目标机构实体后缀词典识别机构实体全称中的目标机构实体全称，得到第一类目标机构实体；根据预设的目标机构实体简称词典识别待处理文本中的目标机构实体简称，得到第二类目标机构实体；根据预先训练的识别模型对待处理文本中进行实体识别，得到第三类目标机构实体；将各类目标机构实体合并，作为待处理文本中包含的目标机构实体进行输出。本公开实施例通过对待处理文本进行多个层面的实体识别，能识别待处理文本中目标机构实体全称和目标机构实体简称，提高目标机构实体识别的准确率和召回率，节约人力成本和时间成本。
搜索关键词：	目标机构文本机构实体实体识别类目标预设存储介质后缀词典人力成本时间成本实体合并准确率节约输出
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种文本的实体识别方法，其特征在于，包括：/n获取待处理文本；/n识别所述待处理文本中的机构实体全称，并根据预设的目标机构实体后缀词典识别所述机构实体全称中的目标机构实体全称，得到第一类目标机构实体；/n根据预设的目标机构实体简称词典识别所述待处理文本中的目标机构实体简称，得到第二类目标机构实体；/n根据预先训练的识别模型对所述待处理文本中进行实体识别，得到第三类目标机构实体；/n将各类目标机构实体合并，作为所述待处理文本中包含的目标机构实体，并进行输出。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司，未经北京字节跳动网络技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201911013316.3/，转载请声明来源钻瓜专利网。

上一篇：识别邮件中酒店信息的方法、系统、电子设备及存储介质
下一篇：用于生成信息的方法和装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]文本的实体识别方法、设备及存储介质在审

专利文献下载