[发明专利]命名实体识别方法、命名实体识别装置、设备及介质有效

申请号：	201811005796.4	申请日：	2018-08-30
公开（公告）号：	CN109741732B	公开（公告）日：	2022-06-21
发明（设计）人：	胡风硕	申请（专利权）人：	京东方科技集团股份有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/14;G10L15/16;G10L15/26
代理公司：	北京市柳沈律师事务所 11105	代理人：	王娟
地址：	100015 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	命名实体识别方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

公开了一种命名实体识别方法、命名实体识别装置、命名实体识别设备及介质，包括：采集特定场景下的语音信号；提取语音信号中的语音特征向量；基于语音信号进行语音识别后的文字结果，提取所述文字结果中的文字特征向量；将语音特征向量与文字特征向量进行拼接，得到所述语音信号中每个字的复合特征向量；将语音信号中每个字的所述复合特征向量通过深度学习模型进行处理，得到命名实体的识别结果。

技术领域

本公开涉及人工智能领域，更具体地涉及一种命名实体识别方法、命名实体识别装置、命名实体识别设备及介质。

背景技术

随着人工智能和大数据技术的发展，对于语音识别和自然语言处理的技术需求不断提高，其中，命名实体识别作为语义理解、语音合成等任务的必要前操作，在自然语言理解中具有重要的作用。

目前常用的实体识别方法多针对广泛应用场景中的语音识别，然而在特殊场景，如复杂特殊名称的艺术品、书籍、外国人名等，现有的命名实体识别方法难以良好的识别。

因此，需要一种能够在特殊场景下具有良好识别精度和准确率的命名实体识别方法。

发明内容

针对以上问题，本公开提供了一种命名实体识别方法及装置。将文字中不包含的语音信息，如重音、停顿、语调等同文字特征归一化融合，引入深度学习模型中，共同指导命名实体识别的过程。解决了特殊场景下复杂特殊名称对于判断句子结构、识别实体的影响，提高了实体识别的精度和准确率，并进一步地增大了实体识别应用的范围。

根据本公开的一方面，提出了一种命名实体识别方法，包括：采集语音信号；提取语音信号中的语音特征向量；基于语音信号进行语音识别后的文字结果，提取所述文字结果中的文字特征向量；将语音特征向量与文字特征向量进行拼接，得到所述语音信号中每个字的复合特征向量；将语音信号中每个字的所述复合特征向量通过深度学习模型进行处理，得到命名实体的识别结果。

在一些实施例中，提取语音信号中的语音特征向量包括提取语音句特征向量和提取语音字特征向量。

在一些实施例中，提取语音信号中的语音句特征向量包括：根据预设语音句库中的语音参数对照表，将所述语音信号中语音的句特征转换为与之对应的语音句特征向量。

在一些实施例中，提取语音信号中的语音字特征向量包括：通过对语音信号进行语音分析，得到语音信号中的语音字特征向量。

在一些实施例中，对语音信号进行语音分析包括：对于语音信号进行时间和频域上的离散化采样，得到数字语音信号；对于数字语音信号中的每个字在时域上和频域上分别进行处理，得到其时域特征向量及频域的特征向量；；对于语音信号中的每个字，将其时域特征向量和频域特征向量进行拼接，得到对应于每个字的语音字特征向量。

在一些实施例中，基于语音信号进行语音识别后的文字结果，提取所述文字结果中的文字特征向量包括提取字特征向量和提取分词嵌入特征向量。

在一些实施例中，提取所述文字结果中的分词嵌入特征向量包括：根据预设词库中的词组对照表，划分所述文字结果中的词组和单字；根据预设变换规则，将所述词组中的每个字和所述单字分别转换为与对应的分词嵌入特征向量。

在一些实施例中，提取所述文字结果中的字特征向量包括：根据预设字库中的文字及向量值对照表，将所述文字转换为与之对应的字特征向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司，未经京东方科技集团股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811005796.4/2.html，转载请声明来源钻瓜专利网。