[发明专利]命名实体识别方法、装置、设备及介质在审
申请号: | 201911124011.X | 申请日: | 2019-11-15 |
公开(公告)号: | CN111222334A | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 姚志强;周曦;李继伟;杜晓薇;郝东;赵云 | 申请(专利权)人: | 广州洪荒智能科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 尹丽云 |
地址: | 511458 广东省广州市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名 实体 识别 方法 装置 设备 介质 | ||
本发明提供一种命名实体识别方法、装置、设备及介质,该方法包括:获取用户输入的基于自然语言的对话;预处理所述对话内的语料信息;利用预先训练好的命名实体模型识别所述语料信息得到相应的命名实体。本发明相对于传统的命名实体方法,提前训练好命名实体识别模块,将获取的基于自然语言的对话经预处理后输入到所述命名实体识别模块识别语料信息中命名实体;一方面,不依赖句法分析树或不依赖基于规则的匹配;另一方面,降低了对特定场景训练数据的要求,减少了训练数据。
技术领域
本发明涉及人工智能技术领域,特别是涉及一种命名实体识别方法、装置、设备及介质。
背景技术
人机会话是人工智能领域的一个子方向,通俗的讲就是让人可以通过人类的语言(即自然语言)与计算机例如人机会话系统进行交互。通过人与人机会话系统的交互,能够使人机会话系统理解人的意图和需求,从而完成歌曲搜索、购物下单,设备的控制等任务。
然而,现有的对话系统中关于命名实体识别由于标注数据少、数据标注难度大、数据标注不规范,同时,传统的命名实体识别模型通常基于句法,需要依赖句法分析树或规则匹配,因此,亟需一种新的命名实体识别方法。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供命名实体识别方法、装置、设备及介质,用于解决现有命名实体识别过程中需依赖句法分析树或规则或缺乏训练数据的问题。
为实现上述目的及其他相关目的,本发明提供一种命名实体识别方法,包括:
获取用户输入的基于自然语言的对话;
预处理所述对话内的语料信息;
利用预先训练好的命名实体模型识别所述语料信息得到相应的命名实体。
本发明的另一目的在于提供一种命名实体识别装置,包括:
对话获取模块,用于获取用户输入的基于自然语言的对话;
预处理模块,用于预处理所述对话内的语料信息;
命名实体识别模块,利用预先训练好的命名实体模型识别所述语料信息得到相应的命名实体。
本发明的另一目的在于提供一种设备,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行上述命名实体识别方法。
本发明还一目的在于提供一个或多个机器可读介质,包括:
其上存储有指令,当由一个或多个处理器执行时,使得设备执行上述命名实体识别方法。
如上所述,本发明提供的一种命名实体识别方法、装置、设备及介质,具有以下有益效果:
本发明相对于传统的命名实体方法,提前训练好命名实体识别模块,将获取的基于自然语言的对话经预处理后输入到所述命名实体识别模块识别语料信息中命名实体;一方面,不依赖句法分析树或不依赖基于规则的匹配;;另一方面,降低了对特定场景训练数据的要求减少了训练数据。
附图说明
图1为本发明实施例提供的命名实体识别方法流程图;
图2为本发明实施例提供的命名实体识别方法中命名实体训练流程图;
图3为本发明实施例提供的人机对话命名实体识别中嵌入向量生成流程图;
图4为本发明实施例提供的命名实体识别装置结构框图;
图5为本发明实施例提供的命名实体识别装置中命名实体识别模块结构框图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州洪荒智能科技有限公司,未经广州洪荒智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911124011.X/2.html,转载请声明来源钻瓜专利网。