[发明专利]词槽识别方法及装置、计算机可读存储介质、电子设备有效
申请号: | 202010447885.5 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111625634B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 杜维;刘设伟 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/289;G06N3/0442;G06N3/0455;G06N3/08 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 章侃铱;郑特强 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 方法 装置 计算机 可读 存储 介质 电子设备 | ||
本发明实施例是关于一种词槽识别方法及装置、计算机可读存储介质、电子设备,该方法包括:对待识别语句进行分词得到多个待识别短语句,并根据各所述待识别短语句得到待识别句子意图;对各所述待识别短语句进行编码以及降维处理得到多个待识别短语句向量,并对各所述待识别句子意图进行编码得到多个待识别意图向量;对各所述待识别短语句向量以及各所述待识别意图向量进行拼接得到多个待识别拼接向量;根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果,并根据所述特征词槽识别结果以及关键词槽识别结果生成与所述待识别语句对应的对话。本发明实施例提高了词槽识别结果的准确率。
背景技术
多轮对话是目前NLP(Natural Language Processing,自然语言处理)领域的一个重要应用场景。多轮对话指的是机器人与人之间进行的多回合对话。为了实现多回合的对话,需要建立多轮对话机器人,每个机器人下面建立不同的意图,而意图下面设置必填词槽,当必填词槽未被识别到时,需要通过反问澄清方式反问用户,用户做出回答后进入下一个必填槽位的澄清环节,当所有必填槽位都被澄清后,多轮对话给出最终答案。因此,多轮对话是基于满足特定的意图下的所触发的一系列反问澄清和答案生成的过程。
具体的,在机器人输出反问引导话术到用户后,用户回答以进行反问澄清,此时用户回答的语句通常为短语句。其中,短语句是指具有意图模糊,句子成分不全,词槽数不多的句子。短语句的意图模糊性和缺乏足够的槽位标注,导致训练模型无法收敛。因此,普通的词槽识别方式将无法识别短语句的词槽。
在现有的短语句词槽识别方法中,可以包括如下两种方式。一种是,同义词匹配:通过配置待澄清词槽和他的同义词,并采用同义词匹配的方式捕获词槽。另一种是实体识别:通过各种不同的实体识别的算法,识别出句子中的词槽,比较常用的实体识别算法是基于incoder-decoder的seq2seq算法。
但是上述方式存在如下缺陷:在第一种方式中,通过配置待澄清词槽的所有可能出现的主词及其同义词副词,在反问澄清时进行完全匹配,识别词槽,该枚举方案不能完全穷尽词槽的所有可能值,当澄清对话中含有其他字词时,无法从同义词库中找到完全匹配项,从而导致词槽识别结果的准确率较低。
在第二种方式中,利用事先标注好的词槽和句子作为训练数据训练出识别模型,通过模型识别出句中的待澄清词槽。在反问澄清环节,系统已获取到意图。因此,训练每个意图的词槽识别模型,这样每条澄清语句进入到该意图下的模型,进行澄清词槽的识别。但是,该方案需要训练每个意图下的模型,因此词槽识别过程较为繁琐且识别速度较慢。
因此,需要提供一种新的词槽识别方法。
需要说明的是,在上述背景技术部分发明的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的目的在于提供一种词槽识别方法、词槽识别装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的识别结果的准确率较低以及识别过程较为繁琐且识别速度较慢的问题。
根据本公开的一个方面,提供一种词槽识别方法,包括:
对待识别语句进行分词得到多个待识别短语句,并根据各所述待识别短语句得到待识别句子意图;
对各所述待识别短语句进行编码以及降维处理得到多个待识别短语句向量,并对各所述待识别句子意图进行编码得到多个待识别意图向量;
对各所述待识别短语句向量以及各所述待识别意图向量进行拼接得到多个待识别拼接向量;
根据各所述待识别拼接向量计算所述待识别短语句的特征词槽识别结果以及关键词槽识别结果,并根据所述特征词槽识别结果以及关键词槽识别结果生成与所述待识别语句对应的对话。
在本公开的一种示例性实施例中,所述词槽识别方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010447885.5/2.html,转载请声明来源钻瓜专利网。