[发明专利]用于意图识别的方法以及相应的系统、计算机设备和介质有效
申请号: | 202110759114.4 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113590747B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 邹常林 | 申请(专利权)人: | 北京元年科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/205;G06F40/284 |
代理公司: | 北京汇知杰知识产权代理有限公司 11587 | 代理人: | 李洁;董江虹 |
地址: | 100191 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 意图 识别 方法 以及 相应 系统 计算机 设备 介质 | ||
1.一种用于意图识别的方法,包括:
接收来自用户的查询请求,所述查询请求由输入文本表示;
响应于所述查询请求,执行以下处理步骤:
分词获取步骤,包括:对所述输入文本进行解析以得到与所述输入文本对应的至少一个目标分词以及每个所述目标分词具有或指示的类型;
判断步骤,包括:判断对于所述查询请求,在已配置意图类别中是否存在一个匹配的已配置意图类别,其中每个已配置意图类别具有一个或多个槽位以及一个查询意图,每个槽位与预定的类型相对应;
意图类别识别步骤,包括:
在所述判断步骤的判断结果为肯定的情况下,确定所述匹配的已配置意图类别为所述查询请求的目标查询意图类别;
在所述判断结果为否定的情况下,添加一个由与所述输入文本对应的新意图文本表示的新的已配置意图类别,并将所述新的已配置意图类别作为所述查询请求的目标查询意图类别,所述新意图文本至少由所述至少一个目标分词中的每个具有或指示的类型组成,
其中对于所述新的已配置意图类别,
该新的已配置意图类别的查询意图由所述至少一个目标分词中的一个目标分词具有或指示的类型限定,所述至少一个目标分词中另外的至少部分目标分词中具有类型的每个目标分词限定与该目标分词的类型相对应的、该新的已配置意图类别的一个槽位,或者
所述至少一个目标分词中的至少部分目标分词中具有类型的每个目标分词限定与该目标分词的类型相对应的、该新的已配置意图类别的一个槽位,该新的已配置意图类别的查询意图基于所述输入文本、所述至少一个目标分词和/或该新的已配置意图类别的槽位确定;
意图确定步骤,包括:对于所述目标查询意图类别的、在所述至少一个目标分词中具有对应类型的目标分词的每个槽位,在该槽位中填入所述至少一个目标分词中的具有的类型与该槽位对应的目标分词,以确定所述查询请求的目标查询意图;
其中,所述方法用于目标领域的意图识别,所述分词获取步骤包括:
利用分词解析技术对所述输入文本进行解析以得到所述输入文本的分词结果,所述分词结果包括形成所述输入文本的至少一个分词;以及
基于可用的信息由所述至少一个分词得到所述至少一个目标分词,其中所述可用的信息包括与所述目标领域相关联的词汇;
使用LSTM+CRF模型序列标注算法将输入文本拆分成多个分词以得到输入文本的分词结果,并根据意图查询所针对的领域的可用数据库由分词结果确定目标分词和标注目标分词具有或指示的类型;其中,可用数据库为领域词典;
对于意图查询所涉及或针对的某个领域,存在预先建立的领域词典,该领域词典包括与该领域相关联的各种词汇如单字或词,对于该领域的意图查询而言可能有用或有意义的各种词汇,包括但不限于与该领域相关联的专业词汇;
另外,领域词典中包括的至少部分词汇中的每个词汇具有对应的预先定义的类型,或指示预先定义的类型;在前者的情况下,该词汇被划入或被指定属于该预先定义的类型,在后者的情况下,该词汇本身表示该预先定义的类型,即,该词汇描述或指示了该预先定义的类型的类型名称;
领域词典中包括指示各种可能的词汇或分词类型以及每个类型与具有该类型的词汇之间的对应关系的信息;就类型划分或描述而言,不同的领域中的情况是不同的;
目标分词包括或基于由输入文本得到的分词中对于意图查询所针对的领域而言可能有用或有意义的分词,结合意图查询所针对的领域确定;由输入文本得到的分词中对于意图查询所针对的领域而言没有用或没有意义的分词被舍弃;由输入文本得到的分词结果包括形成输入文本的至少一个分词;根据情况,至少一个目标分词源自至少一个分词中的全部或部分分词;
其中,每个已配置意图类别由一个相应的意图文本表示,并具有一个相应的通过训练好的模型由所述意图文本生成的已配置意图类别向量表达以及一个相应的设定阈值,所述判断步骤包括:
通过所述模型由与所述输入文本对应的目标文本生成一个查询请求向量表达,所述目标文本由所述至少一个目标分词中的每个具有或指示的类型组成;
计算所述查询请求向量表达与每个已配置意图类别的已配置意图类别向量表达的相似度;
确定与所述查询请求向量表达具有最大相似度的已配置意图类别向量表达所对应的已配置意图类别为感兴趣已配置意图类别;
仅在所述查询请求向量表达与所述感兴趣已配置意图类别的已配置意图类别向量表达的相似度大于所述感兴趣已配置意图类别的设定阈值的情况下,确定所述感兴趣已配置意图类别为所述匹配的已配置意图类别;
判断对于查询请求,在已配置意图类别中是否存在一个匹配的已配置意图类别;判断基于获取的目标分词;已配置意图类别是预先配置好的,每个已配置意图类别具有一个或多个槽位,每个槽位对应于预定的分词类型;对于任一具体领域,根据对于该领域而言可能被查询的意图预先配置一个或多个意图类别,每个已配置意图类别具有一个或多个槽位并具有一个查询意图,每个已配置意图类别具有的槽位、查询意图及每个槽位对应的分词类型是预先配置好和预先确定的;该查询意图由表示待查询指标或意图的指标词或意图词表示;每个已配置意图类别由一个相应的意图文本表示,该意图文本由该已配置意图类别具有的一个或多个槽位中的每个所对应的分词类型以及表示该已配置意图类别的查询意图的指标词或意图词形成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京元年科技股份有限公司,未经北京元年科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110759114.4/1.html,转载请声明来源钻瓜专利网。