[发明专利]一种基于词串长度的意图识别方法、系统及存储介质有效
申请号: | 202110167645.4 | 申请日: | 2021-02-07 |
公开(公告)号: | CN112800778B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 刘伟华;谭培波;柳晶晶;侯志强 | 申请(专利权)人: | 北京智通云联科技有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/242;G06F16/332;G06F16/33 |
代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 李斌 |
地址: | 100020 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 长度 意图 识别 方法 系统 存储 介质 | ||
1.一种基于词串长度的意图识别方法,其特征在于,所述方法包括:
根据识别框架TOPVM查出问句对应所述识别框架的要素词得到第一要素字典;其中,T为时间,O为对象, P为参数,V为数值, M为方法;
将所述要素词按照TOPVM的组合顺序按照长度进行排列,对相对较长的TOPVM的组合优先进行替换,得到候选词串,并和预建的问答意图知识库的目标词串进行匹配得到意图识别结果;
将所述要素词按照TOPVM的组合顺序按照长度进行排列,对相对较长的TOPVM的组合优先进行替换,得到候选词串包括:
根据TOPVM的顺序组合构造全部要素组合词串,并按照所述组合词串的长度逆排序;
按照组合词串长度的顺序将所述第一要素字典合并,得到带有组合长度顺序信息的第二要素字典;
根据所述第二要素字典递增地替换原句中相应的要素,得到候选词串;
按照所述组合词串的长度逆排序包括:
将5个要素序列进行笛卡尔扩展,构造出([T,O,P,V,M],len)的二元组序列;
对上述序列按照len进行逆序排列。
2.根据权利要求1所述的意图识别方法,其特征在于,所述意图识别方法还包括:
对所述问句中出现的和正则运算可能混淆的符号进行替换和恢复。
3.一种基于词串长度的意图识别系统,其特征在于,所述识别系统包括:
数据层,用于根据识别框架TOPVM查出问句对应所述识别框架的要素词得到第一要素字典;其中,T为时间,O为对象,P为参数,V为数值,M为方法;将5个要素序列进行笛卡尔扩展,构造出([T,O,P,V,M],len)的二元组序列;对上述序列按照len进行逆序排列;
处理层,用于将所述要素词按照TOPVM的组合顺序按照长度进行排列,对相对较长的TOPVM的组合优先进行替换,得到候选词串,并和预建的问答意图知识库的目标词串进行匹配;
应用层,用于意图识别结果的输出;
所述处理层包括:
正则符号处理模块,用于对输入问句中出现的和正则运算可能混淆的符号进行替换和恢复;
框架要素匹配模块,根据识别框架TOPVM查出问句对应所述识别框架的要素词得到第一要素字典;
字典排序模块,按照组合词串长度的顺序将所述第一要素字典合并,得到带有组合长度顺序信息的第二要素字典;
问答意图匹配模块,根据所述第二要素字典递增地替换原句中相应的要素,得到候选词串,并和问答意图知识库的目标词串进行匹配得到意图识别结果。
4.根据权利要求3所述意图识别系统,其特征在于,所述数据层包括:
问句语料库,用来记录问句相关信息,问句相关信息包括序号、问句来源以及问句;
第一要素字典,包括字典代码和要素的实例值;
问答意图知识库,包括问句目标词串和问答意图解析。
5.根据权利要求3所述意图识别系统,其特征在于,所述应用层包括:
问句分析模块,用于读入问句列表,并把意图识别结果进行输出。
6.一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-2中任一项所述方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如权利要求1-2中任一项所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智通云联科技有限公司,未经北京智通云联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110167645.4/1.html,转载请声明来源钻瓜专利网。