[发明专利]一种基于词串长度的意图识别方法、系统及存储介质有效
申请号: | 202110167645.4 | 申请日: | 2021-02-07 |
公开(公告)号: | CN112800778B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 刘伟华;谭培波;柳晶晶;侯志强 | 申请(专利权)人: | 北京智通云联科技有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/242;G06F16/332;G06F16/33 |
代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 李斌 |
地址: | 100020 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 长度 意图 识别 方法 系统 存储 介质 | ||
本发明公开了一种基于词串长度的意图识别方法、系统、电子设备及存储介质,涉及意图识别技术领域,所述意图识别方法根据识别框架TOPVM查出问句对应所述识别框架的要素词得到第一要素字典;其中,T为时间,O为对象,P为参数,V为数值,M为方法;将所述要素词按照TOPVM的组合顺序按照长度进行排列,对相对较长的TOPVM的组合优先进行替换,得到候选词串,并和预建的问答意图知识库的目标词串进行匹配得到意图识别结果,能够快速进行意图识别,满足问答系统对实时性的要求。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于词串长度的意图识别方法、系统、电子设备及存储介质。
背景技术
随着人工智能技术的快速发展,人机对话技术在日常生活中的应用也越来越广泛,人机对话技术中最关键的是用户意图的识别,即识别用户输入的问句所表达的意图,在人机会话过程中,需要准确把握对话过程中的用户意图,即对于用户输入的一句话,通过意图识别技术确定用户期望完成的任务是什么,可见意图识别决定了能否智能、准确地与用户进行交互。
现有技术中,由于计算量过大,计算速度不能满足现场问答对实时性的要求。
发明内容
本发明的目的在于提供一种基于词串长度的意图识别方法、系统、电子设备及存储介质,能够快速的进行意图识别。
第一方面,本发明实施例提供了一种基于词串长度的意图识别方法,包括以下步骤:
根据识别框架TOPVM查出问句对应所述识别框架的要素词得到第一要素字典;其中,T为时间,O为对象,P为参数,V为数值,M为方法;
将所述要素词按照TOPVM的组合顺序按照长度进行排列,对相对较长的TOPVM的组合优先进行替换,得到候选词串,并和预建的问答意图知识库的目标词串进行匹配得到意图识别结果。
可选地,将所述要素词按照TOPVM的组合顺序按照长度进行排列,对相对较长的TOPVM的组合优先进行替换,得到候选词串包括:
根据TOPVM的顺序组合构造全部要素组合词串,并按照所述组合词串的长度逆排序;
按照组合词串长度的顺序将所述第一要素字典合并,得到带有组合长度顺序信息的第二要素字典;
根据所述第二要素字典递增地替换原句中相应的要素,得到候选词串。
可选地,所述意图识别方法还包括:
对所述问句中出现的和正则运算可能混淆的符号进行替换和恢复。
可选地,按照所述组合词串的长度逆排序包括:
将5个要素序列进行笛卡尔扩展,构造出([T,O,P,V,M],len)的二元组序列;
对上述序列按照len进行逆序排列。
第二方面,本发明实施例提供了基于词串长度的意图识别系统,所述识别系统包括:
数据层,用于根据识别框架TOPVM查出问句对应所述识别框架的要素词;
处理层,用于将所述要素词按照TOPVM的组合顺序按照长度进行排列,对相对较长的TOPVM的组合优先进行替换,得到候选词串,并和预建的问答意图知识库的目标词串进行匹配;
应用层,用于意图识别结果的输出。
可选地,所述数据层包括:
问句语料库,用来记录问句相关信息,问句相关信息包括序号、问句来源以及问句;
第一要素字典,包括字典代码和要素的实例值;
问答意图知识库,包括问句目标词串和问答意图解析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智通云联科技有限公司,未经北京智通云联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110167645.4/2.html,转载请声明来源钻瓜专利网。