[发明专利]未知问题处理方法、装置、设备及介质在审
申请号: | 202011412028.8 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112527985A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 嵇望;王伟凯;钱艳;安毫亿;朱鹏飞;梁青 | 申请(专利权)人: | 杭州远传新业科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/194;G06F40/30;G06K9/62 |
代理公司: | 杭州创智卓英知识产权代理事务所(普通合伙) 33324 | 代理人: | 王媛媛 |
地址: | 310051 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 未知 问题 处理 方法 装置 设备 介质 | ||
本发明公开了一种未知问题处理方法、装置、电子设备及计算机存储介质,涉及自然语言处理技术领域,旨在解决未知问题的意图类别判断不准确且处理过程的计算量大的问题。该方法包含以下步骤:获取未知问题;将未知问题输入意图识别模型,得到未知问题的候选类别集合;通过文本相似度算法,计算未知问题与候选类别集合中各候选类别所对应文本的相似度;将计算得到的相似度最大值与预设阈值比对;若相似度最大值大于预设阈值,则将未知问题增加到相似度最大值对应的候选类别中;否则,根据未知问题,新增类别,获取新增类别的答案。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种未知问题处理方法、装置、设备及介质。
背景技术
在问答系统的交互过程中,由于参与意图识别模型维护的训练语料不完整,会导致许多与意图类别相关的文本无法对应到已知的类别,从而会积累大量的未知问题数据。为了提升意图识别的准确度,加强问答系统的交互能力,如何处理这些未知问题数据就变得尤为重要。
在现有技术中,中国专利申请CN202010087214.2提出智能问答中未知问题处理方法、装置、计算机设备和介质,通过匹配问题的业务标签确定当前问题是否为未知问题,若为未知问题则将未知问题与当前业务标签关联输出,将输出的未知问题进行聚类处理后,发送至业务标签对应的运营终端。但是该专利通过词库匹配及规则的方式进行未知问题的意图类别判断,侧重经验学习,判断结果不准确,且对于未知问题的处理采用聚类算法,计算量较大。除此之外,中国专利申请CN201510133722.9也提出一种智能应答方法和系统,通过语义扩展问题查找对应的答案,若问题未知,则加入未知问题队列,将未知问题队列里的每一个未知问题与已知问题进行相似度计算,根据相似度与阈值的比对情况,对不同相似度的未知问题做不同的处理。但是,该专利通过将问题语义扩展后,查询是否有存在对应答案的方式,对未知问题进行判断,判断不准确;且将未知问题与所有已知问题进行相似度计算,计算量较大;同时对应未知问题的答案需要人工收集并记录,工作量较大。
针对未知问题的意图类别判断不准确且处理过程的计算量大的问题,目前尚未提出有效的解决方法。
发明内容
本发明实施例提供了一种未知问题处理方法、装置、设备及介质,以至少解决未知问题的意图类别判断不准确且处理过程的计算量大的问题。
第一方面,本发明实施例提供了一种未知问题处理方法,包括以下步骤:
获取未知问题;
将所述未知问题输入意图识别模型,得到所述未知问题的候选类别集合;
通过文本相似度算法,计算所述未知问题与所述候选类别集合中各候选类别所对应文本的相似度;
将计算得到的相似度最大值与预设阈值比对;
若所述相似度最大值大于预设阈值,则将所述未知问题增加到所述相似度最大值对应的候选类别中;
否则,根据所述未知问题,新增类别,获取所述新增类别的答案。
在其中一些实施例中,所述获取所述新增类别的答案,包括:
通过预先训练完成的阅读理解算法从知识库中获取所述新增类别的答案。
在其中一些实施例中,所述通过预先训练完成的阅读理解算法从知识库中获取所述新增类别的答案,包括:
从所述知识库中获取与所述未知问题关联的文档文本,将所述未知问题与各所述文档文本分别组合,组成若干组输入数据;
将所述输入数据输入所述阅读理解算法,生成若干组候选答案;
从所述若干组候选答案中筛选所述新增类别的答案。
在其中一些实施例中,所述获取所述新增类别的答案,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州远传新业科技有限公司,未经杭州远传新业科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011412028.8/2.html,转载请声明来源钻瓜专利网。