[发明专利]一种意图识别模型生成方法、装置、设备及存储介质在审
申请号: | 202110494941.5 | 申请日: | 2021-05-07 |
公开(公告)号: | CN115309853A | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 乐雨泉;赵宇明;陈蒙 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06F40/211;G06F40/289;G06F40/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 丁曼曼 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 意图 识别 模型 生成 方法 装置 设备 存储 介质 | ||
本申请公开了一种意图识别模型生成方法、装置、设备及存储介质。该方法的步骤包括:获取样本语句和与样本语句对应的样本意图;确定样本语句的词特征序列以及词共现关系;基于词共现关系、词特征序列以及样本意图训练得到意图识别模型。意图识别模型能够根据待识别语句中所出现的每个词与其它各词之间的关联性,综合分析待识别语句的语句意图,进而能够进一步确保意图识别模型对于语句意图分析的准确性。此外,本申请还提供一种意图识别模型生成装置、设备及存储介质,有益效果同上所述。
技术领域
本申请涉及机器学习领域,特别是涉及一种意图识别模型生成方法、装置、设备及存储介质。
背景技术
在包括电商场景在内的网络业务平台场景中,智能客服可以随时根据用户发起的问题向用户提供答复,具有高效的工作效率,并且能够为用户提供优质的服务质量、标准化的服务流程,因此智能客服扮演着越发重要的角色。
语句意图识别是智能客服系统中的核心技术,精确的理解用户意图能够有效地提高用户对智能客服系统的体验。目前语句意图识别主要基于机器学习模型的方法实现,但是当前基于机器学习模型进行语句意图识别时,仅根据语句中相邻词与词之间的序列信息分析语句意图,并没有考虑到间隔较远的词之间的关联性,因此难以确保语句意图分析的准确性。
由此可见,提供一种意图识别模型生成方法,以相对确保意图识别模型对语句意图分析的准确性,是本领域技术人员需要解决的问题。
发明内容
本申请的目的是提供一种意图识别模型生成方法、装置、设备及存储介质,以相对确保意图识别模型对语句意图分析的准确性。
为解决上述技术问题,本申请提供一种意图识别模型生成方法,包括:
获取样本语句和与样本语句对应的样本意图;
确定样本语句的词特征序列以及词共现关系;
基于词共现关系、词特征序列以及样本意图训练得到意图识别模型。
优选地,确定样本语句的词特征序列以及词共现关系,包括:
对样本语句执行分词操作得到词序列;
基于词序列生成词特征序列以及词共现关系。
优选地,基于词序列生成词共现关系,包括:
基于滑动窗口算法获取词序列在各窗口滑动时刻下,同时处于窗口内的目标词元素;
建立各窗口滑动时刻下相应目标词元素之间的词共现关系。
优选地,基于词序列生成词特征序列,包括:
基于语言模型对词序列中的词元素执行特征提取得到词特征序列。
优选地,获取样本语句和与样本语句对应的样本意图,包括:
提取样本语句集合中的各样本语句;
对各样本语句执行分词操作得到相应的词序列;
基于各样本语句生成的词序列生成相应的待聚类词特征序列;
将相似度达到预设阈值的待聚类词特征序列划分至相同的聚类集合;
将对应相同聚类集合的样本语句标注相同的样本意图。
优选地,在将相似度达到预设阈值的待聚类词特征序列划分至相同的聚类集合之前,方法还包括:
统计待聚类词特征序列的特征累加和;
将相似度达到预设阈值的待聚类词特征序列划分至相同的聚类集合,包括:
将特征累加和的相似度达到预设阈值的待聚类词特征序列划分至相同的聚类集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110494941.5/2.html,转载请声明来源钻瓜专利网。