[发明专利]数据管理方法、装置、设备及存储介质在审
申请号: | 202110304040.5 | 申请日: | 2021-03-22 |
公开(公告)号: | CN113064887A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 史文鑫 | 申请(专利权)人: | 平安银行股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/332;G06F16/35 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 518001 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据管理 方法 装置 设备 存储 介质 | ||
1.一种数据管理方法,其特征在于,所述数据管理方法包括:
从预置知识库中获取语料数据,其中,所述语料数据包括多个标准问,每一个标准问对应多个扩展问,所述知识库用于为用户提供答案;
对所述语料数据进行数据清洗,得到目标语料数据;
将所述目标语料数据输入预置意图分类模型,以对所述目标语料数据的分类进行预测,得到预测结果,其中,所述目标语料数据包括标准问、与所述标准问对应的扩展问以及与所述标准问对应的标准答案;
基于所述预测结果,筛选意图相似的标准问,并将所述意图相似的标准问删除;
确定与所述标准问对应的全部扩展问和与所述标准问对应的标准答案,优化所述知识库。
2.根据权利要求1所述的数据管理方法,其特征在于,在所述从预置知识库中获取语料数据之前,还包括:
获取用户与智能客服的多轮对话;
将所述多轮对话转换为目标文本;
基于所述用户的所述目标文本,生成标准问以及与所述标准问对应的标准答案;
基于所述标准问以及与所述标准问对应的标准答案,生成知识库。
3.根据权利要求1所述的数据管理方法,其特征在于,所述对所述语料数据进行数据清洗,得到目标语料数据包括:
确定所述语料数据的清洗需求;
根据所述语料数据和所述清洗需求以及预置清洗规则分类模型,确定与所述语料数据对应的目标清洗规则;
根据所述目标清洗规则对所述语料数据进行数据清洗,得到目标语料数据。
4.根据权利要求1所述的数据管理方法,其特征在于,所述数据管理方法还包括:
从预置数据库中获取用户与智能客服之间的历史对话文本数据;
获取所述历史对话文本数据中包含的所有标准问;
基于所述历史对话文本数据和所述标准问,通过预置BERT模型确定所述标准问对应的标准答案在所述历史对话文本数据的位置数据;
基于所述历史对话文本数据和所述标准答案在所述历史对话文本数据的位置数据,确定所述标准问对应的标准答案;
基于所述标准答案和所述标准问,确定所述历史对话文本数据中包含的所有标问标答对,其中,每个标准问对应一个标准答案。
5.根据权利要求1所述的数据管理方法,其特征在于,在所述基于所述标准答案和所述标准问,确定所述历史对话文本数据中包含的所有标问标答对之后,还包括:
获取预先定义的意图标签;
确定各所述历史对话文本数据种携带的意图标签;
将所述历史对话文本数据和所述历史对话文本数据对应的意图标签输入预置Albert模型得到初始意图分类模型。
6.根据权利要求5所述的数据管理方法,其特征在于,在所述将所述历史对话文本数据和所述历史对话文本数据对应的意图标签输入预置Albert模型得到初始意图分类模型之后,还包括:
获取用户与智能客服之间的实时对话文本数据;
将所述实时对话文本数据作为训练数据集,输入所述初始意图分类模型,以对所述实时对话文本数据的分类进行预测,并对所述预测结果进行处理;
将处理后的实时对话文本数据输入所述初始意图分类模型进行迭代训练,直至所述初始意图分类模型预测结果大于预设准确率,得到目标意图分类模型。
7.一种数据管理装置,其特征在于,所述数据管理装置包括:
第一获取模块,用于从预置知识库中获取语料数据,其中,所述语料数据包括多个标准问,每一个标准问对应多个扩展问,所述知识库用于为用户提供答案;
数据清洗模块,用于对所述语料数据进行数据清洗,得到目标语料数据;
第一预测模块,用于将所述目标语料数据输入预置意图分类模型,以对所述目标语料数据的分类进行预测,得到预测结果,其中,所述目标语料数据包括标准问、与所述标准问对应的扩展问以及与所述标准问对应的标准答案;
筛选模块,用于基于所述预测结果,筛选意图相似的标准问,并将所述意图相似的标准问删除;
优化模块,用于确定与所述标准问对应的全部扩展问和与所述标准问对应的标准答案,优化所述知识库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110304040.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:膜层及其形成方法
- 下一篇:图像清晰度检测方法、装置、设备及存储介质