[发明专利]一种构建家电维修问答库的方法、装置、存储介质及终端在审
申请号: | 202010021314.5 | 申请日: | 2020-01-09 |
公开(公告)号: | CN111221954A | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 王燕 | 申请(专利权)人: | 珠海格力电器股份有限公司;珠海联云科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/335 |
代理公司: | 北京聿宏知识产权代理有限公司 11372 | 代理人: | 吴大建;张杰 |
地址: | 519000*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 构建 家电 维修 问答 方法 装置 存储 介质 终端 | ||
本公开涉及电子信息技术领域,具体涉及一种构建家电维修问答库的方法、装置、存储介质及终端,方法包括:获取维修问答数据集;基于语义相似度、句长相似度、字数相似度,对维修问答数据集中的维修问题进行聚类,得到问题组;从维修问答数据集中获取与每个问题组中维修问题对应的维修答案,并从获取到的维修答案中选取其中一个维修答案作为该问题组对应的最优答案;构建家电维修问答库,并将每个问题组和与该问题组对应的最优答案存储至该家电维修问答库,解决了现有技术中在构建问答知识库时难度大以及强度高的问题。
技术领域
本公开涉及电子信息技术领域,特别地涉及一种构建家电维修问答库的方法、装置、存储介质及终端。
背景技术
问答知识库是一种问答知识库可以帮助用户在线解决80%的一般问题以及常见问题,不仅方便了用户,节省用户的时间,也大大减轻了工作人员的压力。
目前常见的做法是将积累的常见问题解答、或者其他相关的文档整理成常见问题解答,运用传统的文本匹配模型添加到问答知识库中,传统的文本匹配模型需要基于大量的人工标注和整理,即人工对多种问题以及对应的答案进行归类整理,如空调制冷问题类、空调噪音问题类、空调清洁问题类、空调零部件问题类、空调保养问题类、空调安装问题类等。当问答越来越多时,会给后期维护人员带来较大的压力,进而增加维护人员的劳动强度。
因此,如何降低构建问答知识库的难度和强度是亟待解决的问题。
发明内容
针对上述问题,本公开提供一种构建家电维修问答库的方法、装置、存储介质及终端,解决了现有技术中在构建问答知识库时难度大以及强度高的问题。
第一方面,本公开提供了一种构建家电维修问答库的方法,所述方法包括:
获取维修问答数据集,其中,所述维修问答数据集中包括至少两个维修问题和与每个维修问题对应的维修答案;
基于语义相似度、句长相似度、字数相似度中的至少一种相似度,对所述维修问答数据集中的至少两个维修问题进行聚类,以得到至少一个问题组;
从所述维修问答数据集中获取与每个问题组中的每个维修问题分别对应的维修答案,并从获取到的维修答案中选取其中一个维修答案作为该问题组对应的最优答案;
构建家电维修问答库,并将每个所述问题组和与该问题组对应的最优答案存储至该家电维修问答库。
根据本公开的实施例,可选的,上述方法中,在所述基于语义相似度、句长相似度、字数相似度中的至少一种相似度,对所述维修问答数据集中的至少两个维修问题进行聚类,以得到至少一个问题组的步骤之前,所述方法还包括:
对所述维修问答数据集中包括的至少两个维修问题进行预处理,以更新所述维修问答数据集中包括的至少两个维修问题。
根据本公开的实施例,可选的,上述方法中,在基于语义相似度、句长相似度、字数相似度中的任意一种相似度对所述维修问答数据集中的至少两个维修问题进行聚类时,所述基于语义相似度、句长相似度、字数相似度中的至少一种相似度,对所述维修问答数据集中的至少两个维修问题进行聚类,以得到至少一个问题组的步骤包括:
采用TF-IDF算法提取所述维修问答数据集中更新后的每两个维修问题的关键词;
基于所述每两个维修问题的关键词,采用预设相似度算法计算该两个维修问题之间的语义相似度、句长相似度、字数相似度中的任意一种相似度值,得到该两个维修问题之间的独立相似度值;
在所述独立相似度值大于第一预设阈值时,将该独立相似度值对应的两个维修问题划为至同一个问题组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司;珠海联云科技有限公司,未经珠海格力电器股份有限公司;珠海联云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010021314.5/2.html,转载请声明来源钻瓜专利网。