[发明专利]数据处理方法、装置、计算机设备和存储介质有效
申请号: | 201810434066.X | 申请日: | 2018-05-08 |
公开(公告)号: | CN108595695B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 万周斌;王艳飞;於跃 | 申请(专利权)人: | 和美(深圳)信息技术股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/289 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 石佩 |
地址: | 518051 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种数据处理方法、装置、计算机设备和存储介质。方法包括:获取提问信息,当提问信息与知识库中的候选待推荐问题的词向量相似度评分大于第一预设阈值时,获取提问信息对应的目标待推荐问题和目标待推荐问题对应的答案,获取与目标推荐问题相邻的同类问题集合,计算各个同类问题与目标待推荐问题的总相似度,总相似度是根据各个所述同类问题与目标待推荐问题的问题相似度、第一词向量相似度、第二词向量相似度和语句相似度中至少两种相似度确定的,第二词向量相似度为不同类型语言的词向量相似度,将总相似度满足预设相似度阈值的同类问题添加至知识库,同类问题对应的答案为目标推荐问题对应的答案,知识库的扩充更为准确。
技术领域
本申请涉及计算机技术领域,特别是涉及一种数据处理方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,数据处理技术也随之发展。智能问答系统是以一问一答的方式,用户通过自然语言与系统交互来获取用户所需的提问知识。越是能够理解人们口语化提问的机器越聪明,而知识库就是智能问答系统能够实现智能问答的关键,没有庞大的知识库,就无法为智能问答提供有效的答案。现阶段都是通过扩充知识库和提升自然语言处理技术来提成机器的性能,从而更好的提升数据的处理能力,获取更为准确的提问结果。
在扩充知识库时,传统的方法直接将提问数据和获取到对应的答案直接添加至知识库,导致知识库中包含的内容较为繁杂。
发明内容
基于此,有必要针对上述技术问题,提供一种能够根据提问信息和目标待推荐问题有针对性的扩充知识库,从而提高知识库的准确度的数据处理方法、装置、计算机设备和存储介质。
一种数据处理方法,包括:
获取提问信息;
当提问信息与知识库中的候选待推荐问题的词向量相似度评分大于第一预设阈值时,获取提问信息对应的目标待推荐问题和目标待推荐问题对应的答案;
获取与目标推荐问题相邻的同类问题集合,计算同类问题集合中各个同类问题与目标待推荐问题的相似度,相似度是根据各个同类问题与目标待推荐问题的问题总相似度、第一词向量相似度、第二词向量相似度和语句相似度中至少两种相似度确定的,第二词向量相似度为不同类型语言的词向量相似度;
将总相似度满足预设相似度阈值的同类问题添加至知识库,同类问题对应的答案为目标推荐问题对应的答案。
一种数据处理装置,包括:
提问信息获取模块,用于获取提问信息;
推荐问题获取模块,用于当提问信息与知识库中的候选待推荐问题的词向量相似度评分大于第一预设阈值时,获取提问信息对应的目标待推荐问题和目标待推荐问题对应的答案;
相似度计算模块,用于获取与目标推荐问题相邻的同类问题集合,计算同类问题集合中各个同类问题与目标待推荐问题的相似度,相似度是根据各个同类问题与目标待推荐问题的问题总相似度、第一词向量相似度、第二词向量相似度和语句相似度中至少两种相似度确定的,第二词向量相似度为不同类型语言的词向量相似度;
知识库更新模块,用于将总相似度满足预设相似度阈值的同类问题添加至知识库,同类问题对应的答案为目标推荐问题对应的答案。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取提问信息;
当提问信息与知识库中的候选待推荐问题的词向量相似度评分大于第一预设阈值时,获取提问信息对应的目标待推荐问题和目标待推荐问题对应的答案;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于和美(深圳)信息技术股份有限公司,未经和美(深圳)信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810434066.X/2.html,转载请声明来源钻瓜专利网。