[发明专利]一种知识库的生成方法、文本查找方法和装置在审
申请号: | 202010408304.7 | 申请日: | 2020-05-14 |
公开(公告)号: | CN111858876A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 李翔;李健;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G10L15/26;G10L17/06 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识库 生成 方法 文本 查找 装置 | ||
1.一种知识库的生成方法,其特征在于,包括:
获取目标用户与其他用户对话产生的对话语音;
在所述对话语音中提取所述目标用户的目标语音,并将所述目标语音转换为目标文本;
基于所述目标用户的所述目标文本,生成标准问题以及所述标准问题对应的标准答案;
采用所述标准问题以及所述标准问题对应的标准答案,生成知识库。
2.根据权利要求1所述的方法,其特征在于,所述在所述对话语音中提取所述目标用户的目标语音,并将所述目标语音转换为目标文本的步骤,包括:
在所述对话语音中,确定至少一段有效语音;
提取所述有效语音的语音声纹特征;
将所述语音声纹特征与预设的目标用户声纹特征进行比对,若所述语音声纹特征与所述目标用户声纹特征相似,将所述有效语音确定为目标语音;
基于语音识别,将所述目标语音转换为目标文本。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户的所述目标文本,生成标准问题以及所述标准问题对应的标准答案的步骤,包括:
在所述目标文本获取至少一个标准答案;
基于所述标准答案,生成所述标准答案对应的标准问题。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
采用预设的实体识别模型,在所述目标文本中,提取至少一个实体;
基于所述目标文本,确定所述实体对应的属性以及属性值,生成所述实体对应的三元组。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
确定所述知识点之间的相似度;所述知识点包括所述三元组,和/或,所述标准答案;
基于所述知识点之间的相似度,将所述知识点分为至少一个类别。
6.一种文本查找方法,其特征在于,所述方法包括:
获取提问文本;
在所述知识库中查找与所述提问文本相似度最高的标准问题,确定为目标标准问题;其中,所述知识库通过获取目标用户与其他用户对话产生的对话语音;在所述对话语音中提取所述目标用户的目标语音,并将所述目标语音转换为目标文本;基于所述目标用户的所述目标文本,生成标准问题以及所述标准问题对应的标准答案;采用所述标准问题以及所述标准问题对应的标准答案生成知识库得到;
在所述知识库中,查找所述目标标准问题对应的标准答案,作为目标文本。
7.一种知识库的生成装置,其特征在于,包括:
获取模块,用于获取目标用户与其他用户对话产生的对话语音;
转换模块,用于在所述对话语音中提取所述目标用户的目标语音,并将所述目标语音转换为目标文本;
问题答案生成模块,用于基于所述目标用户的所述目标文本,生成标准问题以及所述标准问题对应的标准答案;
知识库生成模块,用于采用所述标准问题以及所述标准问题对应的标准答案,生成知识库。
8.一种文本查找装置,其特征在于,所述装置包括:
提问模块,用于获取提问文本;
第一查找模块,用于在所述知识库中查找与所述提问文本相似度最高的标准问题,确定为目标标准问题;其中,所述知识库通过获取目标用户与其他用户对话产生的对话语音;在所述对话语音中提取所述目标用户的目标语音,并将所述目标语音转换为目标文本;基于所述目标用户的所述目标文本,生成标准问题以及所述标准问题对应的标准答案;采用所述标准问题以及所述标准问题对应的标准答案生成知识库得到;
第二查找模块,用于在所述知识库中,查找所述目标标准问题对应的标准答案,作为目标文本。
9.一种装置,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如权利要求1-5或6所述的一个或多个的方法。
10.一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如权利要求1-5或6所述的一个或多个的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010408304.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:牙刷
- 下一篇:一种基于Zernike多项式的杂散光估计方法