[发明专利]一种知识库的生成方法、文本查找方法和装置在审
申请号: | 202010408304.7 | 申请日: | 2020-05-14 |
公开(公告)号: | CN111858876A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 李翔;李健;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G10L15/26;G10L17/06 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识库 生成 方法 文本 查找 装置 | ||
本发明实施例提供了一种知识库的生成方法、文本查找方法和装置,所述知识库的生成方法包括:获取目标用户与其他用户对话产生的对话语音;在所述对话语音中提取所述目标用户的目标语音,并将所述目标语音转换为目标文本;基于所述目标用户的所述目标文本,生成标准问题以及所述标准问题对应的标准答案;采用所述标准问题以及所述标准问题对应的标准答案,生成知识库。从而可以得到包含目标用户个人知识体系以及个人认知的目标文本,并实现获得可以体现出目标用户的知识体系以及个人认知的知识库。其他用户可以通过所述知识库,获取基于目标用户的知识体系以及个人认知得到的答案。目标用户可以通过所述知识库,对自身的知识体系进行回溯。
技术领域
本发明涉及计算机技术领域,特别是涉及一种知识库的生成方法、一种文本查找方法、一种知识库的生成装置和一种文本查找装置。
背景技术
人可以通过获得知识,应用知识,或者信息加工的过程,得到个人的知识体系,以及个人对世界的认知。然而,个人的知识体系以及个人对世界的认知,只有本人可以了解。若他人希望向一个人咨询问题,获取个人基于其本人知识体系以及本人认知的形成的答案,那么他人一般只能向该个人本人进行咨询,而较难通过其他方式获取该个人对问题的回复。
例如,对于医生、律师、心理咨询师等经常接收他人咨询的职业来说,若咨询者希望得到职业人士对其提出问题的回复,通常需要直接向职业人士咨询,而较难通过其他方式获取职业人士对问题的回复。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种知识库的生成方法、一种文本查找方法、一种知识库的生成装置和一种文本查找装置。
为了解决上述问题,本发明实施例公开了一种知识库的生成方法,包括:
获取目标用户与其他用户对话产生的对话语音;
在所述对话语音中提取所述目标用户的目标语音,并将所述目标语音转换为目标文本;
基于所述目标用户的所述目标文本,生成标准问题以及所述标准问题对应的标准答案;
采用所述标准问题以及所述标准问题对应的标准答案,生成知识库。
可选地,所述在所述对话语音中提取所述目标用户的目标语音,并将所述目标语音转换为目标文本的步骤,包括:
在所述对话语音中,确定至少一段有效语音;
提取所述有效语音的语音声纹特征;
将所述语音声纹特征与预设的目标用户声纹特征进行比对,若所述语音声纹特征与所述目标用户声纹特征相似,将所述有效语音确定为目标语音;
基于语音识别,将所述目标语音转换为目标文本。
可选地,所述基于所述目标用户的所述目标文本,生成标准问题以及所述标准问题对应的标准答案的步骤,包括:
在所述目标文本获取至少一个标准答案;
基于所述标准答案,生成所述标准答案对应的标准问题。
可选地,所述方法还包括:
采用预设的实体识别模型,在所述目标文本中,提取至少一个实体;
基于所述目标文本,确定所述实体对应的属性以及属性值,生成所述实体对应的三元组。
可选地,所述方法还包括:
确定所述知识点之间的相似度;所述知识点包括所述三元组,和/或,所述标准答案;
基于所述知识点之间的相似度,将所述知识点分为至少一个类别。
本发明实施例还公开了一种文本查找方法,所述方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010408304.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:牙刷
- 下一篇:一种基于Zernike多项式的杂散光估计方法