[发明专利]一种问答对的生成方法、装置及服务器有效
申请号: | 201910833603.2 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110532369B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 缪畅宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06Q30/00 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 答对 生成 方法 装置 服务器 | ||
本申请公开了一种问答对的生成方法、装置及服务器,方法包括:获得文档,所述文档中包括至少一个段落,所述段落中包括对目标对象的描述内容;至少基于所述描述内容,对所述文档中的段落进行划分,得到至少一个分块,所述分块中包括至少一个所述段落;获得所述分块对应的问题信息及所述分块对应的答案信息;其中,所述分块对应的问题信息及所述答案信息组成所述目标对象的问答对,所述问答对用于提供问答服务。可见,本申请中不再需要专业工作人员进行问答对提取,避免大量的工作时长的消耗,而采用对文档的段落进行分块的方式,从分块中获得对应的问答对,由此节省生成问答对的耗时,从而达到提高生成问答对的效率的目的。
技术领域
本申请涉及智能客服技术领域,尤其涉及一种问答对的生成方法、装置及服务器。
背景技术
在智能客服等领域,针对各产品可以利用说明书等产品文档建立相应产品的问答知识库,由此,在知识库中选取针对用户所提问题的问答对,为用户作出具体回答。
目前在建立问答知识库时,通常需要人工干预,例如,由专业工作人员手动从产品文档中抽取问答对,并组建知识库。
因此,目前获得问答对的方式需要消耗大量的工作时长,导致问答对的生成效率较低。
发明内容
有鉴于此,本申请提供一种问答对的生成方法、装置及服务器,以提高生成问答对的效率。
为实现上述目的,一方面,本申请提供了一种问答对的生成方法,包括:
获得文档,所述文档中包括至少一个段落,所述段落中包括对目标对象的描述内容;
至少基于所述描述内容,对所述文档中的段落进行划分,得到至少一个分块,所述分块中包括至少一个所述段落;
获得所述分块对应的问题信息及所述分块对应的答案信息;
其中,所述分块对应的问题信息及所述答案信息组成所述目标对象的问答对,所述问答对用于提供问答服务。
在一种可能的实现方式中,所述至少基于所述描述内容,对所述文档中的段落进行划分,得到至少一个分块,包括:
基于所述描述内容,将相似度值满足预设的阈值范围的段落划分到同一个分块,以得到所述文档中的至少一个分块。
可选的,所述基于所述描述内容,将相似度值满足预设的阈值范围的段落划分到同一个分块,以得到所述文档中的至少一个分块,包括:
对所述文档中的段落进行编码,以得到所述段落的编号;
将所述编号相邻且关于所述描述内容的相似度值满足预设的阈值范围的段落划分到同一个分块,以得到所述文档中的至少一个分块。
可选的,所述基于所述描述内容,将相似度值满足预设的阈值范围的段落划分到同一个分块,以得到所述文档中的至少一个分块,包括:
获取所述文档中的第一个段落作为当前分块;
获取所述文档中所述第一个段落的下一个段落作为当前段落,并将所述当前段落与所述当前分块进行相似度值获取;
如果所述当前分块与所述当前段落的相似度值满足预设的阈值范围,将所述当前段落划分到所述当前分块中,并获取所述文档中所述当前段落的下一个段落作为新的当前段落,返回执行所述步骤将所述当前段落与所述当前分块进行相似度值获取,直到所述文档中的所有段落划分完成;
如果所述当前分块与所述当前段落的相似度值不满足所述阈值范围,将所述当前段落划分到所述当前分块的下一个分块,并获取所述文档中所述当前段落的下一个段落作为新的当前段落,将所述下一个分块做为新的当前分块,返回执行所述步骤所述当前段落与所述当前分块进行相似度值获取,直到所述文档中的所有段落划分完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910833603.2/2.html,转载请声明来源钻瓜专利网。