[发明专利]问答资源挖掘方法、装置、计算机设备及存储介质有效
申请号: | 201910257005.5 | 申请日: | 2019-04-01 |
公开(公告)号: | CN111767366B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 甘露;黄强;卜建辉;刘剑;吴伟佳 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06N3/0464 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 资源 挖掘 方法 装置 计算机 设备 存储 介质 | ||
本申请提出一种问答资源挖掘方法、装置、计算机设备及存储介质,其中,方法包括:获取待处理的多个会话语料;将每个会话语料输入至预先训练的问题识别模型,以获取每个会话语料中包含的多个候选问题;从与每个候选问题对应的会话语料中,获取与候选问题对应的至少一个候选答案,组成多个候选问答对;将多个候选问答对输入预先训练的答案匹配模型以获取每个候选问答对的置信度,并根据置信度从多个候选问答对中筛选出目标问答对。通过本方法,能够实现问答资源的自动挖掘,节省人力成本,降低时耗,提高问答资源挖掘的准确率和召回率,解决现有技术中人工挖掘问答对耗时长、根据语气词识别出问题再确定问答对的准确率和召回率低的技术问题。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种问答资源挖掘方法、装置、计算机设备及存储介质。
背景技术
自动问答系统综合运用知识表示、信息检索、自然语言处理等技术,能够根据接收的用户以自然语言形式输入的问题,返回简洁而准确的答案。自动问答系统相比于传统的搜索引擎,具有更方便、更准确的优点,是当前自然语言处理及人工智能领域的研究热点。
自动问答系统的实现需要问答库的支撑,自动问答系统中需要预先设置问答库,从问答库中获取与用户输入的问题匹配的答案。
目前,问答库的构建方式主要有两种,一是通过人工挖掘的方式从海量的互联网数据中提取出问题和对应的答案构建问答库,这种方式需要耗费大量的人力且耗时较长;另一种是通过识别句子中包含的语气词来判断该句子是否为问句进行问题识别,再获取与问题对应的答案构建问答库,这种方式仅能识别疑问句,对于非疑问句表达的问题无法识别,从而导致问答对挖掘的准确率和召回率较低。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请提出一种问答资源挖掘方法、装置、计算机设备及存储介质,用于解决现有技术中人工挖掘问答对耗时长、根据语气词识别出问题再确定问答对的准确率和召回率低的技术问题。
为达上述目的,本申请第一方面实施例提出了一种问答资源挖掘方法,包括:
获取待处理的多个会话语料;
将每个会话语料输入至预先训练的问题识别模型,以获取所述每个会话语料中包含的多个候选问题;
从与每个候选问题对应的会话语料中,获取与所述候选问题对应的至少一个候选答案,组成多个候选问答对;
将所述多个候选问答对输入预先训练的答案匹配模型以获取每个候选问答对的置信度,并根据所述置信度从所述多个候选问答对中筛选出目标问答对。
本申请实施例的问答资源挖掘方法,通过获取待处理的多个会话语料,将每个会话语料输入至预先训练的问题识别模型以获取每个会话语料中包含的多个候选问题,从与每个候选问题对应的会话语料中,获取与候选问题对应的至少一个候选答案,组成多个候选问答对,进而将多个候选问答对输入预先训练的答案匹配模型以获取每个候选问答对的置信度,并根据置信度从多个候选问答对中筛选出目标问答对。由此,实现了问答资源的自动挖掘,整个过程无需人工参与,节省了人力成本,提高了问答资源的挖掘速度和效率,降低了时耗,通过预先训练的问题识别模型来识别出问题,而不依赖于句子包含的语气词来确定问题,有利于提高问题识别的准确率和召回率,进而提高问答资源挖掘的准确率和召回率,为实现精准的自动问答提供了条件。
为达上述目的,本申请第二方面实施例提出了一种问答资源挖掘装置,包括:
获取模块,用于获取待处理的多个会话语料;
识别模块,用于将每个会话语料输入至预先训练的问题识别模型,以获取所述每个会话语料中包含的多个候选问题;
候选答案获取模块,用于从与每个候选问题对应的会话语料中,获取与所述候选问题对应的至少一个候选答案,组成多个候选问答对;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910257005.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据合并方法和装置
- 下一篇:一种直写笔和直写装置