[发明专利]一种面向复杂性问题的开放域问答系统在审
申请号: | 202210617098.X | 申请日: | 2022-06-01 |
公开(公告)号: | CN115329054A | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 赵慧雅;高世伟;王哲 | 申请(专利权)人: | 赵慧雅 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/126;G06F40/211;G06F40/284;G06N3/08 |
代理公司: | 南京源古知识产权代理事务所(普通合伙) 32300 | 代理人: | 马晓辉 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 复杂性 问题 开放 问答 系统 | ||
1.一种面向复杂性问题的开放域问答系统,其特征在于,包括:输入问题单元、子问题生成器、遍历器选择函数、检索状态参量、稀疏向量检索器、稠密向量检索器、链式检索器、子问题阅读器、比较器、证据集和生成回答单元;
具体方法为:将问题传递给子问题生成器,获取当前的子问题,然后通过对当前状态的估计和策略评估打分机制选择合适的检索策略,并检索生成证据集合,迭代上面的过程以获得答案集,最后通过比较器得出最终答案。
2.根据权利要求1所述的面向复杂性问题的开放域问答系统,其特征在于,还包括生成式模型的子问题分解、多检索策略融合的子问题检索策略和推理性问题回答策略,所述生成式模型的子问题分解包括模型的建立和无监督训练策略,所述多检索策略融合的子问题检索策略包括检索器状态估计、证据集合维护和策略评分机制。
3.根据权利要求2所述的面向复杂性问题的开放域问答系统,其特征在于,所述模型的建立包括:采用生成式语言模型T5将问题抽象成文本到文本的问题,在子问题分解过程中,将T5模型的生成文本计算分成对源文本编码和对编码结果解码两个部分,假设原问题为,当前证据集合为,在第一阶段中,问题会和每一条证据语料进行拼接为如下格式:[“question”]+原问题+[“title”]+证据语料标题+[“context”]+证据语料内容,被T5模型进行,然后,对于所有证据语料分别得到的编码向量进行拼接,通过T5模型的解码器将拼接后的向量进行解码,得到生成的子问题,如果没有输入语料,选用一个特殊的文章标题标识“NONE”和文章内容标识“NONE_CONTENT”,用直接从原始的问题在没有语料的情况下生成初始子问题,以上流程具体公式为:
Qgen=Decoder(||iEncoder(QR+Ci))。
4.根据权利要求2所述的面向复杂性问题的开放域问答系统,其特征在于,所述无监督训练策略包括:为每个问题构造伪分解问题,从NQ,TQA数据集中构建了一个包含事实性问题的数据库,对文本进行预处理,将其中的专有名词替换为“entity”的标识,随后被处理后的问题通过BERT进行编码,取所有词编码的平均值作为句子的向量表示,使用ANN的方式从单跳问题数据库中检索与原问题类似的结果,然后将检索出问题的实体替换为原问题中的实体,以上操作通过CoreNLP库完成实体检测等基础语言处理,FAISS算法用于进行近邻向量搜索;
在构建伪分解问题之后,使用无监督的方式进行子问题生成器T5的训练,具体如下:使用多目标学习,利用反向翻译任务和去噪任务同时微调预训练的编码器解码器,对于去噪任务,首先通过随机屏蔽、丢弃和局部交换词序操作将从伪分解问题集中采样的问题进行处理产生被噪声污染的输入,通过模型将污染后输入去除噪声还原原始的分解;向从问题集中采样的问题添加噪声后的输入最大化;对于反向翻译任务,模型将伪分解转化为一个多跳问题,并且最大化可以从多跳问题得到这一分解的概率;最大化从HOTPOT QA数据集中随机采样的问题生成的分解子问题,从中重建原问题的概率,在训练时,只考虑有效的分解对BLEU分数的贡献,当BLEU指标连续3个迭代轮次没有增加时,模型停止训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赵慧雅,未经赵慧雅许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210617098.X/1.html,转载请声明来源钻瓜专利网。