[发明专利]面向开放域对话系统的上下文增强的问题生成方法及装置有效

申请号：	202110259592.9	申请日：	2021-03-10
公开（公告）号：	CN112948558B	公开（公告）日：	2022-09-20
发明（设计）人：	凌艳香;梁政;张清辉;王天琦;陶卿曌;蔺茜;祁帅辉;贺岳星	申请（专利权）人：	中国人民解放军国防科技大学
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/33;G06F40/30;G06N3/04;G06N3/08
代理公司：	西安亿诺专利代理有限公司 61220	代理人：	李永刚
地址：	410073 湖***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	面向开放对话系统上下文增强问题生成方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种面向开放域对话系统的上下文增强的问题生成方法，其特征在于：

通过分层编码器对对话上下文进行向量化语义表示，以此为输入产生与对话上下文相关的话题词，作为问题内容；

所述产生与对话上下文相关的话题词，包括回顾机制和转移机制；

所述回顾机制直接从对话上下文中选择提问的关键词，控制所生成问题的语义一致性；所述回顾机制的过程包括：对于对话上下文中的词，首先去除停用词，然后将每个对话视为一个文档，每个词视为一个词项，计算每个词的TF-IDF值；根据每个词的TF-IDF值选择上下文关键词；给定上下文关键词集合K＝{k₁,...,k_j,...,k_|K|}，k_j表示一个上下文关键词，j∈[1,|K|]，|K|为上下文关键词数量；

利用一个由H层多层感知机组成的深度模型来预测一个回顾向量，即μ，其中μ中每个元素的值表示回顾分数，计算过程如下：

μ＝Sigmoid(o_H),

其中表示一个单层感知机，其激活函数为Relu，h∈[1,H]，其中，H代表多层感知机的层数；μ＝{μ₁,...,μ_j,...,μ_|K|}，其中μ_j表示上下文关键词k_j对应的回顾分数；

根据回顾分数大小对μ进行排序，将值大小排名前L位的上下文关键词作为回顾话题词，标记为K_R；

将K_R输入到一个词嵌入层，获得回顾话题词的向量表示，标记为

所述转移机制从基于点间互信息的候选语料库中引入新话题词，并通过衡量新话题词与对话上下文的连贯性来进一步过滤噪声；

基于对话上下文的语义表示、及预测的问题内容，进一步预测问题模式，即确定将要生成的问题属于哪一种问句类型；

将预测得到的问题模式对应的疑问词作为循环解码器的初始输入；同时通过联合注意力机制引入对话上下文语义和前述话题词语义，在预测的问题模式的驱动下，通过一个循环解码器生成问题。

2.根据权利要求1所述面向开放域对话系统的上下文增强的问题生成方法，其特征在于，所述通过分层编码器对对话上下文进行向量化语义表示的过程包括：给定对话上下文X＝{U₁,...,U_|X|}，分层上下文编码器首先采用一个语句编码器来获得X中每个语句的向量表示，然后通过一个上下文编码器对语句向量进行顺序整合；给定语句其中U_i∈X，语句编码器通过双向门控循环神经网络BiGRU将每个词w_n,i转换为一个隐向量其中n∈[1,N_i]，N_i表示语句U_i包含的词数量：

其中是词w_n,i的初始词向量；然后，上下文编码器通过一个单向门控循环神经网络GRU获得上下文的向量表示，

其中，是语句U_i最后一个词的隐向量为篇章级别上U_i的向量表示。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学，未经中国人民解放军国防科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110259592.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种甲基营养型芽孢杆菌BAM-6及其应用
下一篇：一种应用于750kV变电站出线结构

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]面向开放域对话系统的上下文增强的问题生成方法及装置有效

专利文献下载