[发明专利]问题生成方法有效

专利信息
申请号: 202010570508.0 申请日: 2020-06-19
公开(公告)号: CN111723185B 公开(公告)日: 2022-07-08
发明(设计)人: 朱少华;缪庆亮;俞凯 申请(专利权)人: 思必驰科技股份有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F17/18;G06F40/211;G06F40/284;G06N3/04
代理公司: 北京商专永信知识产权代理事务所(普通合伙) 11400 代理人: 黄谦;车江华
地址: 215123 江苏省苏州市苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 问题 生成 方法
【说明书】:

发明公开一种问题生成方法,包括:对阅读理解数据集中的阅读理解数据进行预处理;将问题生成数据输入至编码器,并获取编码器隐层状态;将相应于所述问题生成数据的问题输入至解码器,并获取解码器隐层状态;基于所述编码器隐层状态和所述解码器隐层状态确定预设词典中的词的生成概率;根据当前时刻的上下文向量、解码器隐层状态和解码器输入确定当前时刻的词生成概率;根据所述词的生成概率和所述当前时刻的词生成概率确定词的概率分布。本发明解决了现有技术中依赖于一个固定的词典,不能生成不在词典中的词,导致生成的问题不流畅的问题。

技术领域

本发明涉及人工智能技术领域,尤其涉及一种问题生成方法。

背景技术

问题生成在人类智能的发展和人工智能系统的发展中都起着重要作用。在许多应用领域中,对问题生成的需求正在迅速增长。问题生成系统旨在根据给定的文本生成各种问题。在教育领域,提出好的问题对于评估学生知识和激励自我学习至关重要;在对话系统中,问题生成是机器人的很重要的一项技能,比如可以帮助机器人冷启动或者得到用户的信息从而进行更好的沟通;在阅读理解中,问题生成可以帮助人们自动生成问题,从而节省大量人力物力财力去标注数据。

现有的问题生成任务的研究方法主要分为两类:基于规则的与基于神经网络的方法。基于规则的问题生成方法,需要大量的人力创建规则,生成的问题也具有固定形式,并且无法避免规则中的错误。与基于规则的方法比较而言,基于神经网络的问题生成方法更多的是数据驱动、支持端到端训练的形式,不依赖手工编写的规则。但是目前基于神经网络方法不能很好的处理未登录词(OOV)和词重复生成的现象。

发明内容

本发明实施例提供一种问题生成方法,至少解决上述技术问题之一。

第一方面,本发明实施例提供一种问题生成方法,包括:

对阅读理解数据集中的阅读理解数据进行预处理,以得到多条问题生成数据;

将问题生成数据输入至编码器,并获取编码器隐层状态;

将相应于所述问题生成数据的问题输入至解码器,并获取解码器隐层状态;

基于所述编码器隐层状态和所述解码器隐层状态确定预设词典中的词的生成概率;

根据当前时刻的上下文向量、解码器隐层状态和解码器输入确定当前时刻的词生成概率;

根据所述词的生成概率和所述当前时刻的词生成概率确定词的概率分布,用于问题生成。

第二方面,本发明实施例提供一种存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本发明上述任一项问题生成方法。

第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明上述任一项问题生成方法。

第四方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项问题生成方法。

本发明实施例的有益效果在于:通过根据当前时刻的上下文向量、解码器隐层状态和解码器输入确定当前时刻的词生成概率,从而既能从固定的词典中生成词,又能从编码器端拷贝词,解决了现有技术中依赖于一个固定的词典,不能生成不在词典中的词,导致生成的问题不流畅的问题。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010570508.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top