[发明专利]一种考虑句法结构的机器阅读理解方法及装置在审
申请号: | 202110706956.3 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113326692A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 方凡;周兴发;饶璐;谭斌;杨兰;李焕;孙锐;展华益 | 申请(专利权)人: | 四川启睿克科技有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/151;G06N3/04;G06N3/08 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 刘兴亮 |
地址: | 610000 四川省成都市中国(四川)*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 考虑 句法 结构 机器 阅读 理解 方法 装置 | ||
1.一种考虑句法结构的机器阅读理解方法,其特征在于,包括以下步骤:
A、获取语义编码序列:把机器阅读理解的文本和问题转化为词向量,同时引入额外特征,将额外特征转化为向量,并与文本和问题的词向量进行拼接,得到文本和问题的语义编码;
B、文本和问题的交互:利用注意力机制对文本和问题进行交互,为文本编码引入问题信息,得到文本的交互编码;
C、构建依存句法图:利用依存句法分析获取文本每个句子的依存句法树,进而构建整个文本的依存句法图;
D、构建文本的图表征:基于文本的依存句法图,结合文本的交互编码,构建文本的依存句法图的图表征;
E、生成答案:根据文本的依存句法图表征生成答案。
2.如权利要求1所述的一种考虑句法结构的机器阅读理解方法,其特征在于,步骤A中文本和问题的词向量,包括:随机初始化的词向量,或基于深度学习的语言模型训练得到的词向量;
步骤A中引入的额外特征,包括:词性标签、实体标签、问题类型特征。
3.如权利要求1所述的一种考虑句法结构的机器阅读理解方法,其特征在于,步骤A中额外特征的向量化方法,包括:通过随机初始化的嵌入层进行映射得到特征向量,嵌入层的参数会在训练过程中不断优化。
4.如权利要求1所述的一种考虑句法结构的机器阅读理解方法,其特征在于,步骤B中文本和问题的交互方法,包括:对步骤A中得到的文本和问题的语义编码进行基于注意力机制的交互对齐方法,注意力可以是单向或双向注意力,文本和问题的交互可以重复多次。
5.如权利要求1所述的一种考虑句法结构的机器阅读理解方法,其特征在于,步骤C中对句子进行依存句法分析的方法,包括:基于规则的方法,基于统计的方法,或基于深度学习的方法;
步骤C中构建整个文本的依存句法图的方法包括:多棵依存句法树合并为依存句法图。
6.如权利要求1所述的一种考虑句法结构的机器阅读理解方法,其特征在于,步骤D中基于依存句法图构建文本图表征的方法,包括:利用自回归模型迭代计算文本图表征的方法,文本图表征融合的方法。
7.如权利要求1所述的一种考虑句法结构的机器阅读理解方法,其特征在于,步骤E中所述生成答案的方法,包括:基于循环神经网络的答案生成模块,文本表征和循环神经网络输出之间的注意力交互机制;
步骤E中所述生成的答案,包括:多项选择式的答案,片段抽取式的答案,或生成式的答案。
8.一种考虑句法结构的机器阅读理解装置,其特征在于,包括:
语义编码模块,用于对阅读理解的文本和问题进行分词、词向量化、特征提取和特征向量拼接;
文本与问题交互模块,用于将问题编码与文本编码进行交互对齐,得到包含问题信息的文本向量;
句法分析模块,用于对文本进行依存句法分析,生成对应的依存句法图;
文本图表征构建模块,用于构建文本的基于依存句法关系的图表征;
答案生成模块,用于根据文本的图表征生成对应问题的答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川启睿克科技有限公司,未经四川启睿克科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110706956.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:斜抽芯注塑模具
- 下一篇:自动拉断料头的注塑模具