[发明专利]序列动态阅读的自然语言语义匹配方法有效

申请号：	201910228242.9	申请日：	2019-03-25
公开（公告）号：	CN109948163B	公开（公告）日：	2022-10-28
发明（设计）人：	陈恩红;刘淇;张琨;吕广奕;吴乐	申请（专利权）人：	中国科学技术大学
主分类号：	G06F40/211	分类号：	G06F40/211;G06F40/30;G06F16/33;G06F16/31
代理公司：	北京凯特来知识产权代理有限公司 11260	代理人：	郑立明;郑哲
地址：	230026 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	序列动态阅读自然语言语义匹配方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种序列动态阅读的自然语言语义匹配方法，其特征在于，包括：

对自然语言句子对中的每个字进行语义建模，获得每一自然语言句子对应的词级别语义表示向量；

根据每一词级别语义表示向量，通过堆叠神经网络得到相应的句子语义表示向量以及考虑了单词之间相互依赖的隐层表示向量；

利用句子语义表示向量以及考虑了单词之间相互依赖的隐层表示向量进行句子语义的动态理解，得到相应句子的动态理解表示向量；

将自然语言句子对的句子语义表示向量与句子的动态理解表示向量，各自进行整合，并根据整合结果实现自然语言句子对的语义关系分类。

2.根据权利要求1所述的一种序列动态阅读的自然语言语义匹配方法，其特征在于，所述对自然语言句子对中的每个字进行语义建模，获得每一自然语言句子对应的词级别语义表示向量的步骤包括：

所述的自然语言句子对包括两个自然语言句子，一个自然语言句子记为表示其由l_a个单词组成的文本，另一个自然语言句子记为表示其由l_b个单词组成的文本；其中,对应的分别表示自然语言句子s^a中的第i个单词、自然语言句子s^b中的第j个单词；

自然语言句子对s^a与s^b中的所有单词构成一个词典V，其大小用l^v表示；自然语言句子对s^a和s^b中的每一个单词都用一个独热向量表示，向量长度为词典V的大小，每个单词的独热向量中只有其在词典V中对应的索引位置为1，其他均为0；在此基础上，使用预训练好的词向量矩阵E得到每个单词的特征表示，也即预训练的词语义表示：

其中，对应于自然语言句子s^a中第i个单词、自然语言句子s^b中第j个单词的预训练的语义表示；

假设自然语言句子对为英文文本，则将所有的英文字母组成一个字符集的词典V^c，其大小为26；单词中的每个字母都用一个独热向量表示，向量长度为词典V^c的大小，每个字母的独热向量中只有其在词典V^c中对应的索引位置为1，其他均为0；在此基础上，使用一维卷积分别处理单词的字母序列，然后使用最大池化操作，从而最后得到每个单词字符级别的语义表示：

其中，E^c表示需要训练的字符的向量表示矩阵，Conv1D表示一维卷积操作，Maxpooling表示最大池化操作，对应的表示自然语言句子s^a中第i个单词的第i_c个字母的独热表示、自然语言句子s^b中第j个单词的第j_c个字母的独热表示；

再将从预训练中得到的单词的特征表示与相应的单词字符级别的语义表示拼接起来，然后使用两层的高速网络整合这些信息，从而最终得到自然语言句子中每个单词的语义表示向量：

其中，Highway(·)表示高速网络结构，a_i、b_j对应的表示自然语言句子s^a第i个单词的语义表示向量、自然语言句子s^b中第j个单词的语义表示向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学技术大学，未经中国科学技术大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910228242.9/1.html，转载请声明来源钻瓜专利网。

上一篇：融合序列语法标注框架的生成式文本摘要方法
下一篇：统计需求信息的处理方法、装置、计算机设备和存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]序列动态阅读的自然语言语义匹配方法有效

专利文献下载