[发明专利]面向政务咨询服务的智能问答句子对语义匹配方法和装置有效
申请号: | 202010855426.0 | 申请日: | 2020-08-24 |
公开(公告)号: | CN112001166B | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 鹿文鹏;于瑞 | 申请(专利权)人: | 齐鲁工业大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06F18/214;G06F16/332;G06F16/33 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250353 山东省济南*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 政务 咨询服务 智能 问答 句子 语义 匹配 方法 装置 | ||
1.面向政务咨询服务的智能问答句子对语义匹配方法,其特征在于,该方法是通过构建并训练由多粒度嵌入模块、门控深层特征残差式融合网络模块、语义特征交互匹配模块和标签预测模块组成的句子对语义匹配模型,实现对句子信息的门控深层特征残差式融合表示,同时通过注意力机制和门控机制生成句子对的最终匹配张量并判定句子对的匹配程度,以达到对句子对进行智能语义匹配的目标;具体如下:
多粒度嵌入模块对输入的句子以字粒度和词粒度分别进行嵌入操作,得到句子的多粒度嵌入表示;
门控深层特征残差式融合网络模块对句子的多粒度嵌入表示进行编码操作,得到句子的门控深层特征残差式融合表示;
语义特征交互匹配模块对句子对的门控深层特征残差式融合表示进行特征匹配和特征筛选操作,得到句子对的匹配向量;
标签预测模块将句子对的匹配张量映射为指定区间上的一个浮点型数值,将其作为匹配度与预设的阈值进行比较,根据比较结果,判定句子对的语义是否匹配。
2.根据权利要求1所述的面向政务咨询服务的智能问答句子对语义匹配方法,其特征在于,所述多粒度嵌入模块用于构建字映射转换表、构建词映射转换表、构建输入模块、构建字向量映射层、构建词向量映射层;
其中,构建字映射转换表或词映射转换表:映射规则为:以数字1为起始,随后按照每个字或词被录入字表或词表的顺序依次递增排序,从而形成本发明所需的字映射转换表或词映射转换表;其中,字表或词表根据句子对语义匹配知识库而构建,该知识库包含断字处理知识库或分词处理知识库,分别通过对语义匹配知识库的原始数据文本进行断字预处理或分词预处理操作而得;其后,再使用Word2Vec训练字向量模型或词向量模型,得到各字的字向量矩阵或各词的词向量矩阵;
构建输入模块:输入层包括四个输入,对于训练数据集中的每一个句子对或待预测的句子对,对其进行断字和分词预处理,分别获取sentence1_char、sentence2_char、sentence1_word和sentence2_word,其中后缀char、word分别表示对相应句子断字或分词处理而得,将其形式化为:(sentence1_char,sentence2_char,sentence1_word,sentence2_word);对于输入句子中的每个字或词都按照字映射转换表和词映射转换表转化为相应的数字标识;
构建字向量映射层或词向量映射层:加载构建字映射转换表或词映射转换表步骤中训练所得的字向量矩阵或词向量矩阵来初始化当前层的权重参数;对于字向量映射,针对输入句子sentence1_char和sentence2_char,得到其相应句子向量sentence1_char_embed、sentence2_char_embed;对于词向量映射,针对输入句子sentence1_word和sentence2_word,得到其相应句子向量sentence1_word_embed、sentence2_word_embed。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010855426.0/1.html,转载请声明来源钻瓜专利网。