[发明专利]一种语义匹配方法及装置在审
申请号: | 202010623998.6 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111898643A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 王彦博;宋俊 | 申请(专利权)人: | 上海依图信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/151 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 赵祎 |
地址: | 201125 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 匹配 方法 装置 | ||
1.一种语义匹配方法,其特征在于,包括:
获取目标问句;
获取与所述目标问句至少包含部分相同词语的多个标准问句,其中,每个词语包含至少一个字符;
确定所述目标问句中的关键词,采用不同的字符转换规则对所述目标问句中包含在关键词中的字符和未包含在关键词中的字符进行转换处理,得到所述目标问句中每个字符转换处理后的字符;
对所述目标问句中的每个字符,获取预先设置的该字符的第一词嵌入向量,并获取预先设置的该字符转换处理后的字符的第二词嵌入向量,对所述第一词嵌入向量和所述第二词嵌入向量进行融合处理,得到该字符的特征向量;
将所述目标问句中各字符的特征向量和每个标准问句中各字符的特征向量输入到预先建立的深度文本匹配模型中,得到所述目标问句和所述标准问句之间的语义相似度;
根据所述目标问句和各标准问句之间的语义相似度,从各标准问句的答案中确定所述目标问句的答案。
2.如权利要求1所述的方法,其特征在于,在对所述第一词嵌入向量和所述第二词嵌入向量进行融合处理之前,还包括:
根据该字符在所述目标问句中的位置,生成该字符的位置向量;以及
对所述第一词嵌入向量和所述第二词嵌入向量进行融合处理,包括:
对所述第一词嵌入向量、所述第二词嵌入向量和所述位置向量进行融合处理,得到该字符的特征向量。
3.如权利要求2所述的方法,其特征在于,对所述第一词嵌入向量、所述第二词嵌入向量和所述位置向量进行融合处理,包括:
对所述第一词嵌入向量、所述第二词嵌入向量和所述位置向量中位于相同位置上的元素进行加和处理,得到该字符的特征向量。
4.如权利要求1-3任一所述的方法,其特征在于,根据所述目标问句和各标准问句之间的语义相似度,从各标准问句的答案中确定所述目标问句的答案,包括:
根据每个标准问句与所述目标问句之间的语义相似度,对各标准问句进行排序;
选择排名高于设定名词的标准问句作为目标标准问句;
从所述目标标准问句的答案中选择所述目标问句的答案。
5.一种语义匹配装置,其特征在于,包括:
第一获取模块,用于获取目标问句;
第二获取模块,用于获取与所述目标问句至少包含部分相同词语的多个标准问句,其中,每个词语包含至少一个字符;
转换模块,用于确定所述目标问句中的关键词,采用不同的字符转换规则对所述目标问句中包含在关键词中的字符和未包含在关键词中的字符进行转换处理,得到所述目标问句中每个字符转换处理后的字符;
融合模块,用于对所述目标问句中的每个字符,获取预先设置的该字符的第一词嵌入向量,并获取预先设置的该字符转换处理后的字符的第二词嵌入向量,对所述第一词嵌入向量和所述第二词嵌入向量进行融合处理,得到该字符的特征向量;
匹配模块,用于将所述目标问句中各字符的特征向量和每个标准问句中各字符的特征向量输入到预先建立的深度文本匹配模型中,得到所述目标问句和所述标准问句之间的语义相似度;
答案确定模块,用于根据所述目标问句和各标准问句之间的语义相似度,从各标准问句的答案中确定所述目标问句的答案。
6.如权利要求5所述的装置,其特征在于,还包括:
生成模块,用于在对所述第一词嵌入向量和所述第二词嵌入向量进行融合处理之前,根据该字符在所述目标问句中的位置,生成该字符的位置向量;
所述融合模块,还用于对所述第一词嵌入向量、所述第二词嵌入向量和所述位置向量进行融合处理,得到该字符的特征向量。
7.如权利要求6所述的装置,其特征在于,所述融合模块具体用于:
对所述第一词嵌入向量、所述第二词嵌入向量和所述位置向量中位于相同位置上的元素进行加和处理,得到该字符的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图信息技术有限公司,未经上海依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010623998.6/1.html,转载请声明来源钻瓜专利网。