[发明专利]一种语义匹配方法及装置在审
申请号: | 202010623998.6 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111898643A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 王彦博;宋俊 | 申请(专利权)人: | 上海依图信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/151 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 赵祎 |
地址: | 201125 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 匹配 方法 装置 | ||
本申请公开一种语义匹配方法及装置,属于语义匹配技术领域,该方法包括:获取目标问句,获取与目标问句至少包含部分相同词语的多个标准问句,确定目标问句中的关键词,采用不同的字符转换规则对目标问句中包含在关键词中的字符和未包含在关键词中的字符进行转换,得到每个字符转换后的字符,对获取的目标问句中每个字符的第一词嵌入向量和该字符转换处理后的字符的第二词嵌入向量进行融合处理,得到该字符的特征向量,将目标问句中各字符的特征向量和每个标准问句中各字符的特征向量输入到深度文本匹配模型中,得到目标问句和标准问句之间的语义相似度,根据目标问句和各标准问句之间的语义相似度,从各标准问句的答案中确定目标问句的答案。
技术领域
本申请涉及语义匹配技术领域,尤其涉及一种语义匹配方法及装置。
背景技术
目前,一些企业为了帮助用户解决问题、同时为了节省人力成本,会提供人工总结的常见问题解答(Frequently Asked Questions,FAQ)知识库。但当用户遇到问题时,需要自己先去了解FAQ知识库的使用方法,然后再去FAQ知识库查找相关答案,或者,需要将自己的问题告诉人工客服,由人工客服去FAQ知识库查找相关答案后再答复用户,FAQ知识库使用起来不是很方便。
而且,随着人力成本的逐年增高,这种FAQ知识库的使用成本也比较高。
发明内容
本申请实施例提供一种语义匹配方法及装置,用以解决现有技术中为用户解答问题的方式不方便,而且成本比较高的问题。
第一方面,本申请实施例提供的一种语义匹配方法,包括:
获取目标问句;
获取与所述目标问句至少包含部分相同词语的多个标准问句,其中,每个词语包含至少一个字符;
确定所述目标问句中的关键词,采用不同的字符转换规则对所述目标问句中包含在关键词中的字符和未包含在关键词中的字符进行转换处理,得到所述目标问句中每个字符转换处理后的字符;
对所述目标问句中的每个字符,获取预先设置的该字符的第一词嵌入向量,并获取预先设置的该字符转换处理后的字符的第二词嵌入向量,对所述第一词嵌入向量和所述第二词嵌入向量进行融合处理,得到该字符的特征向量;
将所述目标问句中各字符的特征向量和每个标准问句中各字符的特征向量输入到预先建立的深度文本匹配模型中,得到所述目标问句和所述标准问句之间的语义相似度;
根据所述目标问句和各标准问句之间的语义相似度,从各标准问句的答案中确定所述目标问句的答案。
在一种可能的实施方式中,在对所述第一词嵌入向量和所述第二词嵌入向量进行融合处理之前,还包括:
根据该字符在所述目标问句中的位置,生成该字符的位置向量;以及
对所述第一词嵌入向量和所述第二词嵌入向量进行融合处理,包括:
对所述第一词嵌入向量、所述第二词嵌入向量和所述位置向量进行融合处理,得到该字符的特征向量。
在一种可能的实施方式中,对所述第一词嵌入向量、所述第二词嵌入向量和所述位置向量进行融合处理,包括:
对所述第一词嵌入向量、所述第二词嵌入向量和所述位置向量中位于相同位置上的元素进行加和处理,得到该字符的特征向量。
在一种可能的实施方式中,根据所述目标问句和各标准问句之间的语义相似度,从各标准问句的答案中确定所述目标问句的答案,包括:
根据每个标准问句与所述目标问句之间的语义相似度,对各标准问句进行排序;
选择排名高于设定名词的标准问句作为目标标准问句;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图信息技术有限公司,未经上海依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010623998.6/2.html,转载请声明来源钻瓜专利网。