[发明专利]医疗标题匹配方法、装置、设备及存储介质在审
申请号: | 202110049743.8 | 申请日: | 2021-01-14 |
公开(公告)号: | CN113569124A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 康战辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F40/30;G16H50/70 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 夏欢 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 标题 匹配 方法 装置 设备 存储 介质 | ||
本申请提供了一种医疗标题匹配方法、装置、设备及存储介质,本申请的方案涉及到人工智能技术的应用,该方案在获得医疗搜索语句之后,针对每个医疗标题,不仅会结合医疗标题的标题向量以及医疗搜索语句的语句向量,确定医疗标题与该医疗搜索语句在语义上的特征相似度,还会确定医疗标题与医疗搜索语句之间的医疗意图是否相同。在此基础上,结合医疗标题与医疗搜索语句在语义上的特征相似度以及医疗意图上的意图匹配结果,可以更为全面分析医疗标题与医疗搜索语句之间的匹配程度,从而有利于更为准确的从多个医疗标题中确定出与该医疗搜索语句更匹配的医疗标题,进而可以基于医疗搜索语句,更为准确的搜索出医疗标题指向的医疗文本内容。
技术领域
本申请涉及搜索技术领域,尤其涉及一种医疗标题匹配方法、装置、设备及存储介质。
背景技术
随着互联网医疗的发展,用户可以通过浏览器或者医疗词典应用等查询医疗知识,如用户可以通过医疗百科词典查询到更为专业和权威的医疗知识。
在医疗内容搜索场景中,每份医疗内容都会有一个医疗标题。在此基础上,在获得用户输入的医疗相关的医疗搜索语句后,搜索引擎便会将医疗搜索语句与各医疗内容的医疗标题进行匹配,并搜索出医疗标题与该医疗搜索语句匹配的至少一篇医疗文档。
然而,在医疗搜索领域,并不能较为准确的确定出医疗搜索语句与医疗标题的匹配度,使得用户无法通过医疗百科词典准确查询到所需的医疗内容。
发明内容
有鉴于此,本申请提供了一种医疗标题匹配方法、装置、设备及存储介质,以实现利用医疗搜索语句更为准确地匹配出医疗标题代表的医疗内容。
为实现上述目的,本申请提供了如下技术方案:
一方面,本申请提供了一种医疗标题匹配方法,包括:
获得医疗搜索语句;
针对待匹配的多个医疗标题中每个医疗标题,确定所述医疗标题的标题向量;
确定所述医疗搜索语句的语句向量;
针对每个医疗标题,基于所述医疗标题的标题向量和所述医疗搜索语句的语句向量,确定所述医疗标题与所述医疗搜索语句的特征相似度;
针对每个医疗标题,基于所述医疗标题的标题向量和所述医疗搜索语句的语句向量,并利用意图识别模型确定所述医疗标题与所述医疗搜索语句的意图匹配结果,所述意图匹配结果用于表征所述医疗标题与所述医疗搜索语句之间的医疗意图是否相同,所述意图识别模型为依据多个第一样本对各自标注的意图匹配结果,并利用各第一样本对内的医疗标题样本和医疗搜索语句样本各自的向量训练得到;
结合各医疗标题与所述医疗搜索语句的特征相似度和意图匹配结果,确定所述多个医疗标题的匹配度排序。
在一种可能的情况中,在所述确定所述医疗标题与所述医疗搜索语句的特征相似度之前,还包括:
确定所述医疗搜索语句的语句向量与所述医疗标题的标题向量之间的向量差,得到差值向量;
所述基于所述医疗标题的标题向量和所述医疗搜索语句的语句向量,确定所述医疗标题与所述医疗搜索语句的特征相似度,包括:
基于所述医疗标题的标题向量、医疗搜索语句的语句向量以及所述差值向量,确定所述医疗标题与所述医疗搜索语句的特征相似度。
在又一种可能的情况中,所述基于所述医疗标题的标题向量、医疗搜索语句的语句向量以及所述差值向量,确定所述医疗标题与所述医疗搜索语句的特征相似度,包括:
基于所述医疗标题的标题向量、医疗搜索语句的语句向量以及所述差值向量,并利用相似度识别模型确定所述医疗标题与所述医疗搜索语句的特征相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110049743.8/2.html,转载请声明来源钻瓜专利网。