[发明专利]一种信息匹配方法及装置在审
申请号: | 201811468680.4 | 申请日: | 2018-12-03 |
公开(公告)号: | CN109582966A | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 彭沛沛;曾国卿;许志强;孙昌勋 | 申请(专利权)人: | 北京容联易通信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 邓超 |
地址: | 100000 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标准句子 句子 短文本 相似度 备选 信息匹配 短句 人工智能技术 计算相似度 人工工作量 操作过程 方式确定 目标标准 匹配目标 网络模型 用户终端 问题库 客服 申请 文本 发送 筛选 智能 应用 | ||
本申请提供了一种信息匹配方法及装置,涉及人工智能技术领域,所述方法包括:接收用户终端发送的短文本句子;获取与所述短文本句子的相似度大于第一阈值的备选标准句子;基于所述短文本句子中第一词和所述标准句子中第二词的相似度,确定所述短文本句子与所述备选标准句子的相似度;基于所述短文本句子与所述备选标准句子的相似度,从所述标准句子中选取与所述短文本句子的相似度最高的目标标准句子。这样,在对问题库中的标准句子进行第一次筛选后,通过计算相似度的方式确定短句子文本的匹配目标,无需进行网络模型训练,简化了操作过程,减少了人工工作量。本申请主要应用于智能客服领域。
技术领域
本申请涉及人工智能技术领域,具体而言,涉及一种信息匹配方法及装置。
背景技术
在互联网技术的普遍应用下,涌现了越来越多的应用服务;其中,应用服务中通常都嵌入智能客服,以便智能客服帮助用户解答问题。
在用户与智能客服进行交流的过程中,客户通常都是在对话框中输入短文本句子,智能客服基于用户输入的短文本句子从数据库中查找与该短文本句子相匹配的问题,然后将查找到的问题的答案返回给用户。目前,智能客服从数据库中查找与该短文本句子相匹配的问题的方法如下:基于短文本句子以及对应问题的样本,通过深度学习等方法训练网络模型。在网络模型训练好以后,当用户输入在网络模型中输入短文本句子以后,直接确定该短文本句子对应的问题,然后,将该问题对应的答案返回给用户。
但是,上述方法需要预先训练网络模型,在训练网络模型的过程中,前期需要大量的样本收集及标注,操作过程复杂且人工工作量大。
发明内容
有鉴于此,本申请实施例的目的在于提供一种信息匹配方法及装置,通过计算相似度的方式确定短句子文本的匹配目标,无需进行网络模型训练,简化了操作过程,减少了人工工作量。
第一方面,本申请实施例提供了一种信息匹配方法,所述方法包括:
接收用户终端发送的短文本句子;
获取与所述短文本句子的相似度大于第一阈值的备选标准句子;
基于所述短文本句子中第一词和所述标准句子中第二词的相似度,确定所述短文本句子与所述备选标准句子的相似度;
基于所述短文本句子与所述备选标准句子的相似度,从所述标准句子中选取与所述短文本句子的相似度最高的目标标准句子。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述获取与所述短文本句子的相似度大于第一阈值的备选标准句子,包括:
分别提取所述短文本句子的第一关键词和所述标准句子的第二关键词;
针对任一第一关键词,根据该第一关键词分别与所述第二关键词的相似度,确定所述短文本句与所述标准句子的第一相似度;
针对任一第二关键词,根据该第二关键词分别与所述第一关键词的相似度,确定所述标准句子与所述短文本句的第二相似度;
根据所述第一相似度和所述第二相似度,确定所述短文本句字和所述标准句子的第一综合相似度;
从所述标准句子中选取与所述短文本句子的第一综合相似度大于第一阈值的备选标准句子。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述关键词有多个;所述针对任一第一关键词,根据该第一关键词分别与所述第二关键词的相似度,确定所述短文本句与所述标准句子的第一相似度,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京容联易通信息技术有限公司,未经北京容联易通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811468680.4/2.html,转载请声明来源钻瓜专利网。