[发明专利]用户问句与知识点的匹配方法和装置有效
申请号: | 201811429067.1 | 申请日: | 2018-11-27 |
公开(公告)号: | CN109583750B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 马良庄;石志伟;张望舒;胡翔;刘俊宏;蔡捷 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06Q10/063 | 分类号: | G06Q10/063;G06F16/332;G06F40/295 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 孙欣欣;周良玉 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 问句 知识点 匹配 方法 装置 | ||
本说明书实施例提供一种用户问句与知识点的匹配方法和装置,方法包括:根据用户问句和预先训练的自然语言处理模型,得到第一匹配节点集合,第一匹配节点集合包括用户问句与业务导图匹配的节点;判断第一匹配节点集合是否能够匹配到业务导图的任一链路;当判断结果为否时,根据用户问句的至少一部分在互联网中搜索,获取至少一条扩展信息;根据至少一条扩展信息和自然语言处理模型,得到第二匹配节点集合,第二匹配节点集合包括扩展信息与业务导图匹配的节点;根据第一匹配节点集合和第二匹配节点集合的并集匹配业务导图的知识点,从而能够提升用户问句与知识点的匹配效果。
技术领域
本说明书一个或多个实施例涉及计算机领域,尤其涉及用户问句与知识点的匹配方法和装置。
背景技术
在智能客服的问答系统中,客户在与机器人交互过程中用户问句语言口语化、简略化,提升客服机器人对用户问句与知识点匹配的能力和效果对整个问答系统十分关键,直接影响问答系统的服务体验。
传统的问答系统中,通常是采用计算输入文本和目标文本之间的文本相似度的方式来完成用户问句与知识点的匹配。常用的计算文本相似度的算法包括:基于关键词匹配的算法(例如,N-gram相似度算法、Jaccard相似度算法),基于向量空间的算法(例如,Word2vec算法、TF-IDF算法),基于深度学习的算法(例如,深度学习算法、DSSM算法)等。
用户问句通常为多样化、口语化的表述,例如,以下的几种情形:
用户输入的词,是非常用词。如:“心脏支架的费用报销不?”中“心脏支架”就是非常用词,可能知识库中不包含该词。
口语化描述,如:“蚂蚁借呗啷个还哦”。
长句描述,如“我女儿3岁,没有身份证号,可以投保吗?”。
输入有错别字,如“蚂蚁借贝怎么还款”。
由于用户问句多样化、口语化的表述,通过上述这些计算文本相似度的算法可能会导致文本相似度计算不准确,相应的,用户问句与知识点的匹配效果不佳,导致用户问句无法匹配到知识点,或者用户问句匹配到错误的知识点。
因此,希望能有改进的方案,能够提升用户问句与知识点的匹配效果。
发明内容
本说明书一个或多个实施例描述了一种用户问句与知识点的匹配方法和装置,能够提升用户问句与知识点的匹配效果。
第一方面,提供了一种用户问句与知识点的匹配方法,方法基于业务导图进行,所述业务导图包括按照业务维度整理为树状层级结构的多个节点,每个节点对应一个关键词以及该关键词的关联表达,所述业务导图的根节点代表具有特定业务类型的业务,所述业务导图的叶节点挂载与该叶节点的关键词相关联的知识点,方法包括:
根据用户问句和预先训练的第一自然语言处理模型,得到第一匹配节点集合,所述第一匹配节点集合包括所述用户问句与所述业务导图匹配的节点;
判断所述第一匹配节点集合是否能够匹配到所述业务导图的任一链路;
当判断出所述第一匹配节点集合不能够匹配到所述业务导图的任一链路时,根据所述用户问句的至少一部分在互联网中搜索,获取至少一条扩展信息;
根据所述至少一条扩展信息和所述第一自然语言处理模型,得到第二匹配节点集合,所述第二匹配节点集合包括所述扩展信息与所述业务导图匹配的节点;
判断所述第一匹配节点集合和所述第二匹配节点集合的并集是否能够匹配到所述业务导图的任一链路;
当判断出所述第一匹配节点集合和所述第二匹配节点集合的并集能够匹配到所述业务导图的任一链路时,将该链路的叶节点作为与所述用户问句匹配的叶节点,以输出挂载在该叶节点的知识点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811429067.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理