[发明专利]一种基于ES的人机交互用语义识别意图匹配方法及系统在审

专利信息
申请号: 202011612550.0 申请日: 2020-12-30
公开(公告)号: CN112749255A 公开(公告)日: 2021-05-04
发明(设计)人: 冯强中;范文斌;刘成彪;张天明;吴彤彤 申请(专利权)人: 科大国创云网科技有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/332;G06F40/216;G06F40/247;G06F40/289;G06F40/30
代理公司: 合肥昊晟德专利代理事务所(普通合伙) 34153 代理人: 王林
地址: 230088 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 es 人机交互 用语 识别 意图 匹配 方法 系统
【说明书】:

发明公开了一种基于ES的人机交互用语义识别意图匹配方法及系统,属于人机交互技术领域,包括如下步骤:S1、ES条件过滤:获取用户的输入,根据不同实例业务的具体要求,对ES中存储的大量语料进行条件过滤的预处理,条件过滤不计算匹配度分数;S2、中文语义处理:通过IK分词器对用户的输入进行去停用词、词性识别及分词、同义词查找等操作,形成分词集合;S3、ES匹配搜索:用户输入的信息的分词集合中的短语将会与经过条件过滤的意图集合进行匹配。本发明通过利用ES搜索引擎对语料库的快速检索和IK分词器进行语义处理可以快速识别用户语义,快速找到与之匹配的语料,提高机器人在数据量庞大的语料库情况下的响应速度和语料查询准确度。

技术领域

本发明涉及人机交互技术领域,具体涉及一种基于ES的人机交互用语义识别意图匹配方法及系统。

背景技术

当今,随着自动化和社交娱乐的高速发展,智能对话机器人的需求不断增加。但随着实际业务中的不断扩大和机器人的不断学习,机器人积累的语料数据日渐庞大。传统的机器人识别语义采用遍历语料库的语料和字符串匹配的方式,这种方式在面对庞大数据量的语料库时效率较低,尤其是面对多人同时对话,会产生明显的机器人回复延迟问题。并且字符串匹配的方式较为严格,如果面对同义词和相似问法就需要配置大量的相似意图。

ElasticSearch(简称ES)是一个开源的分布式、RESTful风格的搜索和数据分析引擎,它能实现分布式的实时文档存储,每个字段可以被索引与搜索,能胜任上百个服务节点的扩展,并支持PB级别的结构化或者非结构化数据,它常常用于搜索引擎与全文检索领域。ElasticSearch同时支持众多插件扩展,其中IK分词器插件支持中文分词,常用于中文环境的全文搜索领域。为解决当下的人机交互中存在意图匹配方面的问题,提出一种基于ES的人机交互用语义识别意图匹配方法。

发明内容

本发明所要解决的技术问题在于:如何实现语料的过滤和快速检索,进而提高用户输入的匹配宽容度,使得因单纯使用字符串匹配导致机器人无法回复的可能性降低,提供了一种基于ES的人机交互用语义识别意图匹配方法。

本发明是通过以下技术方案解决上述技术问题的,本发明包括以下步骤:

S1:ES条件过滤

获取用户输入的信息,根据业务需要设置筛选条件,利用ES的条件搜索API对ES中的语料进行过滤;

S2:中文语义识别

通过IK分词器对用户的输入进行去停用词、词性识别、分词、同义词查找操作,形成根据用户输入的信息经过语义处理的分词集合;

S3:ES匹配查询

ES引擎将根据步骤S2获取的分词集合在步骤S1中获取的意图集合中进行搜索,并计算匹配度得分然后将一个或多个搜索结果按照得分降序排列返回给用户。

更进一步地,在所述步骤S1中,ES条件过滤的具体过程如下:

S11:获取对话中用户输入的信息;

S12:获取到用户的信息;

S13:获取系统管理员设置的过滤条件然后动态生成相应的ES请求API;

S14:将步骤S12中获取的用户输入的信息通过步骤S13中生成的API发送到ES引擎对ES中存储的大量意图进行过滤,得到过滤后的意图集合。

更进一步地,在所述步骤S12中,获取到用户的信息的具体过程如下:

S121:获取用户输入中所携带的所属用户ID;

S122:通过用户ID从缓存中查询用户信息;

S123:将用户的信息中用于过滤的条件存入到条件集合中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大国创云网科技有限公司,未经科大国创云网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011612550.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top