[发明专利]一种聊天机器人及其自动聊天方法在审

专利信息
申请号: 201710251306.8 申请日: 2017-04-18
公开(公告)号: CN107025297A 公开(公告)日: 2017-08-08
发明(设计)人: 彭恩伟 申请(专利权)人: 上海斐讯数据通信技术有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海硕力知识产权代理事务所31251 代理人: 郭桂峰
地址: 201616 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 聊天 机器人 及其 自动 方法
【说明书】:

技术领域

发明涉及人工智能技术领域,尤其涉及一种聊天机器人及其自动聊天方 法。

背景技术

现今,各行业需要承担的用户咨询/反馈解答的工作越来越多,如,在互联 网行业中的售后或者客服服务。随着用户数量的爆炸式增长,无法再采用人工 的方式对所有用户的咨询进行一一回答,此外,用户的问题大多集中在某些特 定的知识点上,人工回复很多时候都是在进行重复性地劳动,严重浪费人力, 以此,基于客服服务的聊天机器人应运而生,用以辅助人工进行问题的回复。

自动问答(Question Answering,QA)是指根据用户使用自然语言提出的 问题找到一个明确的答案。传统的自动问答系统,如图1所示,主要包括:接 口单元、预处理单元和知识库,在工作过程中,接口单元将用户用自然语言提 问的问题发送给预处理单元,预处理单元对问题进行解析得到问题的结构化表 达及关键字,以此推理单元根据问题的结构化表达式、本体知识技术及语言知 识技术从知识库中匹配获得问题模板,之后利用自然语言处理技术、获得的应 答内容及获得的问题模板,完成知识推理并最终生成答案。

现有的聊天机器人一般都是基于上述自动问答系统的,在知识库的构建阶 段,需要从输入的新问答对中挖掘问题模板,构建出模板库,以供推理单元查 询获得问题模板,采用语言知识技术对输入的新知识进行处理以获得与关键字 对应的应答,或对输入的新问答进行知识解析以获得与关键字对应的应答。知 识库中保存的知识即为与关键字对应的应答。

但是,在聊天机器人中,知识库的构建需要人为编写完成,这使得管理人 员的工作量巨大,而且人为编写的知识库很难做到覆盖所有用户可能会问的问 题。当然,目前也有问答系统能够支持知识库的批量形成,其虽然可以减少管 理人员的工作量,但是批量形成的知识库可靠性不高,且不具备逻辑性,只能 涉及一问一答的方式回复用户的问题。

发明内容

针对上述问题,本发明提供了一种聊天机器人及其自动聊天方法,有效解 决了现有聊天机器人可靠性不高的技术问题。

本发明提供的技术方案如下:

一种聊天机器人,包括:

知识库,存储的数据包括逻辑行为自然常识、词汇库、对话信息蕴含的关 键字段及与之匹配的反馈字段,所述关键字段由多个关键字组成;

问答库,存储的数据包括词汇库、对话信息中蕴含的问答对及其对应的关 键字;

交互平台,用于与用户进行信息交互;

预处理模块,用于对通过交互平台获取的用户聊天信息进行预处理,包括 分词得到其中蕴含的关键字/关键字段;

反馈查询模块,用于根据预处理模块得到的关键字在知识库中查询匹配的 反馈字段,并根据查询到的反馈字段和知识库中的逻辑行为自然常识将反馈信 息反馈至交互平台;

相似度运算模块,用于根据反馈查询模块的查询结果运算用户聊天信息与 问答库中存储的问题之间的相似度,并根据运算结果将相应问题对应的反馈信 息反馈至交互平台。

在本技术方案中,在该聊天机器人中既包括高可靠性和高逻辑性的知识 库,又包括大批量生产的问答库,这样,在与用户进行对话的过程中,首先利 用知识库进行问题匹配,若匹配到了则返回相应的反馈信息;若没有匹配到则 利用问答库得出相似度最高的反馈信息反馈至用户,以此保证了聊天机器人的 可靠性。

进一步优选地,在所述预处理模块中包括:

拆分单元,用于将通过交互平台获取的用户聊天信息拆分成若干分词;

语素识别单元,用于对拆分单元拆分得到的分词进行语素识别;

整理单元,用于根据语素识别单元的识别结果整理得到关键字/关键字段。

在本技术方案中,对用户聊天信息进行拆分之后,进行语素识别,以此根 据词汇库将停用词等去掉,以此提高反馈查询模块的查询效率和准确度。

进一步优选地,在所述整理单元中:根据预设规则和语素识别单元的识别 结果保留相应的分词,并根据问答库中的词汇库对保留的分词进行语义扩展得 到关键字/关键字段。

在本技术方案中,对关键词进行语义扩展之后计算其与存储问题之间的相 似度,以此提高计算结果的准确度。

进一步优选地,在所述相似度运算模块中包括:

计算单元,用于计算用户聊天信息与问答库中存储的问题之间的相似度;

判断单元,用于根据计算单元的计算结果,判断与用户聊天信息相似度最 高的存储问题;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海斐讯数据通信技术有限公司,未经上海斐讯数据通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710251306.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top