[发明专利]一种聊天机器人及其自动聊天方法在审
申请号: | 201710251306.8 | 申请日: | 2017-04-18 |
公开(公告)号: | CN107025297A | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | 彭恩伟 | 申请(专利权)人: | 上海斐讯数据通信技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海硕力知识产权代理事务所31251 | 代理人: | 郭桂峰 |
地址: | 201616 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 聊天 机器人 及其 自动 方法 | ||
技术领域
本发明涉及人工智能技术领域,尤其涉及一种聊天机器人及其自动聊天方 法。
背景技术
现今,各行业需要承担的用户咨询/反馈解答的工作越来越多,如,在互联 网行业中的售后或者客服服务。随着用户数量的爆炸式增长,无法再采用人工 的方式对所有用户的咨询进行一一回答,此外,用户的问题大多集中在某些特 定的知识点上,人工回复很多时候都是在进行重复性地劳动,严重浪费人力, 以此,基于客服服务的聊天机器人应运而生,用以辅助人工进行问题的回复。
自动问答(Question Answering,QA)是指根据用户使用自然语言提出的 问题找到一个明确的答案。传统的自动问答系统,如图1所示,主要包括:接 口单元、预处理单元和知识库,在工作过程中,接口单元将用户用自然语言提 问的问题发送给预处理单元,预处理单元对问题进行解析得到问题的结构化表 达及关键字,以此推理单元根据问题的结构化表达式、本体知识技术及语言知 识技术从知识库中匹配获得问题模板,之后利用自然语言处理技术、获得的应 答内容及获得的问题模板,完成知识推理并最终生成答案。
现有的聊天机器人一般都是基于上述自动问答系统的,在知识库的构建阶 段,需要从输入的新问答对中挖掘问题模板,构建出模板库,以供推理单元查 询获得问题模板,采用语言知识技术对输入的新知识进行处理以获得与关键字 对应的应答,或对输入的新问答进行知识解析以获得与关键字对应的应答。知 识库中保存的知识即为与关键字对应的应答。
但是,在聊天机器人中,知识库的构建需要人为编写完成,这使得管理人 员的工作量巨大,而且人为编写的知识库很难做到覆盖所有用户可能会问的问 题。当然,目前也有问答系统能够支持知识库的批量形成,其虽然可以减少管 理人员的工作量,但是批量形成的知识库可靠性不高,且不具备逻辑性,只能 涉及一问一答的方式回复用户的问题。
发明内容
针对上述问题,本发明提供了一种聊天机器人及其自动聊天方法,有效解 决了现有聊天机器人可靠性不高的技术问题。
本发明提供的技术方案如下:
一种聊天机器人,包括:
知识库,存储的数据包括逻辑行为自然常识、词汇库、对话信息蕴含的关 键字段及与之匹配的反馈字段,所述关键字段由多个关键字组成;
问答库,存储的数据包括词汇库、对话信息中蕴含的问答对及其对应的关 键字;
交互平台,用于与用户进行信息交互;
预处理模块,用于对通过交互平台获取的用户聊天信息进行预处理,包括 分词得到其中蕴含的关键字/关键字段;
反馈查询模块,用于根据预处理模块得到的关键字在知识库中查询匹配的 反馈字段,并根据查询到的反馈字段和知识库中的逻辑行为自然常识将反馈信 息反馈至交互平台;
相似度运算模块,用于根据反馈查询模块的查询结果运算用户聊天信息与 问答库中存储的问题之间的相似度,并根据运算结果将相应问题对应的反馈信 息反馈至交互平台。
在本技术方案中,在该聊天机器人中既包括高可靠性和高逻辑性的知识 库,又包括大批量生产的问答库,这样,在与用户进行对话的过程中,首先利 用知识库进行问题匹配,若匹配到了则返回相应的反馈信息;若没有匹配到则 利用问答库得出相似度最高的反馈信息反馈至用户,以此保证了聊天机器人的 可靠性。
进一步优选地,在所述预处理模块中包括:
拆分单元,用于将通过交互平台获取的用户聊天信息拆分成若干分词;
语素识别单元,用于对拆分单元拆分得到的分词进行语素识别;
整理单元,用于根据语素识别单元的识别结果整理得到关键字/关键字段。
在本技术方案中,对用户聊天信息进行拆分之后,进行语素识别,以此根 据词汇库将停用词等去掉,以此提高反馈查询模块的查询效率和准确度。
进一步优选地,在所述整理单元中:根据预设规则和语素识别单元的识别 结果保留相应的分词,并根据问答库中的词汇库对保留的分词进行语义扩展得 到关键字/关键字段。
在本技术方案中,对关键词进行语义扩展之后计算其与存储问题之间的相 似度,以此提高计算结果的准确度。
进一步优选地,在所述相似度运算模块中包括:
计算单元,用于计算用户聊天信息与问答库中存储的问题之间的相似度;
判断单元,用于根据计算单元的计算结果,判断与用户聊天信息相似度最 高的存储问题;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海斐讯数据通信技术有限公司,未经上海斐讯数据通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710251306.8/2.html,转载请声明来源钻瓜专利网。