[发明专利]基于聊天对话进行知识提取的方法、系统、设备及存储介质在审
申请号: | 202110563544.9 | 申请日: | 2021-05-24 |
公开(公告)号: | CN113569019A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 黄杰辉;徐世超;梁志婷 | 申请(专利权)人: | 恩亿科(北京)数据科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F16/36;G06F40/194 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 赵燕 |
地址: | 100192 北京市海淀区西小口路66*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 聊天 对话 进行 知识 提取 方法 系统 设备 存储 介质 | ||
1.一种基于聊天对话进行知识提取的方法,其特征在于,包括:
知识库构建步骤:构建企业结构化知识库,并将员工身份信息以及与员工工作内容相关的知识信息进行关联存储;
关键词触发步骤:对当前聊天对话中的文本信息进行关键词检索,分析所述文本信息中是否出现触发类关键词;
知识提取步骤:若是,则结合所述企业结构化知识库对出现所述触发类关键词的触发点前后的若干个对话段进行知识提取。
2.根据权利要求1所述的一种基于聊天对话进行知识提取的方法,其特征在于,所述知识库构建步骤还包括:在所述企业结构化知识库中根据员工职位设置若干个分层级的知识分类类别,其中,每个所述知识分类类别对应设置若干个关键词,在每个所述知识分类类别下分类存储具体的知识内容。
3.据权利要求2所述的一种基于聊天对话进行知识提取的方法,其特征在于,所述知识提取步骤包括:
识别分析步骤:预先设置需分析的对话段数量,基于所述对话段数量选取所述触发点前后的所述对话段进行文本识别分析和/或图像识别分析,进而确定选取的所述对话段的关键词信息;
类别确定步骤:将所述关键词信息结合当前对话的所述员工身份信息,确定所述对话段的所属知识分类的类别;
知识查找步骤:根据已确定的所述知识分类的类别,计算在所述企业结构化知识库中的对应类别下已存的所述知识内容与触发点文本内容的相似度,判断所述相似度是否达到预设的相似度阈值;
知识修订步骤:若是,则显示已存的所述知识内容,并根据所述对话段对所述知识内容进行更新修订;或;
知识添加步骤:若否,则对所述对话段按照预设格式进行相应的知识提取。
4.根据权利要求1所述的一种基于聊天对话进行知识提取的方法,其特征在于,所述关键词触发步骤还包括:预先在所述企业结构化知识库中设置触发类关键词词库。
5.一种基于聊天对话进行知识提取的系统,其特征在于,包括:
知识库构建单元:构建企业结构化知识库,并将员工身份信息以及与员工工作内容相关的知识信息进行关联存储;
关键词触发单元:对当前聊天对话中的文本信息进行关键词检索,分析所述文本信息中是否出现触发类关键词;
知识提取单元:结合所述企业结构化知识库对出现所述触发类关键词的触发点前后的若干个对话段通过所述知识提取单元进行知识提取。
6.根据权利要求5所述的一种基于聊天对话进行知识提取的系统,其特征在于,所述知识库构建单元还包括:
类别设置模块:在所述企业结构化知识库中根据员工职位设置若干个分层级的知识分类类别,其中,每个所述知识分类类别对应设置若干个关键词,在每个所述知识分类类别下分类存储具体的知识内容。
7.据权利要求6所述的一种基于聊天对话进行知识提取的系统,其特征在于,所述知识生成单元包括:
识别分析模块:预先设置需分析的对话段数量,基于所述对话段数量选取所述触发点前后的所述对话段通过所述识别分析模块进行文本识别分析和/或图像识别分析,进而确定选取的所述对话段的关键词信息;
类别确定模块:将所述关键词信息结合当前对话的所述员工身份信息,通过所述类别确定模块确定所述对话段的所属知识分类的类别;
知识查找模块:根据已确定的所述知识分类的类别,通过所述知识查找模块计算在所述企业结构化知识库中的对应类别下已存的所述知识内容与触发点文本内容的相似度,判断所述相似度是否达到预设的相似度阈值;
知识修订模块:若达到所述相似度阈值,则通过所述知识修订模块显示已存的的所述知识内容,并根据所述对话段对所述知识内容进行更新修订;
知识添加模块:若没达到所述相似度阈值,则通过所述知识添加模块对所述对话段按照预设格式进行相应的知识提取。
8.根据权利要求5所述的一种基于聊天对话进行知识提取的系统,其特征在于,所述关键词触发单元还包括:
词库设置模块:预先在所述企业结构化知识库中设置触发类关键词词库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恩亿科(北京)数据科技有限公司,未经恩亿科(北京)数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110563544.9/1.html,转载请声明来源钻瓜专利网。