[发明专利]用于对话系统的基于人工智能的知识图谱生成方法、电子设备在审
申请号: | 202010579565.5 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111723186A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 周纯 | 申请(专利权)人: | 宁波富万信息科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/30;G06F40/295;G06F40/242;G06N3/04 |
代理公司: | 北京卫智畅科专利代理事务所(普通合伙) 11557 | 代理人: | 陈佳 |
地址: | 315153 浙江省宁波市海曙区石碶*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 对话 系统 基于 人工智能 知识 图谱 生成 方法 电子设备 | ||
本公开的实施例公开了用于对话系统的基于人工智能的知识图谱生成方法、电子设备。该方法的一具体实施方式包括:获取输入文本;基于输入文本,确定实体特征集合;基于输入文本,生成语义关系集合;基于实体集合和语义关系集合,确定知识图谱;存储并输出所述知识图谱。该方法基于输入文本生成的实体特征集合和语义关系集合构建知识图谱,能够更好的表征对话系统中的问答信息。对知识图谱加密后进行存储,提高了所存储的知识图谱的安全性和不可篡改性。
技术领域
本公开实施例涉及自然语言处理领域,具体涉及一种知识图谱生成和存储的方法、电子设备。
背景技术
随着人工智能技术的发展,人机对话系统,或者会话交互,有望成为物联网时代的主要交互方式。而语言的理解与表达和知识是密切联系的,知识图谱作为一种大规模知识的表示形式,在人机对话系统中各模块都有重要的应用。知识图谱以图谱的形式描述真实世界的实体及其内在关系,用模式定义可能的类和实体关系,允许任意实体彼此潜在相互关联,并涵盖各种主题领域。引入知识图谱技术,能够对对话系统中的信息进行结构化、语义化和智能化的处理与应用,从而提升对话系统的效果。
发明内容
本公开实施例提出了一种用于对话系统的基于人工智能的知识图谱生成方法。
第一方面,本公开实施例提供了一种用于对话系统的基于人工智能的知识图谱生成方法,该方法包括:获取输入文本;基于输入文本,确定实体特征集合;基于输入文本,生成语义关系集合;基于实体特征集合和语义关系集合,确定知识图谱;存储并输出知识图谱。
在一些实施例中,用于对话系统的基于人工智能的知识图谱生成方法还包括:响应于确定知识图谱是用于对话系统的知识图谱,将知识图谱发送至支持显示的设备,控制设备显示知识图谱。
在一些实施例中,基于输入文本,确定实体特征集合,包括:对输入文本进行分词切分,得到输入文本包括的实体集合;对于实体集合中的每个实体,确定该实体的结构化特征,得到实体集合的结构化特征集合;对于实体集合中的每个实体,确定该实体的非结构化特征,得到实体集合的非结构化特征集合;合并结构化特征集合和非结构化特征集合,得到实体特征集合。
在一些实施例中,对于实体集合中的每个实体,确定该实体的结构化特征,包括:确定该实体在输入文本中出现次数的独热向量;确定该实体在输入文本中出现类型的独热向量;串联出现次数的独热向量和出现类型的独热向量,得到该实体的结构化特征。
在一些实施例中,对于实体集合中的每个实体,确定该实体的非结构化特征,包括:将该实体输入预先训练的第一神经网络;将预先训练的第一神经网络的最后一层隐藏层的值作为该实体的非结构化特征输出。
在一些实施例中,输入文本,生成语义关系集合,包括:基于输入文本,生成文本特征;将文本特征输入预先训练的第二神经网络,生成第一特征;将文本特征输入预先训练的第三神经网络,生成第二特征;融合第一特征和第二特征,生成第三特征;将第三特征输入预先训练的分类器,利用下式生成分类结果矩阵:其中,F表示第三特征,M是与F形状相同的随机产生的二值向量,表示拼接处理,V表示权值矩阵,c为偏置值,s为分类结果矩阵,s是m×N维的矩阵,m为预先确定的语义关系的类别总数,N为实体集合中的实体数量,g()表示预先训练得到的选择函数,s中第i行第j列元素的值表示第j个实体所表征的语义关系属于第i类语义关系的概率,i∈[1,m],j∈[1,N];将s中每一列中值最大元素的行所对应的语义关系确定为该实体的语义关系,得到输入文本的语义关系集合。
在一些实施例中,基于实体特征集合和语义关系集合,确定并输出知识图谱,包括:将实体集合中的各个实体确定为知识图谱的节点,其中,知识图谱包括第一数目个节点;基于语义关系集合中的各个语义关系,确定知识图谱的边,其中,知识图谱包括第二数目个边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波富万信息科技有限公司,未经宁波富万信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010579565.5/2.html,转载请声明来源钻瓜专利网。