[发明专利]基于自然语言和知识图谱的文本处理方法及装置有效
申请号: | 201911297702.X | 申请日: | 2019-12-17 |
公开(公告)号: | CN110727806B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 王海峰;姜文斌;吕雅娟;朱勇;吴华 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自然语言 知识 图谱 文本 处理 方法 装置 | ||
本申请公开了一种基于自然语言和知识图谱的文本处理方法及装置,涉及人工智能技术领域。具体实现方案为:电子设备使用联合学习模型得到的语义表示,而该联合学习模型结合知识图谱表示学习和自然语言表示学习得到的,其结合了知识图谱学习表示和自然语言学习表示,相较于仅利用知识图谱表示学习或自然语言表示学习学习预测对象的语义表示,联合学习模型考虑的因素更多更全面,因此可以提高语义表示的准确性,进而提高文本处理的准确性。
技术领域
本公开实施例涉及人工智能(Artificial Intelligence,AI)技术领域,尤其涉及一种基于自然语言和知识图谱的文本处理方法及装置。
背景技术
目前,为了从海量数据中获取有价值的信息,知识图谱(knowledge graph,KG)应运而生。同时,自然语言作为人们用以交流和思维的工具和载体,自然语言的字符和词语的表示,是基于深度学习的语言处理类人工智能任务的基本处理对象。
通常情况下,知识图谱和自然语言是两个独立的领域,该两个领域均已独立发展起了表示学习技术体系,其中,知识图谱表示学习通常以向量空间运算的形式,对知识图谱包含的节点(Point)和边(Edge)之间的共现规律进行建模,以学习知识图谱语义表示;自然语言表示学习通常以序列生成的形式,对词语或语句之间的共现规律进行建模,以学习自然语言语义表示。
然而,基于上述文本处理方法学习到的语义表示准确度差,导致上述语义表示用于文本处理时,文本处理的准确度差。
发明内容
本公开实施例提供一种基于自然语言和知识图谱的文本处理方法及装置,通过将知识图谱的表示学习和自然语义的表示学习进行结合,以学习到质量更好的语义表示,实现提高文本处理准确性的目的。
第一方面,本申请实施例提供一种基于自然语言和知识图谱的文本处理方法,包括:接收用户输入的文本处理请求,所述文本处理请求用于请求根据文本中的预测对象的语义表示处理所述文本,将所述预测对象输入至预先训练好的联合学习模型,以获取所述预测对象的语义表示,所述联合学习模型用于知识图谱表示学习和自然语言表示学习,所述语义表示是所述联合学习模型结合所述知识图谱表示学习和所述自然语言表示学习得到的,根据所述语义表示处理所述文本。
一种可行的设计中,所述接收用户输入的文本处理请求之前,还包括:对训练样本进行训练以得到所述联合学习模型,所述联合学习模型包括自然语言学习层、联合学习关联层和知识图谱学习层,所述联合学习关联层用于关联所述知识图谱学习层和所述自然语言学习层。
一种可行的设计中,所述对训练样本进行训练以得到所述联合学习模型,包括:在所述自然语言学习层确定所述训练样本中目标训练样本的邻居样本,在所述联合学习关联层根据所述邻居样本,确定所述目标训练样本相对于所述知识图谱学习层中各实体的权重,根据所述各实体的权重,确定所述目标训练样本的知识图谱语义表示,根据所述知识图谱语义表示和所述邻居样本,确定所述目标训练样本的训练结果。
一种可行的设计中,所述在所述联合学习关联层确定所述目标训练样本相对于所述知识图谱学习层中各实体的权重,包括:对于所述知识图谱学习层中的每一个实体,在所述联合学习关联层确定所述目标训练样本相对于所述实体的M个权重,所述M≥1且为整数。
一种可行的设计中,所述根据所述各实体的权重,确定所述目标训练样本的知识图谱语义表示,包括:对于所述知识图谱学习层中的每一个实体,根据所述实体对应的权重对所述实体的知识图谱语义表示进行处理,得到多个处理后的知识图谱语义表示,根据所述多个处理后的知识图谱语义表示,确定所述目标训练样本的知识图谱语义表示。
一种可行的设计中,所述根据所述知识图谱语义表示和所述邻居样本,确定所述目标训练样本的训练结果之后,还包括:根据所述训练结果优化所述知识图谱学习层包含的多个实体中每个实体的知识图谱语义表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911297702.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:社区知识图谱构建方法及系统
- 下一篇:一种物联网演示控制系统及控制方法