[发明专利]一种通过知识融合生成学习图谱的方法及系统在审
申请号: | 201910408201.8 | 申请日: | 2019-05-15 |
公开(公告)号: | CN111949799A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 知识 融合 生成 学习 图谱 方法 系统 | ||
本发明属于自然语言处理技术领域,提供了一种通过知识融合生成学习图谱的方法及系统,其方法包括:获取不同来源的实体内容;根据预设的标准维度将所述实体内容转换为标准实体内容;获取用户的学习轨迹;根据所述学习轨迹分析所述标准实体内容之间的实体关系;根据所述标准实体内容和所述实体关系生成知识图谱。本发明将不同来源的实体内容进行统一标准维度的转换,避免不同维度标准导致生成的知识图谱有误。
技术领域
本发明涉及自然语言处理技术领域,尤指一种通过知识融合生成学习图谱的方法及系统。
背景技术
目前生成知识图谱要么从单一平台获取语料,导致生成的知识图谱中各个节点的实体内容数据来源单一,实体内容较少。要么从各个不同的平台获取语料,然后生成对应的知识图谱。但是不同平台对于实体内容都有各自不同的描述方法,从而导致实质相同的实体内容可能由于描述不同无法进行归纳。例如番薯为学名,别称有甘薯、地瓜、甜薯、红薯、红苕、白薯等。实体内容来源多样,维度不同,在生成知识图谱过程中容易造成错误。因此,需要一种通过知识融合生成学习图谱的方法及系统。
发明内容
本发明的目的是提供一种通过知识融合生成学习图谱的方法及系统,实现将不同来源的实体内容进行统一标准维度的转换,避免不同维度标准导致生成的知识图谱有误。
本发明提供的技术方案如下:
本发明提供一种通过知识融合生成学习图谱的方法,包括:
获取不同来源的实体内容;
根据预设的标准维度将所述实体内容转换为标准实体内容;
获取用户的学习轨迹;
根据所述学习轨迹分析所述标准实体内容之间的实体关系;
根据所述标准实体内容和所述实体关系生成知识图谱。
进一步的,获取不同来源的实体内容之前包括:
获取语料样本;
分析所述语料样本中实质相同但描述方式不同的样本内容;
选取其中任意一个样本内容作为对应的标准维度;
根据所述标准维度建立标准库,所述样本内容为对应的标准维度的维度实体内容。
进一步的,选取其中任意一个样本内容作为对应的标准维度具体包括:
获取每一个样本内容的描述规则来源;
根据所述描述规则来源选取其中一个样本内容作为对应的所述标准维度;或,
统计每一个样本内容在所述语料样本中出现的样本内容频率;
按照由大到小的顺序对所述样本内容频率进行排序,选择样本内容频率最高的样本内容作为对应的所述标准维度。
进一步的,根据预设的标准维度将所述实体内容转换为标准实体内容具体包括:
将所述实体内容和所述标准库中的维度实体内容进行比对;
若比对相符,则确定对应的所述标准实体内容。
进一步的,根据所述标准实体内容和所述实体关系生成知识图谱具体包括:
当获取的是某一个用户的学习轨迹时,根据所述标准实体内容和所述实体关系生成对应用户的学习记录图谱;
当获取的是所有的用户的学习轨迹时,根据所述标准实体内容和所述实体关系生成学习知识图谱。
本发明还提供一种通过知识融合生成学习图谱的系统,包括:
实体获取模块,获取不同来源的实体内容;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910408201.8/2.html,转载请声明来源钻瓜专利网。