[发明专利]基于人工智能的数据处理方法、装置及电子设备有效
申请号: | 202010860523.9 | 申请日: | 2020-08-25 |
公开(公告)号: | CN111813961B | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 周辉阳 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘晖铭;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 数据处理 方法 装置 电子设备 | ||
1.一种基于人工智能的数据处理方法,其特征在于,包括:
获取待进行知识抽取的文本;
获取包括多个层级的问题的知识抽取模板,根据所述多个层级的层级顺序,遍历所述多个层级,并针对遍历到的每个层级执行以下处理:
结合遍历到的层级的问题和所述文本进行答案预测处理,得到所述遍历到的层级的问题对应的答案,并
根据所述遍历到的层级的问题对应的答案,对下一个层级的问题进行更新,以用于与所述文本结合进行下一个层级的答案预测处理;
根据所述知识抽取模板中每个层级的问题以及对应的答案,构建知识图谱;
其中,所述结合遍历到的层级的问题和所述文本进行答案预测处理,得到所述遍历到的层级的问题对应的答案,包括:
当遍历到的层级是所述多个层级中除最后一个层级之外的任意一个层级时,通过第一人工智能模型对所述遍历到的层级的问题和所述文本进行概率映射处理,得到所述文本中的多个候选答案、以及每个所述候选答案的概率,并
将概率大于第一概率阈值的候选答案,确定为所述遍历到的层级的问题对应的答案;其中,用于训练所述第一人工智能模型的每个样本问题对应多个样本答案;
当遍历到的层级是所述最后一个层级时,通过第二人工智能模型对所述最后一个层级的问题和所述文本进行概率映射处理,得到所述文本中的多个候选答案、以及每个所述候选答案的概率,并
将概率大于第二概率阈值、且概率最大的候选答案,确定为所述最后一个层级的问题对应的答案;其中,用于训练所述第二人工智能模型的每个样本问题对应一个样本答案。
2.根据权利要求1所述的数据处理方法,其特征在于,还包括:
通过所述第一人工智能模型,对样本文本以及对应的样本问题进行概率映射处理,得到所述样本文本中的多个候选答案、以及每个所述候选答案的概率,并
将概率大于所述第一概率阈值的候选答案,确定为待对比的答案;
根据所述待对比的答案、与所述样本问题对应的多个样本答案之间的差异,在所述第一人工智能模型中进行反向传播,并
在反向传播的过程中,更新所述第一人工智能模型的权重参数。
3.根据权利要求1至2任一项所述的数据处理方法,其特征在于,
所述根据所述遍历到的层级的问题对应的答案,对下一个层级的问题进行更新,包括:
针对所述遍历到的层级的问题对应的每个答案,将所述答案填充至下一个层级的问题中的待填充部分;
所述根据所述知识抽取模板中每个层级的问题以及对应的答案,构建知识图谱,包括:
根据所述知识抽取模板中每个层级的问题以及对应的答案,构建三元组,以根据多个所述三元组构建知识图谱;
其中,所述三元组包括所述问题中的实体、属性以及所述答案中的属性值。
4.根据权利要求3所述的数据处理方法,其特征在于,还包括:
从多个所述三元组中挑选出第一实体和第二实体;
在所述第一实体对应的多个属性和所述第二实体对应的多个属性中,确定出相同的属性;
确定所述第一实体对应所述相同的属性的属性值、与所述第二实体对应所述相同的属性的属性值之间的相似度;
当所述相似度满足相似度条件时,将所述第一实体和所述第二实体进行融合处理。
5.根据权利要求4所述的数据处理方法,其特征在于,
所述相同的属性的数量为多个;
所述当所述相似度满足相似度条件时,将所述第一实体和所述第二实体进行融合处理,包括:
执行以下任意一种处理:
获取每个所述相同的属性对应的权重,根据所述权重对多个所述相同的属性对应的相似度进行加权处理,得到实体相似度,并
当所述实体相似度大于实体相似度阈值时,将所述第一实体和所述第二实体进行融合处理;
获取每个所述相同的属性对应的属性相似度阈值,并
当多个所述相同的属性对应的相似度均大于对应的属性相似度阈值时,将所述第一实体和所述第二实体进行融合处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010860523.9/1.html,转载请声明来源钻瓜专利网。