[发明专利]常识知识评分和排序方法及装置在审
申请号: | 202210292415.5 | 申请日: | 2022-03-23 |
公开(公告)号: | CN114861913A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 李涓子;朱洪银;刘宝巨;吕鑫;侯磊;张鹏;唐杰;许斌 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N5/02 | 分类号: | G06N5/02 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 吴勇涛 |
地址: | 100084 北京市海淀区双清路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 常识 知识 评分 排序 方法 装置 | ||
本发明提供一种常识知识评分和排序方法及装置,其中,常识知识评分方法包括:获取待评分常识三元组对象和与待评分常识三元组对象对应的义原树组;将待评分常识三元组对象和义原树组输入至评分模型,获得评分模型输出的投票结果;其中,评分模型是基于样本组以及对应的投票标签进行训练后得到的,样本组包括常识三元组样本以及与常识三元组样本对应的义原树组样本,投票标签是根据样本组预先确定的,并与样本组一一对应。本发明提供的常识知识评分和排序方法及装置通过结合三元组自身信息和外部知识库的义原信息,实现了对待评分常识三元组对象进行综合评分,提高了常识知识评分和排序的准确率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种常识知识评分和排序方法及装置。
背景技术
现有技术中,通常使用语言模型来验证常识。例如使用BERT模型来验证ConceptNet三元组的正确性。而这种方法只使用三元组自身的上下文信息,导致验证信息的来源单一,致使常识评分正确率低,从而导致常识知识排序正确率低。
发明内容
本发明提供一种常识知识评分和排序方法及装置,用以解决现有技术中常识知识评分和排序正确率低的缺陷,提高常识知识评分和排序正确率。
第一方面,本发明提供一种常识知识评分方法,包括:
获取待评分常识三元组对象和与所述待评分常识三元组对象对应的义原树组;
将所述待评分常识三元组对象和所述义原树组输入至评分模型,获得所述评分模型输出的投票结果;
其中,所述评分模型是基于样本组以及对应的投票标签进行训练后得到的,所述样本组包括常识三元组样本以及与所述常识三元组样本对应的义原树组样本,所述投票标签是根据所述样本组预先确定的,并与所述样本组一一对应。
可选地,所述待评分常识三元组对象包括头实体、关系类型和尾实体;
获取与所述待评分常识三元组对象对应的义原树组包括:
获取与所述头实体对应的头义原树、与所述尾实体对应的尾义原树以及与所述头义原树和所述尾义原树之间的义原路径。
可选地,所述评分模型包括:第一解析模块、第二解析模块、第三解析模块和投票模块;
所述将所述待评分常识三元组对象和所述义原树组输入至评分模型,获得所述评分模型输出的投票结果,包括:
将所述待评分常识三元组对象输入至所述第一解析模块,获得所述第一解析模块输出的第一向量;
将所述义原树组输入至所述第二解析模块,获得所述第二解析模块输出的第二向量;
将所述待评分常识三元组对象和所述义原树组输入至所述第三解析模块,获得所述第三解析模块输出的第三向量;
将所述第一向量、所述第二向量和所述第三向量输入至所述投票模块,获得所述投票模块输出的所述投票结果。
可选地,所述投票模块包括第一概率单元、第二概率单元、第三概率单元和投票单元;
所述将所述第一向量、所述第二向量和所述第三向量输入至所述投票模块,获得所述投票模块输出的投票结果,包括:
将所述第一向量输入至所述第一概率单元,获得第一概率单元输出的、用于表示所述待评分常识三元组对象正确概率的第一概率;
将所述第二向量输入至所述第二概率单元,获得第二概率单元输出的、用于表示所述义原数组正确概率的第二概率;
将所述第三向量输入至所述第三概率单元,获得第三概率单元输出的、用于表示所述待评分常识三元组对象和所述义原数组的组合正确概率的第三概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210292415.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防炫目的智能无线信号灯
- 下一篇:一种纯高丰度稀土橡胶磁体及其制备方法