[发明专利]基于机器学习对关联规则进行评估的方法及装置有效
申请号: | 202110980623.X | 申请日: | 2021-08-25 |
公开(公告)号: | CN113656558B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 蒋雪涵 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F16/35;G06F40/126;G06F40/194;G06N20/00 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 贾依娇 |
地址: | 518000 广东省深圳市福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 关联 规则 进行 评估 方法 装置 | ||
本发明涉及人工智能技术领域,揭露一种基于机器学习对关联规则进行评估的方法,包括:使用项目共现条件从项目集合中挖掘关联规则,关联规则包括前件和后件,项目共现条件为前件与后件中项目同时出现;利用预先训练的文本信息编码器和前件预测机对收集的项目文本信息进行特征提取,得到项目文本信息的编码向量表示,文本信息编码器用于对关联规则中后件是否出现进行预测,前件预测机用于对关联规则中前件是否出现进行预测;响应于关联规则的评估指令,根据项目文本信息的编码向量表示对每条关联规则进行评估,得到反映关联规则中前件和后件之间因果关系的评估结果。本发明能够针对关联规则进行因果关系评估,提高关联规则的可解释性。
技术领域
本发明涉及人工智能技术领域,尤其是涉及到基于机器学习对关联规则进行评估的方法、装置、计算机设备及计算机存储介质。
背景技术
关联分析是一种常用的挖掘算法,用来挖掘数据之间的内在关联,可应用在生活中很多应用场景,例如,在购物场景中,通过关联规则发现群体购买习惯的内在共性,指导超市产品摆放,在医疗场景中,通过关联规则挖掘病患消费医疗项目的可能,指导医生病例诊断。
通常情况下,关联规则可以由领域专家提出,还可以通过数据挖掘得到满足有些度量值,如置信度、支持度以及提升度等要求的候选集,再经过专家确认合理性。考虑到关联规则中项目是由不同因素决定的,这些因素的共同作用对项目之间关系的评估具有偏差,例如,关联规则为“口腔麻醉→根管”这里“口腔麻醉”可能是由于患者做了“拔牙术”或者“根管治疗”导致的,而“根管”仅仅因为患者做了“根管治疗”导致,使得“口腔麻醉”推理出“根管”是有一定偏差的,使得上述关联规则的挖掘过程存在以下两点不足之处,其一是挖掘出的关联规则存在大量假阳性的情况,且规则过于复杂,会导致关联规则的可解释性较弱;其二是挖掘出的关联规则依赖专家经验,不同专家的意见可能存在出入,导致关联规则存在主观性。
发明内容
有鉴于此,本发明提供了一种基于机器学习对关联规则进行评估的方法、装置、计算机设备及计算机存储介质,主要目的在于解决现有技术中挖掘得到的关联规则存在主观性以及可解释性较弱的问题。
依据本发明一个方面,提供了一种基于机器学习对关联规则进行评估的方法,该方法包括:
使用项目共现条件从项目集合中挖掘关联规则,所述关联规则包括前件和后件,所述项目共现条件为前件和后件中项目同时出现;
利用预先训练的文本信息编码器和前件预测机对收集的项目文本信息进行特征提取,得到项目文本信息的编码向量表示,所述文本信息编码器用于对所述关联规则中后件是否出现进行预测,所述前件预测机用于对所述关联规则中前件是否出现进行预测;
响应于关联规则的评估指令,根据所述项目文本信息的编码向量表示对每条关联规则进行评估,得到反映关联规则中前件和后件之间因果关系的评估结果。
在本发明另一实施例中,所述项目共现条件为关联规则中前件与后件同时出现,所述使用项目共现条件从项目集合中挖掘关联规则,具体包括:
对项目集合所包含频繁项目子集进行全排列;
针对所述频繁项目子集生成候选关联规则,并利用预设参数指标对所述候选关联规则进行过滤,得到符合预设条件的候选规则,所述参数指标至少包括支持度和置信度,所述支持度为前件和后件的共现频率,所述置信度为支持度与前件概率的比值。
在本发明另一实施例中,在所述利用预先训练的文本信息编码器和前件预测机对收集的项目文本信息进行特征提取,得到项目文本信息的编码向量表示之前,所述方法还包括:
针对每条关联规则,使用预先确定所述前件和所述后件是否在项目文本信息中出现作为标签数据;
将携带有标签数据的项目文本信息输入至第一网络模型中进行训练,构建文本信息编码器,所述文本信息编码器的优化目标为最大化预测关联规则中后件是否在项目文本信息中出现;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110980623.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种体育运动赛事赛前热身训练装置
- 下一篇:一种盐渍土路基的施工方法及其应用