[发明专利]结合规则来进行机器学习的方法及系统在审
申请号: | 202210203843.6 | 申请日: | 2016-08-25 |
公开(公告)号: | CN114611707A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 罗远飞;陈雨强 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 王明远 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 规则 进行 机器 学习 方法 系统 | ||
提供了一种结合规则来进行机器学习的方法及系统,所述方法包括:(A)获取数据记录,其中,所述数据记录包括多个属性信息;(B)将关于预测目标的至少一条规则应用于所述多个属性信息,以产生数据记录的规则相关特征;(C)至少基于所述规则相关特征来形成预测样本;以及(D)利用机器学习预测模型,基于预测样本来产生关于预测目标的机器学习预测结果,其中,所述机器学习预测模型被训练为针对预测样本来提供相应的机器学习预测结果。通过所述方法和系统,能够将规则形成为参与机器学习的规则相关特征,从而有效地将规则融入到机器学习的过程中,由此改进预测效果。
本申请是申请日为2016年8月25日、申请号为201610728180.4、题为“结合规则来进行机器学习的方法及系统”的专利申请的分案申请。
技术领域
本发明的示例性实施例总体说来涉及人工智能领域,更具体地说,涉及一种结合规则来进行机器学习(例如,训练和预测)的方法及系统。
背景技术
近来,机器学习技术与传统的规则(Rule)系统相比,在人工智能领域得到了更为普遍的应用。这是因为,随着应用场景的复杂化,需要归纳和开发的规则数量变得越来越大,有些时候,数据的增长速度导致人们已经无法掌握数据变化所带来的规则改变。
相应地,人们更倾向于使用机器学习技术来解决问题。然而,很多机器学习算法均为黑盒,产生的机器学习模型往往很难清楚地表达某个具体策略的原因;另一方面,即使在实践中已经发现某个因素在特定场景下具有关键作用,也很难将这样的发现有效地直接施加到机器学习系统中。
具体说来,在公开号为US20160171386号的美国专利申请中,介绍了一种用于观点挖掘的系统和方法,其中,基于规则的系统可作为情绪检测模块,基于机器学习的系统可与所述情绪检测模块进行通信并处理由情绪检测模块提供的数据。
此外,在公开号为CN105721194A的中国专利申请中,公开了一种利用大数据实时处理、机器学习技术等技术,实现全自动的运营商网络故障定位功能的方案。将运维人员的经验固化到系统中,使系统具备基础的判断智能。
另外,在公开号为CN105320960A的中国专利申请中,公开了一种基于投票的跨语言主客观情感分类方法,包括如下步骤:S1、根据源语言的情感词典构建目标语言的情感词典;S2、采用规则算法、机器翻译与统计机器学习相结合的算法、极性特征值计算算法三种算法分别从待标注文本中的句子中提取词,根据构建的目标语言的情感词典,判断词的情感极性,进而进行句子的主客观性质判断;S3、获得根据三种算法得到的句子的主客观性质的判断结果,通过投票对句子的主客观性质进行判定。
可以看出,在已有的解决方案中,规则系统和机器学习系统可顺序连接,即,通过规则系统对机器学习系统的数据样本进行预处理,或对机器学习系统的预测结果进行修正;或者,规则系统和机器学习系统可分别进行预测,并在两者的判断结果中择一使用。上述方式中,规则系统与机器学习系统均独立工作,使得规则难以有效地融入到机器学习中。
发明内容
本发明的示例性实施例旨在克服规则难以有效地融入机器学习的缺陷。
根据本发明的示例性实施例,提供一种结合规则来进行机器学习的方法,包括:(A)获取数据记录,其中,所述数据记录包括多个属性信息;(B)将关于预测目标的至少一条规则应用于所述多个属性信息,以产生数据记录的规则相关特征;(C)至少基于所述规则相关特征来形成预测样本;以及(D)利用机器学习预测模型,基于预测样本来产生关于预测目标的机器学习预测结果,其中,所述机器学习预测模型被训练为针对预测样本来提供相应的机器学习预测结果。
可选地,在所述方法中,规则相关特征包括规则预测特征和/或规则描述特征,其中,在步骤(B)中,基于所述数据记录依据所述至少一条规则而获得的规则预测结果来产生规则预测特征,并且/或者,基于所述数据记录针对所述至少一条规则之中的各条规则的条件是否成立来产生规则描述特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210203843.6/2.html,转载请声明来源钻瓜专利网。