[发明专利]一种基于矩阵分解的食物-疾病关联预测方法有效
申请号: | 201811072187.0 | 申请日: | 2018-09-14 |
公开(公告)号: | CN109448853B | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 王嫄;张耀功;陈赠光;杨巨成;李政;史艳翠;赵青 | 申请(专利权)人: | 天津科技大学 |
主分类号: | G16H50/50 | 分类号: | G16H50/50;G16H20/60;G06Q10/04 |
代理公司: | 12209 天津盛理知识产权代理有限公司 | 代理人: | 王利文 |
地址: | 300457 天津市滨*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 疾病 相关度 相似度 矩阵 关联 预测 关联矩阵 矩阵分解 正则化 拟合 网络 国际疾病分类 随机初始化 迭代学习 关联网络 关联研究 矩阵近似 模型参数 人力物力 输出预测 数据构建 数据噪音 预测模型 成分表 构建 建模 捕捉 消耗 引入 | ||
本发明涉及一种基于矩阵分解的食物‑疾病关联预测方法,利用成分表构建食物相似度网络;利用国际疾病分类数据构建疾病相关度网络;正则化食物相似度网络;正则化疾病相关度网络;构造已知的二元食物‑疾病关联网络;随机初始化要预测的食物‑疾病关联矩阵;引入捕捉真实食物相似度的矩阵和疾病真实相关度的矩阵,迭代学习模型参数,输出预测的食物和疾病关联矩阵Y、食物相似度真实情况的拟合矩阵和疾病相关度真实情况的拟合矩阵。本发明结合食物之间相似度和疾病相关度,对已知关联和要预测关联进行矩阵近似建模,可在人力物力消耗极低的情况下,为食物疾病关联研究提供指导,减少数据噪音的影响,提升食物和疾病关联预测模型的准确性。
技术领域
本发明属于食品安全领域,尤其是一种基于矩阵分解的食物-疾病关联预测方法。
背景技术
随着我国国民经济的迅速发展和人民健康意识的不断提高,人们对生命质量的要求也越来越高,为追求健康,对饮食指南的需求越来越强烈。已有研究表明,膳食与疾病的发生、发展有着密切的关系,典型的如内分泌代谢疾病与高脂食物之间,粗粮饮食与乳腺癌之间;喝咖啡与结肠癌之间的、盐渍萝卜和腌制肉类与胃癌之间存在的相关关系等。
目前,为了研究上述关系,只能通过局部人口学采样、调查问卷、口述内容或者活体实验得到相关数据,并进行统计分析。但这种关联获取方式需要消耗极大的人力物力,尤其置信度高的活体实验,仍旧存在较大的风险,难以满足人民细致的食物-疾病关联的知情需求。典型的风险主要在于调查问卷被调查对象错误信息的填写,调查问卷中指标的有偏统计,被调查者多方面因素综合作用,并非单一食品变量因素。活体实验中实验者的操作也是风险来源之一。此外,随着食品种类的快速增长,实验和调查的成本成指数级增长,而由于人力物力限制,事实研究不能及时更新,只能集中在少数疾病和少数食品范畴。
综上所述,食品与疾病的关联是目前热门的关注领域。对于广泛的食品和疾病的关联尚未出现置信度高、受众广的预测方法。
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于矩阵分解的食物-疾病关联预测方法,解决食物疾病预测任务的准确性低以及采用随机试验带来的大量的人力和资源的消耗。
本发明解决其技术问题是采取以下技术方案实现的:
一种基于矩阵分解的食物-疾病关联预测方法,包括以下步骤:
步骤1:利用成分表构建食物相似度网络W1;
步骤2:利用国际疾病分类数据构建疾病相关度网络W2;
步骤3:正则化食物相似度网络,得到正则化的食物相似度网络
步骤4:正则化疾病相关度网络,得到正则化的疾病相关度网络
步骤5:构造已知的二元食物-疾病关联网络
步骤6:随机初始化要预测的食物-疾病关联矩阵Y;
步骤7:引入捕捉真实食物相似度的矩阵S1和疾病真实相关度的矩阵S2,迭代学习模型参数,输出预测的食物和疾病关联矩阵Y、食物相似度真实情况的拟合矩阵S1和疾病相关度真实情况的拟合矩阵S2。
进一步,所述步骤1的具体实现方法为:将每一个节点设置为“食物-量-食用方法”的组合,在“量-食用方法”不同的情况下,将两两节点关系置为0;在“量-食用方法”相同的情况下,根据食物成分表,利用余弦公式,计算两两食物之间的相似度,作为节点关系值,从而得到食物相似度网络W1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津科技大学,未经天津科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811072187.0/2.html,转载请声明来源钻瓜专利网。