[发明专利]基于健康预测模型的健康预测方法和装置有效
申请号: | 201810036412.9 | 申请日: | 2018-01-15 |
公开(公告)号: | CN108122613B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 北京颐圣智能科技有限公司 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H70/00 |
代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 姜楠楠 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 健康 预测 模型 方法 装置 | ||
1.一种健康预测方法,包括以下步骤:
步骤S1,对所有病历进行结构化处理,得到特征名称;
步骤S2,基于所述特征名称构建独热数据,基于所述独热数据,对所有病历的每一个进行独热编码,得到独热编码数据;
步骤S3,基于所述独热编码数据,将所述独热编码数据对应的独热数据转化为格式数据,所述格式数据包括特征值,在步骤S3中,
所述格式数据的格式为:领域编号:特征编号:特征值,
其中,每个特征名称具有一特征编号,属于同一医学术语转化来的特征名称具有相同的所述领域编号,
每个特征值对应所述健康预测中的多个隐向量,所述隐向量的个数根据领域编号确定;
步骤S4,利用所述格式数据对健康预测模型进行训练,得到所述健康预测模型;以及
将所述格式数据代入下面的所述健康预测模型的变形形式,如公式(1):
其中,
n为所述特征值的个数,
xi、xj、xk分别为第i、j、k个特征值,
w0、wi分别为所述健康预测模型的偏置项参数和一次项参数,
y(x)表示身体的健康指标,
表示第i、j个特征值对应的隐向量的内积,
表示第i、j、k个特征值对应的隐向量的内积,
fi,fj,fk分别为第i、j、k个特征值的领域编号,
所有的二次项参数wij、三次项参数wijk均组成对称矩阵,二次项参数wij组成一个对称矩阵W,该对称矩阵分解为W=VTV的形式,其中,V的第j列定义为第j个特征值的隐向量,通过这样的分解后,得到表示第i、j个特征值对应的隐向量的内积,即每个二次项参数可以由对应的两个特征值的隐向量的内积得到,隐向量的长度为k其值远小于n,通过训练得到每个特征的隐向量即可间接得到二次特征的参数,这时模型的参数个数变成了k*n个,远小于个,同理,三次项参数wijk也采用这种方式进行处理,
上述对参数进行因子化处理使得xixj的参数和xjxk的参数不再是相互独立的,因此在样本稀疏的情况下相对合理地估计模型的二次项参数,xixj和xjxk的系数分别为ViVj和VjVk,它们之间有共同项Vi,所有包含xi的非零组合特征的样本都用来学习隐向量Vi;
步骤S5,利用S4得到的所述健康预测模型对健康进行预测。
2.根据权利要求1所述的健康预测方法,其特征在于,步骤S1包括:
步骤S11,对病历进行分词,得到分词后的文本数据;
步骤S12,对所述分词后的文本数据进行命名实体识别,得到实体数据;
步骤S13,识别所述实体数据中的医学术语,对所述医学术语进行标记,得到标记后的医学术语;以及
步骤S14,对所述得到标记后的医学术语进行结构化处理,得到特征名称。
3.根据权利要求1或2所述的健康预测方法,其特征在于,在步骤S2中,所述独热数据的形式是:特征名称_描述:特征名称;诱因:特征名称;转归:特征名称;部位:特征名称。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京颐圣智能科技有限公司,未经北京颐圣智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810036412.9/1.html,转载请声明来源钻瓜专利网。