[发明专利]一种癌症领域互动数据分析系统在审

专利信息
申请号: 201910601908.0 申请日: 2019-07-05
公开(公告)号: CN110299210A 公开(公告)日: 2019-10-01
发明(设计)人: 韩宗婧 申请(专利权)人: 韩宗婧
主分类号: G16H70/00 分类号: G16H70/00;G06F16/33;G06F16/35
代理公司: 暂无信息 代理人: 暂无信息
地址: 138000 *** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种癌症领域互动数据分析系统,包含包括计算机系统,病历信息系统,病人数据分析系统,文献互动系统,数据传送系统,辅助构建处理系统和医患决策系统、将医患所需癌症领域研究文献向量化、求取医患所需癌症领域研究文献集合的调看文本类、对调看文本类进行相关内容分析;能从庞大而且多样的生物癌症文献文本集合中挖掘出有生物癌症价值的信息。
搜索关键词: 癌症 分析系统 互动数据 领域研究 文本 数据传送系统 病历信息 病人数据 处理系统 互动系统 决策系统 内容分析 文本集合 文献集合 向量化 计算机系统 构建 对调 挖掘
【主权项】:
1.一种癌症领域互动数据分析系统,其特征在于,包括以下步骤:包括计算机系统,病历信息系统,病人数据分析系统,数据传送系统、文献互动系统,辅助构建处理系统和医患决策系统;计算机系统以癌症为关键词收集原始文献文本集合,提取所述原始文献文本集合中每个文献的发表时间信息;数据传送系统用于每个文献响应通信,并建立不同的文献文本归类;患者数据处于计算机系统设定的集合时称为初始状态集,数据传送系统采用这种方式能快速建立每个文献文本的集合,病历信息系统将原始文献文本集合按照多个时间段进行归类,并获取所述时间段内的原始文献文本的原始关键词,所述原始关键词为所述原始文献文本中出现频次超过设定阈值的词;病历信息系统包括医患互动单元和病情归类单元,所述病情须知单元的执行时间设置为每个月归类,执行过程为:所述病情须知单元查询计算机系统处理的最近一次文献状态信息,导出与当前时间的间隔超过36个月的患者状态信息作为文献状态收录目标,医患互动单元就是与所述需要设定的治疗方案,启动后所述病情须知单元查询计算机系统中的癌症领域数据并导出对应的文献,将所述对应的号码和编辑好的内容导入到信息群发平台,群发医患互动内容;病人数据分析系统对所述原始关键词进行文本计算得到所述癌症关键词;将所述癌症关键词保存成特定的文本格式作为关键信息进行存储,建立癌症领域文本集合;文献互动系统对所述癌症领域文本集合进行计算;所述计算过程包括:格式转换,文本预处理和词典构建;数据传送系统对医患所需癌症领域研究文献进行所述格式转换,过滤掉其文本的结构信息;文本预处理包括分词、去停用词、归一化、词干提取;对文本进行所述分词处理,以空格、标点符号、段落为分割符,将文献的文本分隔成独立的单词;对文本进行所述去停用词处理,删除文献的文本中没有意义的所述单词,包括助动词、介词、连接词和感叹词;对文本进行述归一化处理,将表达相同语义但是拼写格式不同的单词统一形式;所述归一化方法包括统一字母大小写、去掉重音和音调符号;对文本进行词干提取,将词项简化为词干形式;辅助构建处理系统对文本进行所述词典构建,建立癌症相关术语的单词集合;并将医患所需癌症领域研究文献向量化:将医患所需癌症领域研究文献视作由n个所述单词组成的向量di,di=(di1,di2,...,din),i为整数,每个单词对应一个特征项,第j个单词对应特征项tj;dij通过公式一计算:公式一:其中,dij为所述向量di在第j个维度的分量,csij为所述特征项tj在医患中所需的第i篇文献中出现的次数;所述csin为第i篇文献中总单词数:Z表示医患中所需领域研究文献集合中医患所需癌症领域研究文献的总数,Zj表示包含所述特征项tj的医患所需癌症领域研究文献的数目;每个特征项tj对应一个偏重wij,表示所述特征项tj在该医患所需癌症领域研究文献中的重要程度,偏重wij通过公式二计算:公式二:其中,所述wij的值为所述第i篇文献的所述特征项tj的偏重,csij为所述特征项tj在所述第i篇文献中出现的次数;Z表示医患所需癌症领域研究文献集合中医患所需癌症领域研究文献的总数,smij为医患所需癌症领域研究文献集合中,包含特征项tj的医患所需癌症领域研究文献的数目;i、j和n均为正整数,j≤n;医患决策系统求取医患所需癌症领域研究文献集合的调看文本类,在向量空间模型中,两个医患所需癌症领域研究文献d1和d2之间的通用度通过公式三计算:公式三:其中,T(d1,d2)为两个医患所需癌症领域研究文献d1和d2之间的通用度,d1j、d2j分别表示医患所需癌症领域研究文献d1和d2第j个维度的分量;j和n均为正整数,j≤n;医患决策系统计算医患所需癌症领域研究文献集合中,所有医患所需癌症领域研究文献两两之间的所述通用度,求取医患所需癌症领域研究文献与其他各个医患所需癌症领域研究文献的所述通用度的平均值,将所述平均值最小的医患所需癌症领域研究文献作为调看文本类;医患决策系统对所述调看文本类进行内容分析,实证分析,热度分析以及效果分析,并进行深层的知识发现。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩宗婧,未经韩宗婧许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910601908.0/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top