[发明专利]基于机器学习算法的生物信息分析平台在审
申请号: | 202011165789.8 | 申请日: | 2020-10-27 |
公开(公告)号: | CN112259170A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 宋骏霖 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B45/00;G16B50/00;G06F21/31;G06F21/43;G06F16/35;G06F16/215;G06F16/245;G06F16/2458;G06F16/248;G06F16/28 |
代理公司: | 上海思牛达专利代理事务所(特殊普通合伙) 31355 | 代理人: | 雍常明 |
地址: | 116000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 算法 生物 信息 分析 平台 | ||
1.基于机器学习算法的生物信息分析平台,其特征在于,包括注册与登录模块、身份验证模块、互联网数据收集模块、实验数据收集模块、数据上传模块、数据存储模块、云服务器模块、数据整理模块、智能处理模块、文本分析模块、报表生成模块、信息展示模块;
其中,所述注册与登录模块与身份验证模块通信连接,所述互联网数据整收集模块与数据上传模块通信连接,所述实验数据收集模块与数据上传模块通信连接,所述数据存储模块与云服务器模块通信连接,所述报表生成模块与云服务器模块通信连接,所述云服务器模块与信息展示模块通信连接;
所述注册登录模块用于通过上传个人基本信息的方式注册账号,并通过注册账号登录该平台,其具体过程如下:
步骤一:使用者在首次登录平台时需要进行注册;
步骤二:使用者在注册时需要设置登录账号与密码,在设置密码时需要重复输入三次,用于登录时进行验证,同时填写账号信息;
步骤三:通过步骤二设置的登录账号与密码登录该平台;
所述身份验证模块用于核对账号信息和密码,若密码输错超过三次则需要进行验证,具体验证过程如下:
步骤一:使用者在登录模块上连续输入X次密码,X为预设值,X=1……n;
步骤二:注册与登录模块会记录下使用者输入每次输入密码的时间Fi,i=1……n;
步骤三:通过公式C=Fi+Fi+Fi……+Fi,得到输入密码的总时间C;
步骤四:通过公式S=C/X得到使用者每次输入密码的平均时间S;
步骤五:将使用者后续登录系统时输入密码的时间标记为V;
步骤六:通过公式R=S-V得到时间差R;
步骤七:当R的数值大于预设值时,使用者只要输入密码即可正常登录该系统;
步骤八:当R小于预设值时,使用者不仅需要输入登录密码,还需要通过智能手机进行短信验证后才可正常登录;
所述互联网数据收集模块用于对各大平台、各大数据库、各大语料库及各大网站有关的生物信息数据进行搜索收集;所述实验数据收集模块用于对使用者个人研究数据、导师研究数据和其他研究者研究数据关于生物信息的数据进行搜索收集;所述数据上传模块用于接受互联网收集数据模块和实验数据收集模块收集的有关生物信息的数据并转换成数据包,同时发送传输至数据存储模块;所述数据存储模块用于接收数据包并进行数据存储,所述数据整理模块用于对存储过后的生物信息数据进行数据审核、数据筛选和数据排序处理,具体整理步骤如下:
步骤一:对数据进行审核处理,具体审核处理步骤如下:
S1:从数据的真实性和精确性角度去审核生物信息数据的准确性;
S2:从数据具体是解决生物信息某方面问题的角度出发,去检查数据解释说明问题的程度,具体包括数据与调查主题、与目标总体的界定、与调查项目的解释是否匹配,进而审核数据的适用性;
S3:从检查数据是否按照规定时间报送的角度审核数据的及时性和时效性;
S4:从检查数据在不同地区或国家及在不同时间段是否具有可比性的角度来审核数据的一致性;
步骤二:对数据进行审核处理,具体审核处理步骤如下:
SS1:筛选出真实性和精确性较低的数据、适用性较低,不符合现在主流研究方向和研究通用性较低的数据、时间久远的,在当下研究看来已经失去可利用价值的数据以及在不同国家或地区及在不同时间段失去可比性的数据;
SS2:对真实性和精确性较低的数据进行剔除;
SS3:对适用性较低,不符合现在主流研究方向和研究通用性较低的数据进行剔除;
SS4:对某些时间久远的研究数据,在当下研究看来已经失去可利用价值的数据进行剔除;
SS5:对某些在不同国家或地区及在不同时间段失去可比性的数据进行剔除
步骤三:对数据进行排序处理,具体排序处理步骤如下:
SSS1:设计数据排序方式;
SSS2:根据排序方式对数据进行排列;
所述智能处理模块包括数据分类单元和数据聚类单元,所述数据分类单元用于通过某个或某些特定条件对整理过后的生物信息数据进行类型分类,所述数据聚类单元用于将相似度高的生物信息数据进行归类化简;
其中,所述数据分类单元具体分类过程如下:
步骤一:对数据进行预处理;
步骤二:文本表示;
步骤三:特征降维;
步骤四:分类器;
步骤五:性能评价;
所述数据分析模用于对分类和聚类后的数据进行可视化处理,所述数据分析模块包括图表制作单元和数据标注单元,所述图表制作单元用于将经过分类和聚类后的数据与图表结合,所述数据标注单元用于对经过图表结合的数据进行数值标注;所述报表生成模块用于对经过数据分析模块处理的数据进行结构化生成;所述云服务器模块包括数据未处理单元和数据处理后单元,所述数据未处理单元用于存储分析前的数据信息,所述数据处理后单元用于存储经过智能分析后的数据信息;所述信息展示模块包括信息检索单元和相关推荐单元,所述信息检索单元用于使用者输入关键词或字,进而对经过分析过后存储在云服务器模块中的数据进行检索调取;所述相关推荐单元用于对使用者经常输入关键词或字进行统计,并根据统计结果展示相关数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011165789.8/1.html,转载请声明来源钻瓜专利网。