[发明专利]自动挖掘配伍关系系统及其方法有效
申请号: | 201510035590.6 | 申请日: | 2015-01-23 |
公开(公告)号: | CN104765762B | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 文小平;郭晶磊 | 申请(专利权)人: | 上海中医药大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海精晟知识产权代理有限公司31253 | 代理人: | 冯子玲 |
地址: | 201203 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 挖掘 配伍 关系 系统 及其 方法 | ||
1.一种自动挖掘配伍关系系统,以基础数据总库为依托,其特征在于,包括:
数据准备部,连接所述基础数据总库,对所述基础数据总库中的基础数据依次进行数据集成、数据选择、预处理形成新数据库;
数据挖掘部,与所述数据准备部相连,对所述新数据库进行数据挖掘形成挖掘数据;以及
结果表达和解释部,与所述数据挖掘部相连,对所述挖掘数据进行结果表达和解释,其中,所述数据准备部,具有:
检索模块,根据所述基础数据总库建立,对所述基础数据进行检索,自动生成检索表达式并存储,并生成检索数据库;
识别阅读模块,与所述检索模块相连,根据所述检索模块建立,对所述检索数据库中的指定字段进行文本阅读,查找出若干个关键词,并生成关键词库;
筛选关键词模块,与所述识别阅读模块相连,根据所述检索模块和所述识别阅读模块建立,对所述关键词库中的若干个所述关键词进行筛选,并形成布尔逻辑表达式;以及
语义数据库生成模块,与所述筛选关键词模块相连,根据所述检索模块、所述识别阅读模块和所述筛选关键词模块建立,根据所述布尔逻辑表达式,在所述基础数据总库中搜索,并生成新数据库。
2.根据权利要求1所述的自动挖掘配伍关系系统,其特征在于:
其中,所述筛选关键词模块,还包含:
纳入关键词模块,将若干个所述关键词通过所述检索模块进行逐个检索,选出高频或相关系数高的若干个所述关键词,计算出高频或相关系数高的若干个所述关键词的组合重叠情况,分析用词习惯和语言规律;以及
排出关键词模块,与所述纳入关键词模块相连,将人工识别去除的去除关键词记录下来,并生成弃用规则。
3.根据权利要求1所述的自动挖掘配伍关系系统,其特征在于:其中,所述检索模块包含搜索界面,通过人工输入检索关键词。
4.根据权利要求1所述的自动挖掘配伍关系系统,其特征在于:其中,所述识别阅读模块通过切词、断词、组词的阅读过程,生成一组所述关键词库。
5.一种自动挖掘配伍关系方法,以基础数据总库为依托,其特征在于,包括以下步骤:
步骤a:根据所述基础数据总库建立检索模块,对所述基础数据进行检索,自动生成检索表达式并存储,并生成检索数据库;
步骤b:根据所述检索模块建立识别阅读模块,对所述检索数据库中的指定字段进行文本阅读,查找出若干个关键词,并生成关键词库;
步骤c:根据所述检索模块和所述识别阅读模块建立筛选关键词模块,对所述关键词库中的若干个所述关键词进行筛选,并形成布尔逻辑表达式;
步骤d:根据所述检索模块、所述识别阅读模块和所述筛选关键词模块建立语义数据库生成模块,根据所述布尔逻辑表达式,在所述基础数据总库中搜索,并生成新数据库;
步骤e:对所述新数据库进行数据挖掘形成挖掘数据;以及
步骤f:对所述挖掘数据进行结果表达和解释。
6.根据权利要求5所述的自动挖掘配伍关系方法,其特征在于:
其中,所述步骤c,还具有:
步骤c-1:将若干个所述关键词通过所述检索模块进行逐个检索,选出高频或相关系数高的若干个所述关键词,计算出高频或相关系数高的若干个所述关键词的组合重叠情况,分析用词习惯和语言规律;以及
步骤c-2:将人工识别去除的去除关键词记录下来,并生成弃用规则。
7.根据权利要求5所述的自动挖掘配伍关系方法,其特征在于:
其中,所述检索模块包含搜索界面,通过人工输入检索关键词。
8.根据权利要求5所述的自动挖掘配伍关系方法,其特征在于:其中,所述识别阅读模块通过切词、断词、组词的阅读过程,生成一组所述关键词库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海中医药大学,未经上海中医药大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510035590.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种监测视频更新的方法和装置
- 下一篇:数据存储方法及装置