[发明专利]一种基于深度信念网络的中药不良作用识别方法在审
申请号: | 201910574252.8 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110277175A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 李巧勤;刘勇国;蒋羽;杨尚明;何家欢;蔡茁;李杨 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G16H70/40 | 分类号: | G16H70/40;G06N3/04 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 陈选中 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 不良作用 中药 信念网络 中药毒副作用 实体数据库 人工智能 关系挖掘 经济损耗 实体识别 提取药物 传统的 方法学 构建 归纳 研究 优化 统一 | ||
本发明公开了一种基于深度信念网络的中药不良作用识别方法。本发明能够对中药不良作用进行有效的整理和归纳,有助于中药不良作用实体数据库构建。并将传统的中药毒副作用研究与人工智能方法进行有机的统一,实现对于药物不良作用实体的全自动提取,减少人工提取药物不良作用的时间以及经济损耗,实现了在中药不良作用实体识别研究方法学上的优化。后期,本发明也可以根据不同中药文献集,实现针对特定中药的不良作用识别和关系挖掘,可以有效适用于各种中医药文献,不需要重新训练深度信念网络模型,可以直接从输入中药文献中识别并提取出药物不良作用实体。
技术领域
本发明涉及药品不良作用识别技术领域,具体涉及一种基于深度信念网络的中药不良作用识别方法。
背景技术
中药在我国有着悠久的应用历史,是我国古代人们在长期生活与医疗实践当中不断总结出来的。中医治病常以方剂为单位,研究方剂对疾病的作用机制有助于解释中医方剂配伍以及治病的科学性。而方剂是由多个单位药物组成,绝大多数的药物具有很好的药物安全性。与西药相比,中药具有伤害小且不易产生药物耐受性及依赖性的特点,但中药也有可能会对患者产生一些不良作用。因此,从海量的中药文献中识别并提取出中药的不良作用,对增加中医临床疗效、减少对患者的不良反应等多个方面都能起到极其重要的推动作用。
随着自然语言处理技术的发展,命名实体识别可用于从大量文献提取某类实体。目前,命名实体识别方法主要包括基于词典、基于规则、基于统计学模型、基于深度学习等四种策略。基于词典和规则的识别方法通常需要人工制定词典以及规则,通过总结实体本身具有的规则和其上下文语境规则来将实体提取出来,该方法可以很好的适应中药文本中不良作用实体表达方式随意的特点。但由于中药不良作用没有标准词库,需要自己构建,因此该方法难以实现自动化识别、且效果往往较差。基于统计学模型的识别方法包括HMM、MEMM和CRF等机器学习模型,这类识别方法适用于对反复出现的实体进行识别,常被用于从文本中提取人名、地名等短语结构,而中药的不良作用不同于一般实体,其表达方式多种多样,很难将其全部识别出来,因此该种方法并不完全适合于中药不良作用的实体识别任务。此外,一些研究尝试将实体识别任务转化为分类问题,这种方法首先需要有一部分语料作为分类模型的训练语料,语料的质量在一定程度上影响着分类结果的好坏。目前采用深度学习模型来进行实体识别工作往往能取得更好的实验结果,克服了识别结果对人工语料标注精度的依赖性,相比其他实体识别方法具有更好的精确度。
经大量调研发现,上述命名实体识别方法在西药不良反应的实体识别领域有开展研究工作,且主要针对英文文献。目前基于中药文献的中药不良反应实体识别研究工作相当匮乏,均依赖于人工方法进行不良反应实体的提取,这主要是由于中药不良反应的文本描述随意性,长度、句式等相对不固定。这种人工标注法虽然可以对实体准确提取,但难以实现自动化,需要消耗较大的人力成本,难以对日益增加的中药文献进行有效利用。目前结合文本挖掘技术的药物不良作用识别工作均应用在西药领域,且主要针对英文文献开展,而对于中药不良作用的实体识别仍然停留在人工层面;同时,基于词典、规则或特定统计学模型的方法,通常需要消耗较大的人力成本进行语料库的构建,而且这些方法在随意性较强的中药文献中难以准确提取出不良作用描述,识别效果通常较差且耗时较长。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于深度信念网络的中药不良作用识别方法解决了难以准确提取出不良作用描述,识别效果通常较差且耗时较长的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于深度信念网络的中药不良作用识别方法,包括以下步骤:
S1、获取包含中药不良作用实体的文档集;
S2、对包含中药不良作用实体的文档集进行预处理,得到预处理后的文档集;
S3、根据预处理后的文档集构建标准语料库;
S4、基于标准语料库对深度信念网络模型进行训练,得到训练好的深度信念网络模型和最佳字符概率阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910574252.8/2.html,转载请声明来源钻瓜专利网。