[发明专利]医疗同义词的确定方法和装置在审
申请号: | 201710152584.8 | 申请日: | 2017-03-15 |
公开(公告)号: | CN106933806A | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | 邓侃;孙风磊;邱鹏飞;李丕勋 | 申请(专利权)人: | 北京大数医达科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 孟金喆,胡彬 |
地址: | 100193 北京市海淀区东北旺*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 同义词 确定 方法 装置 | ||
技术领域
本发明实施例涉及计算机应用技术领域,尤其涉及一种医疗同义词的确定方法和装置。
背景技术
病历是医务人员对患者疾病的发生、发展、转归,进行检查、诊断、治疗等医学活动过程所作的文字记录。病历既是临床实践工作的总结,又是探索疾病规律及处理医学纠纷的法律依据,是国家的宝贵财富。
在临床医学中,有效整理病历,从中挖掘医生临床经验,对医学进步具有重大意义。但是,由于医务人员录入病历的时候,经常混杂大量不规范的同义词表述、缩写用法,甚至还有错别字,而且使用的句型不仅多样化,还可能不规范,给病历整理工作带来极大不便。若单纯依靠人工整理的方式,工作量较大,且效率较低。因此,如何识别病历中的各项内容的准确表述显得尤为重要。
发明内容
本发明提供了一种医疗同义词的确定方法和装置,以解决现有的病历中表述不规范而造成的病历中的内容识别困难的问题。
第一方面,本发明实施例提供了一种医疗同义词的确定方法,该方法包括:
获取病历样本中至少一个自然语句,并对所述自然语句进行分词;
在预先建立的医学知识库中,获取与分词后的词语所对应的医学标准化用语,作为所述词语的候选同义词;
根据同一病历样本中各词语的关联关系以及所述医学知识库中各所述医学标准化术语之间的拓扑关系,从所述候选同义词中确定出各所述词语的目标同义词。
第二方面,本发明实施例还提供了一种医疗同义词的确定装置,该装置包括:
病历分词模块,用于获取病历样本中至少一个自然语句,并对所述自然语句进行分词;
候选同义词获取模块,用于在预先建立的医学知识库中,获取与分词后的词语所对应的医学标准化用语,作为所述词语的候选同义词;
目标同义词确定模块,用于根据同一病历样本中各词语的关联关系以及所述医学知识库中各所述医学标准化术语之间的拓扑关系,从所述候选同义词中确定出各所述词语的目标同义词。
本发明实施例的技术方案,通过对病历样本中的自然语句进行分词,进而在医学知识库中获取分词后各词语对应的各医学标准化术语,确定出各词语可能的候选同义词,进而通过同一病历中与各词语相关的词语,以及医学知识库中与各医学标准化术语相关的各医学标准化术语,从而进一步从各候选的各医学标准化术语中,更加精确地确定出各词语对应的医学标准化用语,即从候选同义词中确定出目标同义词,不仅解决了现有的病历中表述不规范而造成的病历中的内容识别困难的问题,能够结合医学知识,更加准确、高效地确定出各词语的目标同义词。
附图说明
为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
图1为本发明实施例一所提供的一种医疗同义词的确定方法的流程示意图;
图2A为本发明实施例二所提供的一种医疗同义词的确定方法的流程示意图;
图2B为本发明实施例二所提供的一种字向量生成方法的流程示意图;
图3为本发明实施例三所提供的一种医疗同义词的确定装置的结构示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一所提供的一种医疗同义词的确定方法的流程示意图。如图1所示,本实施例的方法可以由医疗同义词的确定装置来执行,该装置可通过硬件和/或软件的方式实现,并一般可独立的配置在服务器中或者由终端和服务器配合实现本实施例的方法。,
本实施例的方法具体包括:
S110、获取病历样本中至少一个自然语句,并对所述自然语句进行分词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大数医达科技有限公司,未经北京大数医达科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710152584.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大数据集中生物事件触发词的识别方法
- 下一篇:备忘录事件提醒方法及系统