[发明专利]一种疾病术语核心词汇的标识方法及装置在审
申请号: | 201910950981.9 | 申请日: | 2019-10-08 |
公开(公告)号: | CN110851595A | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 任禾 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/284;G06F40/247 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 疾病 术语 核心 词汇 标识 方法 装置 | ||
本发明公开了一种疾病术语核心词汇的标识方法及装置,用以使疾病术语的核心词汇的确定更加精确。所述方法包括:采用ICD10中的中文词汇构建目标分词词典;当接收到对目标词条的识别请求时,根据所述构建的目标分词词典对所述目标词条进行分词,其中,所述目标词条为疾病术语相关的词条;根据所述目标词条进行分词后的词汇确定所述目标词条的核心词汇。采用本发明所提供的方案,由于目标词条是基于目标分词词典分词的,而目标分词词典由于采用ICD10中的中文词汇构建的,所以,对目标词条分词时结合了医疗领域的实际特点,提升了核心词汇确定结果的精确度。
技术领域
本发明涉及互联网技术领域,特别涉及一种疾病术语核心词汇的标识方法及装置。
背景技术
国际疾病分类(International Classification of Diseases,ICD),是WHO制定的国际统一的疾病分类方法,其根据疾病的病因、病理、临床表现和解剖位置等特性,将疾病分门别类,使其成为一个有序的组合,并用编码的方法来表示的系统。全世界通用的是第10次修订本《疾病和有关健康问题的国际统计分类》,仍保留了ICD的简称,并被统称为ICD10。
而在实际应用中,在医生填写的病人病历中的疾病术语有可能与标准疾病名称不一致,这样就无法得到对应的疾病编码,因此,需要对疾病术语进行分析,来得到疾病名称中的核心词汇,在现有技术中,采用传统的句法分析的方法,对输入的疾病进行句法分析,将句子的中心成分作为疾病的核心词汇,但是,这样的方法,是单纯从句法分析角度考虑,导致分析出来的句子核心词汇粒度太细,容易丢失关键信息。例如:隐源性肝硬化这个疾病,采用现有技术,会把“硬化”作为核心词汇,而实际上肝硬化是不能被拆解的,应该把肝硬化作为核心词汇,因此,如何结合医疗领域的实际特点,使疾病术语的核心词汇的确定更加精确,是一亟待解决的技术问题。
发明内容
本发明提供一种疾病术语核心词汇的标识方法及装置,用以使疾病术语的核心词汇的确定更加精确。
本发明提供一种疾病术语核心词汇的标识方法,包括:
采用ICD10中的中文词汇构建目标分词词典;
当接收到对目标词条的识别请求时,根据所述构建的目标分词词典对所述目标词条进行分词,其中,所述目标词条为疾病术语相关的词条;
根据所述目标词条进行分词后的词汇确定所述目标词条的核心词汇。
本发明的有益效果在于:采用ICD10中的中文词汇构建目标分词词典;当接收到对目标词条的识别请求时,根据所述构建的目标分词词典对所述目标词条进行分词,其中,所述目标词条为疾病术语相关的词条;根据所述目标词条进行分词后的词汇确定所述目标词条的核心词汇;由于目标词条是基于目标分词词典分词的,而目标分词词典由于采用ICD10中的中文词汇构建的,所以,对目标词条分词时结合了医疗领域的实际特点,提升了核心词汇确定结果的精确度。
在一个实施例中,根据所述目标词条进行分词后的词汇确定所述目标词条的核心词汇,包括:
获取所述目标词条进行分词后的词汇的数目;
根据所述目标词条进行分词后的词汇的数目确定所述目标词条的核心词汇。
在一个实施例中,根据所述目标词条进行分词后的词汇的数目确定所述目标词条的核心词汇,包括:
所述目标词条进行分词后的词汇的数目为零时,确定所述目标词条本身为所述目标词条的核心词汇;
当所述目标词条进行分词后的词汇只有一个时,确定对所述目标词条分词后的词汇为所述目标词条的核心词汇。
在一个实施例中,根据所述目标词条进行分词后的词汇的数目确定所述目标词条的核心词汇,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910950981.9/2.html,转载请声明来源钻瓜专利网。