[发明专利]一种疾病术语核心词汇的标识方法及装置在审
申请号: | 201910950981.9 | 申请日: | 2019-10-08 |
公开(公告)号: | CN110851595A | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 任禾 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/284;G06F40/247 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 疾病 术语 核心 词汇 标识 方法 装置 | ||
1.一种疾病术语核心词汇的标识方法,其特征在于,包括:
采用ICD10中的中文词汇构建目标分词词典;
当接收到对目标词条的识别请求时,根据所述构建的目标分词词典对所述目标词条进行分词,其中,所述目标词条为疾病术语相关的词条;
根据所述目标词条进行分词后的词汇确定所述目标词条的核心词汇。
2.如权利要求1所述的方法,其特征在于,根据所述目标词条进行分词后的词汇确定所述目标词条的核心词汇,包括:
获取所述目标词条进行分词后的词汇的数目;
根据所述目标词条进行分词后的词汇的数目确定所述目标词条的核心词汇。
3.如权利要求2所述的方法,其特征在于,根据所述目标词条进行分词后的词汇的数目确定所述目标词条的核心词汇,包括:
所述目标词条进行分词后的词汇的数目为零时,确定所述目标词条本身为所述目标词条的核心词汇;
当所述目标词条进行分词后的词汇只有一个时,确定对所述目标词条分词后的词汇为所述目标词条的核心词汇。
4.如权利要求3所述的方法,其特征在于,根据所述目标词条进行分词后的词汇的数目确定所述目标词条的核心词汇,包括:
当所述目标词条进行分词后的词汇的数目为多个时,比较各个词汇的长度;
当长度最长的词汇只有一个时,确定长度最长的词汇为所述目标词条的核心词汇。
5.如权利要求4所述的方法,其特征在于,根据所述目标词条进行分词后的词汇的数目确定所述目标词条的核心词汇,还包括:
当长度最长的词汇为多个时,根据长度最长的多个词汇生成目标词条的核心词汇候选集;
显示所述目标词条的核心词汇候选集;
当接收到对所述目标词条的核心词汇候选集中目标词汇的选择操作时,确定所述选择操作对应的目标词汇为所述目标词条的核心词汇。
6.一种疾病术语核心词汇的标识装置,其特征在于,包括:
构建模块,用于采用ICD10中的中文词汇构建目标分词词典;
分词模块,用于当接收到对目标词条的识别请求时,根据所述构建的目标分词词典对所述目标词条进行分词,其中,所述目标词条为疾病术语相关的词条;
确定模块,用于根据所述目标词条进行分词后的词汇确定所述目标词条的核心词汇。
7.如权利要求6所述的装置,其特征在于,确定模块,包括:
获取子模块,用于获取所述目标词条进行分词后的词汇的数目;
确定子模块,用于根据所述目标词条进行分词后的词汇的数目确定所述目标词条的核心词汇。
8.如权利要求7所述的装置,其特征在于,确定子模块,包括:
第一确定单元,用于所述目标词条进行分词后的词汇的数目为零时,确定所述目标词条本身为所述目标词条的核心词汇;
第二确定单元,用于当所述目标词条进行分词后的词汇只有一个时,确定对所述目标词条分词后的词汇为所述目标词条的核心词汇。
9.如权利要求8所述的装置,其特征在于,确定子模块,包括:
比较单元,用于当所述目标词条进行分词后的词汇的数目为多个时,比较各个词汇的长度;
第三确定单元,用于当长度最长的词汇只有一个时,确定长度最长的词汇为所述目标词条的核心词汇。
10.如权利要求9所述的装置,其特征在于,确定子模块,包括:
生成单元,用于当长度最长的词汇为多个时,根据长度最长的多个词汇生成目标词条的核心词汇候选集;
显示单元,用于显示所述目标词条的核心词汇候选集;
第四确定单元,用于当接收到对所述目标词条的核心词汇候选集中目标词汇的选择操作时,确定所述选择操作对应的目标词汇为所述目标词条的核心词汇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910950981.9/1.html,转载请声明来源钻瓜专利网。