[发明专利]医学特定指称及其关系的抽取方法、系统及装置在审
申请号: | 202010922664.9 | 申请日: | 2020-09-04 |
公开(公告)号: | CN112036171A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 顾大中;吴汇哲 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 袁文婷;张娓娓 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医学 特定 指称 及其 关系 抽取 方法 系统 装置 | ||
1.一种医学特定指称及其关系的抽取方法,应用于电子装置,其特征在于,所述方法包括:
提取医学样本文献中的实体指称,并对所述实体指称进行语法位置标注;
根据所述实体指称的语法位置标注确定各实体指称之间的路径关系,并根据所述路径关系生成候选抽取规则集;
根据预设过滤规则对所述候选抽取规则集内的各候选抽取规则进行过滤;
通过预设的验证模型对过滤后的候选抽取规则集进行验证,以确定最终抽取规则;
利用所述最终抽取规则对获取的待识别文献进行处理,以提取所述待识别文献中的医学特定指称及其相互作用关系。
2.根据权利要求1所述的医学特定指称及其关系的抽取方法,其特征在于,所述实体指称包括身体部分指称和医学特定指称;并且,所述提取医学样本文献中的实体指称包括:
使用预设的命名实体识别系统对所述医学样本文献进行处理,以提取所述医学样本文献中的所述身体部位指称和医学特定指称。
3.根据权利要求1所述的医学特定指称及其关系的抽取方法,其特征在于,所述根据所述实体指称的语法位置标注确定各实体指称之间的路径关系包括:
根据语法依存树规则确定各所述身体部位指称和各所述医学特定指称之间的路径关系;其中,
各所述身体部位指称和各所述医学特定指称之间均确定有唯一一条所述路径关系。
4.根据权利要求2所述的医学特定指称及其关系的抽取方法,其特征在于,所述候选抽取规则集存储在区块链中,根据所述路径关系生成所述候选抽取规则集的过程包括:
根据预设的路径关系类型分类规则对获取的所有路径关系进行整合分类,并确定各类型路径关系的路径总数和路径长度;
将各类型路径关系作为所述候选抽取规则保存至预设数据库以形成候选抽取规则集。
5.根据权利要求1所述的医学特定指称及其关系的抽取方法,其特征在于,所述根据预设过滤规则对所述候选抽取规则集内的各候选抽取规则进行过滤的过程包括:
删除所述候选抽取规则集内的路径长度大于3的候选抽取规则以及路径总数小于5的候选抽取规则。
6.根据权利要求1所述的医学特定指称及其关系的抽取方法,其特征在于,所述预设的验证模型为规则评分模型;并且,所述规则评分模型包括:
嵌入层,用于将所述候选抽取规则的路径关系中的各依存关系转化为依存向量;
特征提取层,用于根据所述依存向量提取所述候选抽取规则的路径关系中的局部特征;
评分层,用于根据所述局部特征对所述候选抽取规则进行评分。
7.根据权利要求1所述的医学特定指称及其关系的抽取方法,其特征在于,所述通过预设的验证模型对过滤后的候选抽取规则集进行验证,以确定最终抽取规则包括:
若所述验证模型对所述候选抽取规则的评分大于预设评分阈值,则所述候选抽取规则通过验证;
将通过验证的候选抽取规则进行整合,以形成所述最终抽取规则。
8.一种医学特定指称及其关系的抽取系统,其特征在于,所述系统包括:
指称标注单元,用于提取医学样本文献中的实体指称,并对所述实体指称进行语法位置标注;
路径确定单元,用于根据所述实体指称的语法位置标注确定各实体指称之间的路径关系,并根据所述路径关系生成候选抽取规则集;
过滤单元,用于根据预设过滤规则对所述候选抽取规则集内的各候选抽取规则进行过滤;
验证单元,用于通过预设的验证模型对过滤后的候选抽取规则集进行验证,以确定最终抽取规则;
规则使用单元,用于利用所述最终抽取规则对获取的待识别文献进行处理,以提取所述待识别文献中的医学特定指称及其相互作用关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010922664.9/1.html,转载请声明来源钻瓜专利网。