[发明专利]基于分词编码自动构建医学术语映射关系的方法以及系统在审

专利信息
申请号: 201510922676.0 申请日: 2015-12-11
公开(公告)号: CN105574103A 公开(公告)日: 2016-05-11
发明(设计)人: 吕旭东;段会龙;陈佩佩;甘辰希 申请(专利权)人: 浙江大学
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27;G06F19/00
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 解明铠
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种自动构建医学术语映射关系的方法和系统,方法包括在字典A术语和字典B术语之间建立映射关系,具体步骤为:(1)将每条样本术语划分为主字段和属性字段;(2)将步骤(1)得到的主字段和编码建立主字段表;将常用汉字以及属性字段建立分词字典;(3)对所述主字段表中的语汇进行中文分词;(4)对字典A术语进行中文分词;(5)计算样本术语主字段和字典A术语主字段的两两相关度;(6)按照相关度的高低对样本术语主字段和字典A术语主字段进行匹配以及编码;(7)进行字典B术语主字段的编码;针对具有相同主字段编码的字典A和字典B术语构建映射关系。本发明解决了人工术语映射效率低,难以形成医疗信息共享的问题。
搜索关键词: 基于 分词 编码 自动 构建 医学 术语 映射 关系 方法 以及 系统
【主权项】:
一种基于分词编码自动构建医学术语映射关系的方法,包括在字典A术语和字典B术语之间建立映射关系,其特征在于,具体步骤为:(1)选取样本术语,将每条样本术语划分为若干字段,并将每个字段的语汇分别进行编码,每条样本术语中的字段包括一个主字段,其余为属性字段;(2)将步骤(1)得到的主字段和编码存入数据库建立主字段表;将常用汉字以及步骤(1)中得到的属性字段的语汇建立分词字典,对分词字典中的每个单字或词汇都标注词性、词频;(3)基于所述分词字典对所述主字段表中的语汇进行中文分词,得到词汇以及对应的词汇权重;(4)基于所述分词字典对字典A术语进行中文分词,得到词汇以及对应的词性和词汇权重以及词频,依照词性将分词结果划为分别隶属于主字段和属性字段的两部分;(5)利用步骤(3)、步骤(4)的结果计算样本术语主字段和字典A术语主字段的两两相关度;(6)按照相关度的高低对样本术语主字段和字典A术语主字段进行匹配,对字典A术语依照匹配结果赋以相应的编码;(7)针对字典B术语重复步骤(4)~步骤(6),得到字典B术语的编码;针对字典A和字典B中具有相同编码的术语构建映射关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510922676.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top