[发明专利]一种基于语义树的甲状腺超声报告结构化扫描方法有效

专利信息
申请号: 201910536642.6 申请日: 2019-06-20
公开(公告)号: CN110399450B 公开(公告)日: 2023-06-23
发明(设计)人: 陈德华;黄美花菊;周建桥;朱立峰 申请(专利权)人: 东华大学;上海交通大学医学院附属瑞金医院
主分类号: G06F40/103 分类号: G06F40/103;G06F40/30;G06F40/289;G16H15/00;G16H70/00
代理公司: 上海申汇专利代理有限公司 31001 代理人: 翁若莹;柏子雵
地址: 201600 上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于语义树的甲状腺超声报告结构化扫描方法,通过三个步骤进行实现:1)甲状腺超声文本数据预处理,包括分块分句分词、同义词替换;2)语义树定位,相应的规则结合dewey编码进行结点定位,标记,删除等不同操作;3)记录所有结点,输出结构化结果。在甲状腺超声报告中,主要关注点在于甲状腺和甲状腺病灶的病变情况,所以本发明立足于解剖学的基础构建了基于甲状腺超声领域的语义树。通过扫描报告与语义树作相应匹配,将文本报告结构化,从中提取有用信息可用于后续研究,从而更好地辅助医生进行病情诊断和治疗。
搜索关键词: 一种 基于 语义 甲状腺 超声 报告 结构 扫描 方法
【主权项】:
1.一种基于语义树的甲状腺超声报告结构化扫描方法,其特征在于,包括以下步骤:步骤1、前期准备工作,包括以下步骤:步骤1.1、建立适用于甲状腺超声领域的自定义词典,加入jieba分词词库;步骤1.2、建立同义词表,相同意思的不同表达的词语映射到对应词语,该词语能够在语义树有所体现;步骤1.3、建立部位词列表,存储所有部位词,部位词指的是定位词,通过部位词区别拥有相同的属性的不同的组织结构;步骤2、输入文本预处理步骤2.1、规范标点符号,区分中英文输入标点;步骤2.2、简单分块,在每块句首补上上一次出现的顶部部位词,利于提高扫描算法准确度;步骤3、分句,属性分配上不同的符号需要做不同的处理;步骤4、分词利用jieba分词包,将报告分词语形式;步骤5、排序短句中的部位词:扫描短句中的部位词/定位词,给不同层次的部位词赋权值,根据扫描结果对模糊匹配后每个部位词累计权值并求平均,得出短句内的部位词的权重,根据权重排序,使得部位词按照语义树顺序排序,利于后续扫描的准确性;步骤6、逐词扫描报告,与甲状腺超声语义树做匹配,包括以下步骤:步骤7、部位词匹配,标记及擦除:步骤7.1、若在子树匹配结果不为空,检测模糊匹配得到的列表中每个词语是否需要标记该词:若父结点被标记,则标记,若父结点未被标记,则判断父结点是否为抽象结点,若是则向上层递归判断,利用抽象结点特性进行选择,直至遇到已经标记父结点再逐级向下标记到该节点,否则该结点不标记,执行步骤9;步骤7.2、若子树匹配结果为空,则扫描整个语义树,并标记,根据编码可得此次标记编码长度最长子结点,与上一个词标记结果的编码最长结点作对比可确定本词是否为上一个词的上层结点,若是,则进行擦除标记工作,并确定新的子树范围,并执行步骤7.1,若是同级结点,根据相关的符号标志位,判断若为短句内并列关系的同级部位词,则标记并扩充部位词列表,即下一次扫描范围为以两个部位词为根节点的子树的并集。若不是在同一个短剧内出现的部位词,则进行擦除标记的工作,确定新的子树范围,并执行步骤7.1;步骤8、非部位词匹配,标记及擦除:步骤8.1、首先进行与步骤7.1相同的步骤,若本次没有结点被标记,则在最小已标记的部位词子树下,即使匹配的节点的父结点未被标记,只要父结点非部位词结点,该结点及其父结点也被标记,执行步骤9;步骤8.2、若子树匹配结果为空,则扫描整个语义树,并标记,根据编码可得此次标记编码长度最长子结点,与上一个词标记结果的编码最长结点作对比可确定本词是否为上一个词的子结点,若不是,则进行擦除标记工作,并确定新的子树范围,并执行步骤8.1;步骤9、记录本次扫描结果记录本次扫描结果,将本次需要添加的抽象结点和非抽象结点添加到输出子树的结点集合中,并将产生的抽象部位词记录,便于下一个待扫描词语的定位使用,直至所有词语扫描完毕,完善子树编码,输出子树。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学;上海交通大学医学院附属瑞金医院,未经东华大学;上海交通大学医学院附属瑞金医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910536642.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top