[发明专利]一种基于中文电子病历的知识图谱构建方法在审
申请号: | 202111026407.8 | 申请日: | 2021-09-02 |
公开(公告)号: | CN113688255A | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 李丽双;袁光辉;唐婧尧 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/28;G06F40/216;G06F40/295;G16H10/60 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 中文 电子 病历 知识 图谱 构建 方法 | ||
本发明属于自然语言处理领域,提供了一种基于中文电子病历的知识图谱构建方法。当前已构建的大多数知识图谱所包含的病历语料数目较少,知识图谱规模不大,且往往只适用于单一科室或疾病,通用性较差,而一些做的比较完善的病历知识图谱又需要大量的人工参与,费时费力、可扩展性差。电子病历不同科室和疾病之间由于描述疾病类别不同,所对应的一系列检查和治疗等语言环境也有所不同,不同疾病类别所对应的医生习惯用语不同,这些特点使得一些深度学习方法效果下降,知识图谱构建框架不易扩展。针对上述存在的问题制定了基于中文电子病历的知识图谱数据分析处理方法、语料标注流程规范、及实体关系抽取方案。
技术领域
本发明属于自然语言处理领域,涉及一种针对中文电子病历(EMR,ElectronicMedical Record)文本进行知识图谱构建的方法,具体是指一种基于中文电子病历的知识图谱构建方法。
背景技术
知识图谱最早由Google公司在2012年提出,并应用于搜索引擎中(SINGHALA.Official Google Blog:Introducing the Knowledge Graph:things,not strings[R].Official Google Blog,2012)。在通用领域,知识图谱往往以三元组实体,关系,实体的形式存储(WEIKUM G,THEOBALD M.From information to knowledge:harvestingentities and relationships from web sources[C].Proceedings of the twenty-ninth ACM SIGMOD-SIGACT-SIGART symposium on Principles of database systems,Indianapolis,2010:65-76),实体可以是现实世界中的任何具体的事物,比如:人名、地名、机构名等,关系可以是实体的属性,也可以用来表达实体间的语义联系。目前通用领域已构建了很多比较成熟的知识图谱,如国外的Freebase(BOLLACKER K,EVANS C,PARITOSH P,etal.Freea collaboratively created graph database for structuring humanknowledge[C].Proceedings of the 2008ACM SIGMOD international conference onManagement of data,Vancouver,2008:1247-1250)、Dbpedia(LEHMANN J,ISELE R,JAKOBM,et al.DBpedia-A large-scale,multilingual knowledge base extracted fromWikipedia[J].Semantic Web,2015,6(2):167-195)、Yago(Suchanek F M,Kasneci G,Weikum G.Yago:a core of semantic knowledge[C].Proceedings of the 16thinternational conference on World Wide Web,Banff,2007:697-706)等,国内如百度的“知心”,搜狗的“知立方”等。通用领域的知识图谱更加注重信息的广度,所构造的知识图谱需要覆盖足够多的领域,一般构建所需的知识源来自于一些半结构化的数据网站,如百度百科、维基百科等,或者来自于社区众包。相较于通用领域,垂直领域的知识图谱更注重知识的深度,它的构建语料往往是依赖于某些专业领域的数据,且常常具有明确的构建目的,专业性和针对性较强。目前知识图谱已被应用于农业、金融、教育等各个领域,而医学领域更是最具有潜力和应用最广泛的领域之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111026407.8/2.html,转载请声明来源钻瓜专利网。