[发明专利]医学语言文本的处理方法、装置和存储介质在审
申请号: | 201811078563.7 | 申请日: | 2018-09-14 |
公开(公告)号: | CN109190125A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 侯丹;王爽;耿妍;翁钊 | 申请(专利权)人: | 广州达美智能科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/35;G16H10/00 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 510000 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医学语言 文本 存储介质 预先设置 词库 分词 词语 关键词提取 分类结果 工作效率 接收用户 医疗 分类 医学 | ||
本发明公开了一种医学语言文本的处理方法、装置和存储介质,包括如下步骤:接收用户输入的医学语言文本,并根据预先设置的分词词库对所述医学语言文本进行分词操作,得到与所述医学语言文本对应的词语;根据预先设置的医学词库对所述医学语言文本对应的词语进行关键词提取;对得到的多个所述关键词进行分类,获取对应的分类结果。本发明提高了处理医学语言文本的准确性、专业性,且不需要耗费医疗从业人员大量的精力,从而提高了医疗从业人员的工作效率。
技术领域
本发明涉及自然语言处理领域,尤其涉及一种医学语言文本的处理方法、装置和存储介质。
背景技术
随着医疗系统信息化建立和完善和医院计算机管理网络化,越来越多的医院采用电子病历,电子病历是用电子设备保存、管理、传输和重现的数字化的病人的医疗记录,取代手写纸张病历,但是由医疗人员通过自然语言的方式书写而成的病历,信息结构较为复杂,如何对大量这些信息进行处理和分析是医疗信息化建设的一个重要问题;同时计算机对人类能够读懂的文字信息并不能够理解,在人工智能时代并不能够进行运算,因此必须要将人类的语言转化为计算机能够看得懂的结构化数据库才能够加以后续的应用。
现有的处理医学语言文本的方法,大都依赖于医疗从业人员凭借经验对文本内容进行人工处理,需要医疗从业人员耗时艰难阅读病历后从中提取相关有价值的病例数据后进行表格填写,过程实质上是依靠医疗从业人员的医疗知识和医疗经验。这种人工处理的方式需要耗费医疗从业人员大量的精力,而且正确率难以得到保证。
为了减少人工处理造成的问题,现有技术提出了一种新的解决的方案:自然语言处理,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。现有的通过自然语言处理手段处理医学自然语言的方法中,大都依赖医学语言文本中词语的词频来匹配关键词,但是由于词频高的词语并不一定是医学语言文本中的关键词以及所用来检索的医学词库的专业性不够,造成处理结果准确性不高,从而误导医疗从业人员对医疗数据的阅读,增加了医疗从业人员的工作负担。
发明内容
本发明的主要目的在于提供一种医学语言文本的处理方法、装置和存储介质。本发明旨在提高处理医学语言文本的准确性、专业性,从而提高了医疗从业人员的工作效率。
为实现上述目的,本发明提供一种医学语言文本的处理方法,包括如下步骤:
接收用户输入的医学语言文本,并根据预先设置的分词词库对所述医学语言文本进行分词操作,得到与所述医学语言文本对应的词语;
根据预先设置的医学词库对所述医学语言文本对应的词语进行关键词提取;
对得到的多个所述关键词进行分类,获取对应的分类结果。
可选地,所述对得到的多个所述关键词进行分类,获取对应的分类结果的步骤之后包括:
根据关键词分类的结果,使所述关键词以类别形式展现在对应的病历文档中。
可选地,所述根据关键词分类的结果,使所述关键词以类别形式展现在对应的病历文档中的步骤包括:
根据关键词分类的结果,确定所述关键词对应的疾病种类;
根据所述疾病种类确定预先设置的病历文档库中与所述疾病种类对应的病历文档;
将所述关键词以类别形式填写到所述对应的中。
可选地,所述接收用户输入的医学语言文本,并根据预先设置的分词词库对所述医学语言文本进行分词操作,得到与所述医学语言文本对应的词语的步骤包括:
接收输入的医学语言文本,并将医学语言文本按段落、标点符号进行拆分,得到对应的语句;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州达美智能科技有限公司,未经广州达美智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811078563.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于分词的方法和装置
- 下一篇:词嵌入模型的训练方法及装置