[发明专利]医学文本识别方法及装置、语句识别模型训练方法及装置有效
申请号: | 201811239336.8 | 申请日: | 2018-10-23 |
公开(公告)号: | CN109299467B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 张奇 | 申请(专利权)人: | 北京惠每云科技有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/242;G06F16/35 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 苏胜 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了医学文本识别方法及装置、语句识别模型训练方法及装置,涉及医学领域。本发明提供的医学文本识别方法,采用模型识别的方式,首先获取到了需要进行识别的医学文本,之后对医学文本中的待识别语句进行结构化提取,进而得到了该待识别语句的多个待识别特征词语,之后将待识别特征词语所组成的待识别特征组和可能的结果(参考结果)同时输入到语句识别模型中,使得该模型输出待识别特征组与每个参考结果的相似度,最后,将与待识别特征组的相似度最高的参考结果作为待识别语句的识别结果输出,即可完成医学文本的识别。 | ||
搜索关键词: | 医学 文本 识别 方法 装置 语句 模型 训练 | ||
【主权项】:
1.一种医学文本识别方法,其特征在于,包括:获取医学文本中的待识别语句;对待识别语句进行结构化提取,以确定包含有多个待识别特征词语的待识别特征组;将待识别特征组和多个参考结果均作为输入量,输入到训练完成的语句识别模型中,以确定待识别特征组与每个参考结果的相似度;所述语句识别模型是将训练特征组和对应的参考结果作为输入量,进行训练后的得到的;训练特征组是由多个训练词语所组成的;所述参考结果是根据Loinc词典中的一个条目确定的;将与待识别特征组的相似度最高的参考结果作为待识别语句的识别结果输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京惠每云科技有限公司,未经北京惠每云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811239336.8/,转载请声明来源钻瓜专利网。