[发明专利]一种基于通用语言特征的生物医学命名实体识别方法在审
申请号: | 201910235496.3 | 申请日: | 2019-03-27 |
公开(公告)号: | CN109977229A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 李冬;其他发明人请求不公开姓名 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27;G16H10/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于通用语言特征的生物医学命名实体识别方法与系统。包括步骤:对生物医学文本进行命名实体标注;对生物医学文本进行通用语言特征的抽取;选择上下文窗口大小并使用通用语言特征构建特征模板;将标注好的语料以及格式化特征模板输入到条件随机场中进行模型训练,得到生物医学领域命名实体识别的条件随机场模型,并利用该模型对待识别的生物医学文本进行生物医学命名实体的识别,最终输出识别结果;使用B/S架构搭建在线生物医学命名实体识别系统。本发明的基于通用语言特征的生物医学命名实体识别方法及系统,在一定程度上提高了生物医学领域命名实体识别的效果,提高了系统的通用性和使用上的便利。 | ||
搜索关键词: | 命名实体 生物医学 通用语言 生物医学领域 特征模板 文本 标注 条件随机场模型 格式化 模型训练 识别系统 输出识别 特征构建 语料 抽取 便利 机场 | ||
【主权项】:
1.一种用于生物医学领域的命名实体识别方法,其特征在于,包括:步骤1、对生物医学文本进行标注,给每个单词分配不同的标签,采用BIEOS进行标记;步骤2、对生物医学文本进行预处理,对输入的生物医学文本中的每个单词进行通用语言特征抽取;步骤3、选择上下文窗口大小,根据预处理的生物医学文本来构建特征模板;步骤4、构建条件随机场模型,将经过步骤2得到的生物医学文本和步骤3所得到的特征模板输入条件随机场模型中进行训练,得到生物医学领域条件随机场模型,并利用该模型对待识别的生物医学文本中的生物医学命名实体进行标注,输出标注结果;步骤5、从步骤4所得的标注结果中还原出所识别的生物医学命名实体;步骤6、基于B/S架构的图形交互在线系统,在线进行生物医学文本的命名实体识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910235496.3/,转载请声明来源钻瓜专利网。
- 上一篇:电网设备缺陷文本的信息辨识方法
- 下一篇:适合自适应教学的选择题错因分析方法