首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]医学文本结构化方法、装置、计算机设备及存储介质在审

申请号：	202010935255.2	申请日：	2020-09-08
公开（公告）号：	CN112016274A	公开（公告）日：	2020-12-01
发明（设计）人：	朱威;何义龙	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06F40/151	分类号：	G06F40/151;G06F40/30;G06F40/166
代理公司：	深圳众鼎专利商标代理事务所(普通合伙) 44325	代理人：	姚章国
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	医学文本结构方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种医学文本结构化方法，其特征在于，包括：

抓取待处理医学源文本中整段的非结构化医学知识文本；

识别所述非结构化医学知识文本中所有的标点符号，按照所述标点符号将所述非结构文本拆分成多个第一特征语句；

将所述第一特征语句输入至预设语言识别模型后，获取与每一个所述第一特征语句对应的一个语义特征向量；

将所有的所述语义特征向量输入至预设文章语义识别模型后，获取所述预设文章语义识别模型输出的第二特征语句；所述第二特征语句中包含所述预设文章语义识别模型根据所述非结构化医学知识文本的上下文关联关系确定的预设数量的待分割位置；

调用出所述待处理医学源文本的第一代码文件，从所述第一代码文件中查询所述第二特征语句，并在第一代码文件中与所述第二特征语句的待分割位置对应的位置插入分割符号之后，得到第二代码文件；

运行所述第二代码文件，以在所述待处理医学源文本上展示与所述非结构化医学知识文本对应的结构化医学知识文本。

2.根据权利要求1所述的医学文本结构化方法，其特征在于，所述抓取待处理医学源文本中整段的非结构化医学知识文本之后，还包括：

通过预设自然语言处理模型对所述非结构化医学知识文本进行检测，对所述非结构化中存在错误的词语进行标记并获取标记结果；

调用出所述待处理医学源文本的第一代码文件，根据所述标记结果对所述第一代码文件中存在错误的词语进行修正处理，得到第三代码文件，并对所述第三代码文件进行运行后，得到修正完成后的非结构化医学知识文本。

3.根据权利要求1所述的医学文本结构化方法，其特征在于，所述预设语言识别模型为bert模型；

所述将所述第一特征语句输入至预设语言识别模型后，获取与每一个所述第一特征语句对应的一个语义特征向量，包括：

将所述第一特征语句输入至所述bert模型后，通过所述bert模型查询所述第一特征语句中各个字的字向量；

通过所述bert模型中的Attention机制选取所述第一特征语句中一个所述字向量作为Query向量，并将所述第一特征语句其他所述字向量作为Key向量；

对所述Query向量与各个所述Key向量进行相似度计算后得到权重系数，并通过所述权重系数对所述Query向量和所述Key向量对应的Value值进行加权运算，得到所述Attention机制输出与所述Query向量对应的第一增强语义特征向量；

通过所述bert模型中的多个推叠Transformer Encoder对所述第一增强语义特征向量进行线性转换，得到第二增强语义特征向量；

将与所述第一特征语句中每个字的字向量所对应的第二增强语义特征向量进行组合后，得到与所述第一特征语句对应的所述语义特征向量。

4.根据权利要求1所述的医学文本结构化方法，其特征在于，所述在第一代码文件中与所述第二特征语句的待分割位置对应的位置插入分割符号，得到第二代码文件之后，还包括：

根据预设样式格式调用出对应的层叠样式表，并将所述层叠样式表嵌套至所述第二代码文件中。

5.根据权利要求1所述的医学文本结构化方法，其特征在于，所述预设文章语义识别模型为LSTM模型；

所述将所有的所述语义特征向量输入至预设文章语义识别模型之后，包括：

通过所述LSTM模型中的遗忘门限选择丢弃信息；

通过所述LSTM模型中的输入门限和所述丢弃信息从所述语义特征向量中选择所需信息；

通过所述LSTM模型中的输出门限和所述所需信息输出所述第二特征语句。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于平安科技（深圳）有限公司，未经平安科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010935255.2/1.html，转载请声明来源钻瓜专利网。

上一篇：用于开关按键的组装装置
下一篇：分诊数据处理方法、装置、计算机设备及存储介质

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top