[发明专利]语句生成在审
申请号: | 201910967589.5 | 申请日: | 2019-10-12 |
公开(公告)号: | CN111126024A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 许娟;P.沙马 | 申请(专利权)人: | 西门子医疗有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/284;G06F40/247;G06F16/58;G16H15/00;G06N3/08 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 陈晓;刘春元 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 生成 | ||
1.一种用于为放射学报告生成自然语言语句的方法,所述方法包括:
获得(102)一个或多个词(206),所述一个或多个词已经基于对放射学图像(202)的图像处理而被产生;
通过使用计算机实现的文本分析过程来分析(104)所述一个或多个词,用于生成表示放射学图像(202)的自然语言语句(232);以及
输出(106)自然语言语句(232);
其中所述计算机实现的文本分析过程包括:
对于所述一个或多个词中的每一个并且通过使用经修改的词嵌入(228)而确定表示词的向量;以及
基于所确定的一个或多个向量并且通过使用文本生成器模型(230)来确定自然语言语句(232);并且
其中所述经修改的词嵌入(228)是已经通过基于第一数据而修改第一词嵌入所生成的词嵌入,所述第一词嵌入已经基于第一语料库(220)和第二语料库(224)中之一而被生成,所述第一数据已经基于所述第一语料库(220)和第二语料库(224)中的另一个而被生成,所述第一语料库(220)包括来自一个或多个放射学报告的文本,所述第二语料库(224)不同于第一语料库(220)并且包括明语文本。
2.根据权利要求1所述的方法,其中所述第一数据包括第二词嵌入,所述第二词嵌入已经基于与已经基于其生成了第一词嵌入的第一语料库和第二语料库中之一相比的第一(220)和第二(224)语料库中的不同的那个而被生成,并且其中所述经修改的词嵌入(228)是已经通过基于第二词嵌入而修改第一词嵌入所生成的词嵌入(228)。
3.根据权利要求2所述的方法,其中所述经修改的词嵌入(228)是已经通过如下而被生成的词嵌入:对于针对给定词的给定词嵌入,连接针对给定词的第一词嵌入的向量与针对给定词的第二词嵌入的向量以产生针对给定词的经修改的向量。
4.根据权利要求1所述的方法,其中所述第一数据包括语义词典,所述语义词典已经基于与已经基于其生成了第一词嵌入的第一语料库(220)和第二语料库(224)中之一相比的第一(220)和第二语料库(224)中的不同的那个而被生成,并且其中经修改的词嵌入(228)是已经通过基于所述语义词典而修改第一词嵌入的向量的值所生成的词嵌入。
5.根据权利要求1至权利要求4中任一项所述的方法,其中所述方法包括:
生成第一词嵌入和第一数据;以及
基于所述第一数据来修改第一词嵌入,从而生成经修改的词嵌入。
6.根据权利要求1至权利要求5中任一项所述的方法,其中所述方法包括:
基于训练数据的数据库来训练文本生成器模型(230),所述训练数据包括一个或多个词的群组,每个群组利用与自然语言语句相对应的地面实况来被标注。
7.根据权利要求1至权利要求6中任一项所述的方法,其中所述方法包括:
通过使用第一所述文本生成器模型并且基于一个或多个所获得的词(206)而确定第一自然语言语句;以及
通过使用第二、不同的所述文本生成器模型并且基于一个或多个所获得的词(206)而确定第二自然语言语句。
8.根据权利要求7所述的方法,其中所述第二自然语言语句采用与第一自然语言语句不同的语言。
9.根据权利要求7或权利要求8所述的方法,其中所述方法包括:
在第一放射学报告中输出第一自然语言语句;以及
在与第一放射学报告不同的第二放射学报告中输出第二自然语言语句。
10.根据权利要求7至权利要求9中任一项所述的方法,其中所述方法包括:
基于所述第一训练数据来训练第一文本生成器模型;以及
基于与第一训练数据不同的第二训练数据来训练第二文本生成器模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子医疗有限公司,未经西门子医疗有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910967589.5/1.html,转载请声明来源钻瓜专利网。