[发明专利]一种文本生成的方法及设备在审
申请号: | 202010923147.3 | 申请日: | 2020-09-04 |
公开(公告)号: | CN114138948A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 邵星阳;杨善松;刘永霞 | 申请(专利权)人: | 海信视像科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G10L15/22;G10L15/26;G10L15/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 张恺宁 |
地址: | 266555 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 生成 方法 设备 | ||
1.一种文本生成的方法,其特征在于,该方法包括:
接收用于指示文本预测的指示信息,其中所述指示信息是终端设备接收到用户触发的播放多媒体资源的语音指令后发送的;
将所述多媒体资源对应结构化数据输入已训练的文本生成模型,通过所述文本生成模型执行多轮文本序列预测,以得到目标文本,并将所述目标文本返回给所述终端设备;其中,所述结构化数据中包含用于表征所述多媒体资源属性的文本信息和所述多媒体资源内容相关的文本信息,所述文本信息包括词和/或句子;
其中,所述每轮文本序列预测的过程为:
根据前一轮次预测的文本序列中的文本信息,确定所述结构化数据中每个文本信息的第一概率,以及高频词集合中每个文本信息的第二概率;
根据所述第一概率和所述第二概率,预测当前轮次的文本序列。
2.如权利要求1所述的方法,其特征在于,所述根据前一轮次预测的文本序列中的文本信息,确定所述结构化数据中每个文本信息的第一概率,包括:
对于所述结构化数据中前一轮次预测的文本序列中未包含的文本信息,利用注意力机制概率分布中的概率和当前轮次的第一权重,得到所述结构化数据中该文本信息的第一概率;和/或
对于所述结构化数据中前一轮次预测的文本序列中包含的文本信息,降低所述前一轮次预测的文本信息在注意力机制概率分布中的概率,并根据降低后的概率和当前轮次的第一权重得到所述结构化数据中该文本信息的第一概率;
根据前一轮次预测的文本序列中的文本信息,确定高频词集合中每个文本信息的第二概率,包括:
利用当前轮次注意力机制得到的概率获得的语境向量,以及根据前一轮次预测的文本序列中的文本信息解码输出的状态序列,确定所述高频词集合的分布概率;
根据所述分布概率和当前轮次的第二权重,得到所述高频词集合中每个文本信息的第二概率。
3.如权利要求2所述的方法,其特征在于,通过下列方式确定当前轮次的第一权重及第二权重:
根据当前轮次注意力机制得到的概率,确定所述结构化数据的语境向量;
根据所述结构化数据的语境向量,以及根据前一轮次预测的文本序列中的文本信息解码输出的状态序列,确定当前轮次的第二权重;
根据所述第二权重,确定当前轮次的第一权重。
4.如权利要求1所述的方法,其特征在于,所述根据所述第一概率和所述第二概率,预测当前轮次的文本序列,包括:
对于有所述第一概率和所述第二概率的文本信息,将所述第一概率与所述第二概率进行加和,得到所述文本信息的最终概率;以及对于仅有所述第一概率的所述文本信息,将所述第一概率作为文本信息的最终概率;以及对于仅有所述第二概率的所述文本信息,将所述第二概率作为所述文本信息的最终概率;
根据所述文本信息的最终概率,从所有文本信息中预测当前轮次的文本信息;
将所述当前轮次的文本信息与前一轮次预测的文本序列进行组合,确定当前轮次的候选文本序列,其中所述前一轮次预测的文本序列包含用于预测所述当前轮次的文本信息的前一轮次的文本信息;
根据所述候选文本序列的概率值,预测当前轮次的文本序列。
5.如权利要求4所述的方法,其特征在于,所述根据所述候选文本序列的概率值,预测当前轮次的文本序列,包括:
对于最后一轮预测,将当前轮次中候选文本序列概率值最大的文本序列,作为当前轮次的文本序列;或
对于非最后一轮预测,按照候选文本序列概率值由大到小的排列规则,从所述候选文本序列中,选择前N个候选文本序列概率作为当前轮次的文本序列,其中N为正整数。
6.如权利要求1~5任一所述的方法,其特征在于,通过下列方式确定所述多媒体资源内容相关的文本信息:
根据所述多媒体资源对应的内容信息中句子出现的次数,确定所述多媒体资源内容相关的文本信息;和/或
根据所述多媒体资源对应的内容鉴赏信息中的句子的情感评分,确定所述多媒体资源内容相关的文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信视像科技股份有限公司,未经海信视像科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010923147.3/1.html,转载请声明来源钻瓜专利网。