[发明专利]一种文本生成的方法及设备在审
申请号: | 202010923147.3 | 申请日: | 2020-09-04 |
公开(公告)号: | CN114138948A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 邵星阳;杨善松;刘永霞 | 申请(专利权)人: | 海信视像科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G10L15/22;G10L15/26;G10L15/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 张恺宁 |
地址: | 266555 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 生成 方法 设备 | ||
本申请提供一种文本生成的方法及设备,用以在保证文本生成方式的通用性的基础上提高文本质量和文本丰富性,摆脱对人工的依赖并提高效率。接收用于指示文本预测的指示信息,指示信息是终端设备接收到播放多媒体资源的语音指令后发送的;将多媒体资源对应结构化数据输入已训练的文本生成模型,执行多轮文本序列预测,以得到目标文本,并返回给终端设备;结构化数据中包含用于表征多媒体资源属性的文本信息和多媒体资源内容相关的文本信息;每轮文本序列预测的过程为:根据前一轮次预测的文本序列中的文本信息,确定结构化数据中每个文本信息的第一概率,以及高频词集合中每个文本信息的第二概率;根据第一概率和第二概率,预测当前轮次的文本序列。
技术领域
本申请涉及计算机技术领域,提供一种文本生成的方法及设备。
背景技术
随着科技的发展,语音技术广泛应用于人机交互中。终端设备接收用户的语音指令,并向用户回复应答消息。
目前,应答消息对应的文本信息是基于预先编写的传统规则生成的,生成方式固定,不够自然生动。
为了使文本信息更加的自然生动,采用传统规则确定普通多媒体资源依旧,而特殊多媒资源采用人工编写的方式生成对应的文本信息。由于特殊多媒体资源不断增加,需要人工针对新增的特殊多媒体资源持续编写,人工编写成本高效率低,且能覆盖资源的数量有限。
发明内容
本申请实施例提供一种消息反馈的方法及设备,用以保证文本生成方式的通用性,提高文本的质量和丰富性,摆脱对人工的依赖并提高效率。
第一方面,本申请实施例提供一种文本生成的方法,该方法包括:
接收用于指示文本预测的指示信息,其中指示信息是终端设备接收到用户触发的播放多媒体资源的语音指令后发送的;
将多媒体资源对应结构化数据输入已训练的文本生成模型,通过文本生成模型执行多轮文本序列预测,以得到目标文本,并将目标文本返回给终端设备;其中,结构化数据中包含用于表征多媒体资源属性的文本信息和多媒体资源内容相关的文本信息,文本信息包括词和/或句子;
其中,每轮文本序列预测的过程为:
根据前一轮次预测的文本序列中的文本信息,确定结构化数据中每个文本信息的第一概率,以及高频词集合中每个文本信息的第二概率;
根据第一概率和第二概率,预测当前轮次的文本序列。
在一种可能的实现方式中,根据前一轮次预测的文本序列中的文本信息,确定结构化数据中每个文本信息的第一概率,包括:
对于结构化数据中前一轮次预测的文本序列中未包含的文本信息,利用注意力机制概率分布中的概率和当前轮次的第一权重,得到结构化数据中该文本信息的第一概率;或
对于结构化数据中前一轮次预测的文本序列中包含的文本信息,降低前一轮次预测的文本信息在注意力机制概率分布中的概率,并根据降低后的概率和当前轮次的第一权重得到结构化数据中该文本信息的第一概率;
根据前一轮次预测的文本序列中的文本信息,确定高频词集合中每个文本信息的第二概率,包括:
利用当前轮次注意力机制得到的概率获得的语境向量,以及根据前一轮次预测的文本序列中的文本信息解码输出的状态序列,确定高频词集合的分布概率;
根据分布概率和当前轮次的第二权重,得到高频词集合中每个文本信息的第二概率。
在一种可能的实现方式中,通过下列方式确定当前轮次的第一权重及第二权重:
根据当前轮次注意力机制得到的概率,确定结构化数据的语境向量;
根据结构化数据的语境向量,以及根据前一轮次预测的文本序列中的文本信息解码输出的状态序列,确定当前轮次的第二权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信视像科技股份有限公司,未经海信视像科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010923147.3/2.html,转载请声明来源钻瓜专利网。