[发明专利]一种短文文本的生成方法、生成装置及可读存储介质有效

专利信息
申请号: 201911344367.4 申请日: 2019-12-24
公开(公告)号: CN111126059B 公开(公告)日: 2023-08-29
发明(设计)人: 王千;梁新敏;陈羲 申请(专利权)人: 上海风秩科技有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06N3/0442;G06N3/0455;G06N3/0475
代理公司: 北京超成律师事务所 11646 代理人: 高玉光
地址: 200000 上海市普陀*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 短文 文本 生成 方法 装置 可读 存储 介质
【说明书】:

本申请提供了一种短文文本的生成方法、生成装置及可读存储介质,所述生成方法包括:基于获取到的文本信息,确定出文本信息对应的文本词向量矩阵、文本长度向量以及扩充属性矩阵;并通过训练好的神经网络的编码层,确定出文本信息对应的编码信息矩阵;再通过训练好的神经网络的解码层中的时序神经网络,确定出时序神经网络中每个时序神经单元对应的至少一个目标分词,以及每个目标分词对应的词向量,从而生成文本信息对应的短文文本。通过加入文本信息对应的文本长度向量以及扩充属性矩阵,能够更加准确的生成文本信息对应的对短文文本,并能够对短文文本的生成长度进行控制,有助于提高短文文本的生成质量以及短文文本的可阅读性。

技术领域

本申请涉及自然语言处理技术领域,尤其是涉及一种短文文本的生成方法、生成装置及可读存储介质。

背景技术

短文文本生成,即能够从获取到的文本信息中提取出关键信息,然后再根据这些关键信息及这些关键信息需要应用的应用环境,经过规划来生成一段高质量的短文文本。

目前,短文文本内容的创作主要依赖于人员根据资源的特征等,人为的对短文文本的内容进行设计,人工设计并撰写出的短文文本的内容质量良好、可阅读性强,但是人为的根据获取到的资源特征进行短文文本内容的设计与撰写,文本的生成速度慢且效率低。

发明内容

有鉴于此,本申请的目的在于提供一种短文文本的生成方法、生成装置及可读存储介质,通过加入文本信息对应的文本长度矩阵以及扩充属性矩阵,能够更加准确的生成文本信息对应的对短文文本,并能够对短文文本的生成长度进行控制,有助于提高短文文本的生成质量、生成效率以及短文文本的可读性。

本申请实施例提供了一种短文文本的生成方法,所述生成方法包括:

基于获取到的文本信息,确定出所述文本信息对应的文本词向量矩阵、文本长度向量以及扩充属性矩阵;

将所述文本词向量矩阵、所述文本长度向量以及所述扩充属性矩阵输入至训练好的神经网络的编码层中,确定出所述文本信息对应的编码信息矩阵;

将所述编码信息矩阵以及获取到的起始符对应的词嵌入矩阵输入至训练好的神经网络的解码层中的时序神经网络中,确定所述时序神经网络中第一个时序神经单元的单元状态矩阵和隐含状态矩阵;

基于所述第一个时序神经单元的隐含状态矩阵、所述编码信息矩阵以及所述文本长度向量,按照所述时序神经网络中时序神经单元的先后顺序,确定出所述第一个时序神经单元的下一个时序神经单元对应的至少一个目标分词,以及每个目标分词对应的词向量;

针对于所述时序神经网络中除所述第一个时序神经单元之外,其他时间时序单元中的每个时序神经单元,基于所述时序神经单元的上一个时序神经单元的单元状态矩阵以及所述时序神经单元对应的每个词向量,确定所述时序神经单元的单元状态矩阵和隐含状态矩阵;

基于所述时序神经单元的隐含状态矩阵、所述编码信息矩阵以及所述文本长度向量,确定出所述时序神经单元的下一个时序神经单元对应的至少一个目标分词,以及每个目标分词对应的词向量,直至所述时序神经单元的单元状态矩阵输入至获取到的终止符对应的词嵌入矩阵所在的时序神经单元,所述时序神经网络停止解码;

基于所述起始符、所述终止符以及确定出的每个时序神经单元对应的至少一个目标分词,确定出所述文本信息对应的短文文本。

进一步的,所述基于获取到的文本信息,得到与所述文本信息对应的文本词向量矩阵、文本长度向量以及扩充属性矩阵,包括:

对获取到的文本信息进行规范化处理,确定出所述文本信息对应的规范化文本信息以及所述规范化文本信息的字符数量,并基于所述字符数量,确定出所述文本信息对应的文本长度向量;

对所述规范化文本信息进行分词向量映射处理,得到所述文本信息对应的文本词向量矩阵;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海风秩科技有限公司,未经上海风秩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911344367.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top