[发明专利]一种文章生成的方法和装置在审
申请号: | 201910950752.7 | 申请日: | 2019-10-08 |
公开(公告)号: | CN110688857A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 杨光磊;廖敏鹏;李长亮 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 11637 北京智信禾专利代理有限公司 | 代理人: | 王治东 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标题文本 实体关系 语义信息 起始符 连贯 方法和装置 语义 生成条件 拼接 句子 词语 重复 申请 | ||
本申请提供一种文章生成的方法和装置,所述方法包括:接收标题文本,确定所述标题文本中的实体关系;根据所述标题文本、实体关系和起始符生成第一句;根据所述标题文本、实体关系、起始符和第一句至第i‑1句生成第i句,直至达到生成条件,其中,i≥2;拼接生成的句子获得文章。利用了第一句至第i‑1句连贯的语义信息,并以此实现第i句中词语的生成,使得生成的第i句与前面生成的第一句至第i句的语义信息前后连贯,且避免了生成的第i句与在先生成的第一句至第i‑1句的语义的重复,提高了生成的文章质量。
技术领域
本申请涉及自然语言处理技术领域,特别涉及一种文章生成的方法和装置、计算设备及计算机可读存储介质。
背景技术
文本自动生成是自然语言处理领域的一个重要研究方向,实现文本自动生成也是人工智能走向成熟的一个重要标志。文本自动生成包括文本到文本的生成,文本到文本的生成技术主要指对给定文本进行变换和处理从而获得新文本的技术,文本自动生成技术可以应用于智能问答与对话、机器翻译等系统,实现更加智能和自然的人机交互。
现有文本生成方法中,根据用户输入的信息来生成文本,通过对输入的信息一次性编码得到向量级别的特征表达,再对编码结果进行解码生成文本,上述编码和解码过程只进行一次,生成的句子未考虑到前句的信息,对于生成词数较少的句子级别文本时质量较好,但是对于包含成百上千字长度的段落或文章这种长文本,生成的长文本中会出现大量重复语句的情况,冗余信息较多,生成的长文本内容质量较差。
发明内容
有鉴于此,本申请实施例提供了一种文章生成的方法和装置、计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。
本申请实施例公开了一种文章生成的方法,包括:
接收标题文本,确定所述标题文本中的实体关系;
根据所述标题文本、实体关系和起始符生成第一句;
根据所述标题文本、实体关系、起始符和第一句至第i-1句生成第i句,直至达到生成条件,其中,i≥2;
拼接生成的句子获得文章。
本申请实施例公开了一种文章生成的装置,包括:
处理模块,被配置为接收标题文本,确定所述标题文本中的实体关系;
第一生成模块,被配置为根据所述标题文本、实体关系和起始符生成第一句;
第二生成模块,被配置为根据所述标题文本、实体关系、起始符和第一句至第i-1句生成第i句,直至达到生成条件,其中,i≥2;
拼接模块,被配置为拼接生成的句子获得文章。
本申请实施例公开了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现如上所述的文章生成的方法的步骤。
本申请实施例公开了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如上所述的文章生成的方法的步骤。
本申请上述实施例中,通过根据标题文本、实体关系、起始符以及第一句至第i-1句的信息,利用了第一句至第i-1句连贯的语义信息,并以此实现第i句中词语的生成,换言之,利用前面顺序生成句子连贯的语义信息,并以此指导第i句中词语的生成,使得生成的第i句与前面生成的第一句至第i句的语义信息前后连贯,且避免了生成的第i句与在先生成的第一句至第i-1句的语义的重复;另外,所述第i句的生成中还根据所述标题文本、实体关系的信息,避免生成的句子与标题文本关联性较低而影响句子的生成质量,确保生成的句子与标题文本具备较高关联性,进一步提高句子的生成质量,在应用于智能问答与对话、机器翻译时,实现更加智能和自然的人机交互。
附图说明
图1是本申请实施例的计算设备的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910950752.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种裁判文书信息提取方法
- 下一篇:语义解析方法、装置、电子设备及存储介质