[发明专利]文本生成方法和装置在审
申请号: | 201910775353.1 | 申请日: | 2019-08-21 |
公开(公告)号: | CN110489755A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 吴智东 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/35;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 11240 北京康信知识产权代理有限责任公司 | 代理人: | 王淼<国际申请>=<国际公布>=<进入国 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 属性值向量 图谱 目标实体 属性向量 向量 文本信息 方法和装置 三元组向量 文本生成 选择目标 学习算法 匹配度 预设 匹配 个性化 文本 表现 | ||
本发明公开了一种文本生成方法和装置。其中,该方法包括:从知识图谱集中选择目标实体的目标知识图谱,其中,知识图谱集用于表征至少一个实体在预设属性上的属性值,目标实体为待评价的对象;基于目标知识图谱确定目标实体的实体向量、属性向量和属性值向量,其中,实体向量、属性向量和属性值向量用三元组向量表征;依据实体向量、属性向量和属性值向量生成与目标实体匹配的文本。本发明解决了相关技术中仅利用深度学习算法生成的文本信息缺乏对实体的个性化评述,导致文本信息与实体的实际表现匹配度不高的技术问题。
技术领域
本发明涉及自然语言处理领域,具体而言,涉及一种文本生成方法和装置。
背景技术
文本生成技术,是自然语言处理(Natural Language Processing,NLP)领域的一个重要的研究方向,旨在通过规则、算法等自动生成符合人类语言规律、没有语法错误的句子。
文本生成技术的应用场合非常多。例如,在教育行业,每到学期结束时,教师需要根据学生的日常表现,写出一段关于学生表现的描述性、建议性的评语。传统生成每个学生的评语的方法大多依靠教师手动撰写,这样的方式不仅消耗教师大量的时间,而且,教师也不一定能准确记得所有学生的日常表现。因此,现有比较成熟的解决方式是,将输入的学生信息,与人工构造的评语模板进行相似度计算,选取相似度最高的模板作为生成的评语。
然而,上述方法的评语是人工构建出来的,而非通过算法生成的,因此,上述方法不能批量化、智能化、个性化地对每个学生生成不同的评语。另外,由于评语是通过计算学生信息与评语模板之间的相似度来获得的,这种方式仅考虑了字符表面的信息,没有考虑到评语文本的语义层信息。为解决这一问题,深度学习算法考虑了文本在多个维度上的统计分布,并使用概率的方式来生成评语。但是,深度学习算法缺乏知识性信息,对特定学生的日常行为表现与评语之间潜在关系的学习能力不足,缺乏对特定学生生成个性化评语的能力,以至深度学习算法生成的评语与学生的实际表现匹配度不高、不精确。
针对相关技术中仅利用深度学习算法生成的文本信息缺乏对实体的个性化评述,导致文本信息与实体的实际表现匹配度不高的技术问题,目前尚未提出有效的解决方案。
发明内容
本发明提供了一种文本生成方法和装置,以至少解决相关技术中仅利用深度学习算法生成的文本信息缺乏对学生的个性化评述,导致文本信息与学生的实际表现匹配度不高的技术问题。
根据本发明实施例的一个方面,提供了一种文本生成方法,包括:从知识图谱集中选择目标实体的目标知识图谱,其中,知识图谱集用于表征至少一个实体在预设属性上的属性值,目标实体为待评价的对象;基于目标知识图谱确定目标实体的实体向量、属性向量和属性值向量,其中,实体向量、属性向量和属性值向量用三元组向量表征;依据实体向量、属性向量和属性值向量生成与目标实体匹配的文本。
可选地,在从知识图谱集中选择目标实体的目标知识图谱之前,上述方法还包括:生成知识图谱集,其中,生成知识图谱集的步骤包括:构建知识图谱集的规划层,其中,规划层至少包括:实体类型、属性类型和属性值类型;获取记录信息,其中记录信息包括:至少一个实体在预设属性上的属性值;将记录信息输入至规划层中,生成知识图谱集。
可选地,在将记录信息输入至规划层之前,上述方法还包括:对记录信息进行预处理,得到处理后的记录信息,其中,预处理包括如下至少之一:实体抽取、属性抽取、属性值抽取和实体消歧。
可选地,基于目标知识图谱确定目标实体的实体向量、属性向量和属性值向量,包括:提取目标知识图谱中的目标实体的实体信息、属性信息和属性值信息;使用预设算法将实体信息转换为布尔向量,使用预设模型将属性信息和属性值信息均转换为高纬数值型向量,得到三元组向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910775353.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:快速生成标准语料的方法和系统
- 下一篇:会话式人机交互口语测评系统