[发明专利]文本生成方法和装置在审
申请号: | 201910775353.1 | 申请日: | 2019-08-21 |
公开(公告)号: | CN110489755A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 吴智东 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/35;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 11240 北京康信知识产权代理有限责任公司 | 代理人: | 王淼<国际申请>=<国际公布>=<进入国 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 属性值向量 图谱 目标实体 属性向量 向量 文本信息 方法和装置 三元组向量 文本生成 选择目标 学习算法 匹配度 预设 匹配 个性化 文本 表现 | ||
1.一种文本生成方法,其特征在于,包括:
从知识图谱集中选择目标实体的目标知识图谱,其中,所述知识图谱集用于表征至少一个实体在预设属性上的属性值,所述目标实体为待评价的对象;
基于所述目标知识图谱确定所述目标实体的实体向量、属性向量和属性值向量,其中,所述实体向量、属性向量和属性值向量用三元组向量表征;
依据所述实体向量、属性向量和属性值向量生成与所述目标实体匹配的文本。
2.根据权利要求1所述的方法,其特征在于,在从知识图谱集中选择目标实体的目标知识图谱之前,所述方法还包括:生成所述知识图谱集,其中,生成所述知识图谱集的步骤包括:
构建所述知识图谱集的规划层,其中,所述规划层至少包括:实体类型、属性类型和属性值类型;
获取记录信息,其中所述记录信息包括:至少一个实体在预设属性上的属性值;
将所述记录信息输入至所述规划层中,生成所述知识图谱集。
3.根据权利要求2所述的方法,其特征在于,在将所述记录信息输入至所述规划层之前,所述方法还包括:
对所述记录信息进行预处理,得到处理后的记录信息,其中,所述预处理包括如下至少之一:实体抽取、属性抽取、属性值抽取和实体消歧。
4.根据权利要求1所述的方法,其特征在于,基于所述目标知识图谱确定所述目标实体的实体向量、属性向量和属性值向量,包括:
提取所述目标知识图谱中的所述目标实体的实体信息、属性信息和属性值信息;
使用预设算法将所述实体信息转换为布尔向量,使用预设模型将所述属性信息和所述属性值信息均转换为高纬数值型向量,得到所述三元组向量。
5.根据权利要求1所述的方法,其特征在于,依据所述实体向量、属性向量和属性值向量生成与所述目标实体匹配的文本,包括:
将所述实体向量、属性向量和属性值向量输入至文本生成模型中,其中,所述文本生成模型包括深度神经网络模型,所述深度神经网络模型根据三元组样本和文本样本训练得到;
基于所述文本生成模型生成与所述目标实体匹配的文本。
6.根据权利要求5所述的方法,其特征在于,在将所述实体向量、属性向量和属性值向量输入至文本生成模型之前,所述方法还包括:生成所述文本生成模型,其中,生成所述文本生成模型的步骤包括:
获取所述三元组样本和文本样本;
使用预设算法将所述三元组样本中的实体样本转换为布尔向量,使用预设模型将所述三元组样本中的属性样本、属性值样本均转换为高纬数值型向量,得到三元组向量样本;
基于所述三元组向量样本和所述文本样本训练所述文本生成模型,得到训练好的文本生成模型。
7.根据权利要求5所述的方法,其特征在于,基于所述三元组向量样本和所述文本样本训练所述文本生成模型,得到训练好的文本生成模型,包括:
利用结合注意力机制的编码器处理所述三元组向量样本和所述文本样本,得到上下文向量;
利用结合注意力机制的解码器处理所述上下文向量,得到文本信息;
基于所述文本信息,以最小化损失函数来训练所述文本生成模型。
8.一种文本生成方法,其特征在于,包括:
接收选中指令,其中,所述选中指令用于选中待评价的目标实体;
显示与所述目标实体匹配的文本,其中,所述文本依据所述目标实体的目标知识图谱确定出的所述目标实体的实体向量、属性向量和属性值向量生成,所述目标知识图谱来自知识图谱集,所述知识图谱集用于表征至少一个实体在预设属性上的属性值,所述实体向量、属性向量和属性值向量用三元组向量表征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910775353.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:快速生成标准语料的方法和系统
- 下一篇:会话式人机交互口语测评系统