[发明专利]一种基于表格层次化建模的结构化数据生成文本方法有效
申请号: | 201910828514.9 | 申请日: | 2019-09-03 |
公开(公告)号: | CN110516213B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 冯骁骋;秦兵;刘挺;龚恒;陈昱宇 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/166;G06F40/216;G06N3/04;G06N3/08 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 时起磊 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于表格层次化建模的结构化数据生成文本方法,本发明涉及结构化数据生成文本方法。本发明的目的是为了解决现有结构化数据生成文本只利用了数据本身单一信息,无法衡量实体数据整体情况以及同类型数据的表现差异和多表格数据之间的利用不充分问题。一、将数据集的记录用三元组表示,分别对每条记录所属的行、列维度建模得到该记录的行向量、列向量,并引入时间轴,对不同日期的同类型数据建模得到该记录的时间向量;二、融合行向量、列向量和时间向量得到该记录新的向量表示;三、对每行记录的新向量进行均值池化得到新行向量;四、每个解码时刻,对三得到的向量进行解码,得到当前时刻每条记录的权重。本发明用于表格数据生成文本方法。 | ||
搜索关键词: | 一种 基于 表格 层次 建模 结构 数据 生成 文本 方法 | ||
【主权项】:
1.一种基于表格层次化建模的结构化数据生成文本方法,其特征在于:所述方法具体过程为:/n步骤一、将数据集中表格信息处理成三元组之后,每个三元组对应表格中一个记录,对于每个记录,进行行、列和时间维度的建模,对每个记录所属的行、列建模得到该记录用行信息表示该记录的行向量 和用列信息表示该记录的列向量 同时引入时间轴,对不同日期的同一类型数据进行建模,得到该记录时间表示的时间向量 /n步骤二、将步骤一得到的行、列和时间维度向量融合成新的向量,分别计算列维度表示的得分向量、行维度表示的得分向量和时间维度表示的得分向量的注意力权重;基于列维度表示的得分向量、行维度表示的得分向量和时间维度表示的得分向量的注意力权重,计算得到融合后的新的向量表示 /n步骤三、对同一行的融合后的新的向量表示 进行均值池化,得到对同一行的融合后的新的向量表示 进行均值池化后的行向量rowi;/n步骤四、在解码步骤t时刻,对步骤二得到的 和步骤三得到的rowi进行解码,生成当前时候所有表格每个三元组的权重;/n三元组权重要生成文字有2个概率,一个是拷贝概率,一个是生成文字概率:/n拷贝概率就是三元组权重;/n比较三元组权重和生成文字概率大小,若三元组权重大于生成文字概率,则生成的文字就是拷贝当前的三元组的值;/n若三元组权重小于等于生成文字概率,则生成的文字就是将LSTM隐层映射到词表上,将词表中概率最大的文字作为生成字。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910828514.9/,转载请声明来源钻瓜专利网。