[发明专利]一种基于深度学习的评价文本生成方法在审

专利信息
申请号: 202211513490.6 申请日: 2022-11-29
公开(公告)号: CN115759066A 公开(公告)日: 2023-03-07
发明(设计)人: 林洁瑜;熊炜;郭婷;关钦月;张轩昂;徐小琴;熊志;杨明;黄大炜 申请(专利权)人: 国网湖北省电力有限公司经济技术研究院
主分类号: G06F40/279 分类号: G06F40/279;G06F16/36;G06F17/16;G06N3/0464;G06N3/08
代理公司: 武汉市首臻知识产权代理有限公司 42229 代理人: 章辉
地址: 430077 湖北省*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 评价 文本 生成 方法
【权利要求书】:

1.一种基于深度学习的评价文本生成方法,其特征在于,该方法包括以下步骤:

S1、利用自然语言处理工具HanLP对评审文本进行编码并形成词向量;

S2、通过K-Bert神经网络搭建训练网络模型;

S3、改善训练网络模型特性并对词向量进行训练;

S4、利用BLUE、ROUGE校核训练网络模型的准确性,并获得训练网络模型的最佳参数设置;

S5、将设计文本输入校核后的训练网络模型以生成评价文本。

2.根据权利要求1所述的一种基于深度学习的评价文本生成方法,其特征在于:步骤S1具体包括以下步骤:

S11、利用正则匹配将评审文本按章、节标题进行切分,生成多个子文件并编号,从多个子文件中筛选出需要进行评价的章节所在的子文件,并将这些子文件储存;

S12、利用scikit-learn对评审文本进行聚类分析,对文本进行清洗,得到与评审指标相关的单句;

S13、利用自然语言处理工具HanLP对错误文本和评价文本进行分词标注,并转化为词向量;

S14、将评审指标所组成的词向量序列作为输入,将评语所组成的词向量序列作为输出。

3.根据权利要求2所述的一种基于深度学习的评价文本生成方法,其特征在于:步骤S13中,对于文本中没有对应评价的语句,建造一个评语以填补其完整性。

4.根据权利要求3所述的一种基于深度学习的评价文本生成方法,其特征在于:步骤S2具体包括以下步骤:

S21、搭建知识层,该层将词组转化为知识图谱适配的知识树句构形式,其输入为一个集合s={w0,w1,w2,...,wn},其中,wn为词向量,输出为一个知识树t={w0,w1,...wi{(ri0,wi0),...,(rik,wik)},...,wn},其中,rik代表wi和wk之间的句法关系,wik代表与wi相关条件下的wk,输入到输出包括两个流程;

(1)知识问答

所有的命名实体从集合K筛选到集合S:

E=K-Query(s,K)

其中,E={(wi,ri0,wi0),...,(wi,rik,wik)}为三元集合;

(2)知识注入

将K-Query的结果E映射到集合S的对应位置,以获得知识树t:

t=K-Inject(s,E)

S22、搭建嵌入层,该层使得知识树转化为嵌入表征,嵌入表征分为记号嵌入、位置嵌入和片段嵌入三个部分,记号嵌入将词汇转化为维度为H的嵌入向量,片段嵌入通过添加标记对输入进行断句;

S23、搭建可见层,该层通过一个矩阵M限制每一个输入之间的可见性:

其中,wi和wj为输入的标记,i和j分别代表wi和wj在词表中的位置,代表wi与wj在同一分支中,代表wi与wj不在同一分支中;

S24、搭建遮罩转换层,该层作为复合自注意力机制层,限制自注意力的区域,得到范式化输入的格式;

通过矩阵M中的句子结构信息,使用自遮罩-注意力机制:

Qi+1,Ki+1,Vi+1=hiWq,hiWk,hiWv

hi+1=Si+1Vi+1

其中,Qi+1为第i+1层的Qeury向量,即查询该向量与其它词向量的相关度;Ki+1为第i+1层的Key向量,该向量与Query向量一一对应,给词向量的相关度评分;Vi+1为第i+1层的Value向量,即该词向量的值;Wq、Wk和Wv是可训练的模型参数,hi为第i个遮罩自注意力区块的状态参数,Si+1为softmax函数的求解值,dk为Query向量与Key向量的方差,M为可见层计算的可见矩阵。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网湖北省电力有限公司经济技术研究院,未经国网湖北省电力有限公司经济技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211513490.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top