[发明专利]一种基于深度学习的评价文本生成方法在审
申请号: | 202211513490.6 | 申请日: | 2022-11-29 |
公开(公告)号: | CN115759066A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 林洁瑜;熊炜;郭婷;关钦月;张轩昂;徐小琴;熊志;杨明;黄大炜 | 申请(专利权)人: | 国网湖北省电力有限公司经济技术研究院 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F16/36;G06F17/16;G06N3/0464;G06N3/08 |
代理公司: | 武汉市首臻知识产权代理有限公司 42229 | 代理人: | 章辉 |
地址: | 430077 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 评价 文本 生成 方法 | ||
1.一种基于深度学习的评价文本生成方法,其特征在于,该方法包括以下步骤:
S1、利用自然语言处理工具HanLP对评审文本进行编码并形成词向量;
S2、通过K-Bert神经网络搭建训练网络模型;
S3、改善训练网络模型特性并对词向量进行训练;
S4、利用BLUE、ROUGE校核训练网络模型的准确性,并获得训练网络模型的最佳参数设置;
S5、将设计文本输入校核后的训练网络模型以生成评价文本。
2.根据权利要求1所述的一种基于深度学习的评价文本生成方法,其特征在于:步骤S1具体包括以下步骤:
S11、利用正则匹配将评审文本按章、节标题进行切分,生成多个子文件并编号,从多个子文件中筛选出需要进行评价的章节所在的子文件,并将这些子文件储存;
S12、利用scikit-learn对评审文本进行聚类分析,对文本进行清洗,得到与评审指标相关的单句;
S13、利用自然语言处理工具HanLP对错误文本和评价文本进行分词标注,并转化为词向量;
S14、将评审指标所组成的词向量序列作为输入,将评语所组成的词向量序列作为输出。
3.根据权利要求2所述的一种基于深度学习的评价文本生成方法,其特征在于:步骤S13中,对于文本中没有对应评价的语句,建造一个评语以填补其完整性。
4.根据权利要求3所述的一种基于深度学习的评价文本生成方法,其特征在于:步骤S2具体包括以下步骤:
S21、搭建知识层,该层将词组转化为知识图谱适配的知识树句构形式,其输入为一个集合s={w0,w1,w2,...,wn},其中,wn为词向量,输出为一个知识树t={w0,w1,...wi{(ri0,wi0),...,(rik,wik)},...,wn},其中,rik代表wi和wk之间的句法关系,wik代表与wi相关条件下的wk,输入到输出包括两个流程;
(1)知识问答
所有的命名实体从集合K筛选到集合S:
E=K-Query(s,K)
其中,E={(wi,ri0,wi0),...,(wi,rik,wik)}为三元集合;
(2)知识注入
将K-Query的结果E映射到集合S的对应位置,以获得知识树t:
t=K-Inject(s,E)
S22、搭建嵌入层,该层使得知识树转化为嵌入表征,嵌入表征分为记号嵌入、位置嵌入和片段嵌入三个部分,记号嵌入将词汇转化为维度为H的嵌入向量,片段嵌入通过添加标记对输入进行断句;
S23、搭建可见层,该层通过一个矩阵M限制每一个输入之间的可见性:
其中,wi和wj为输入的标记,i和j分别代表wi和wj在词表中的位置,代表wi与wj在同一分支中,代表wi与wj不在同一分支中;
S24、搭建遮罩转换层,该层作为复合自注意力机制层,限制自注意力的区域,得到范式化输入的格式;
通过矩阵M中的句子结构信息,使用自遮罩-注意力机制:
Qi+1,Ki+1,Vi+1=hiWq,hiWk,hiWv
hi+1=Si+1Vi+1
其中,Qi+1为第i+1层的Qeury向量,即查询该向量与其它词向量的相关度;Ki+1为第i+1层的Key向量,该向量与Query向量一一对应,给词向量的相关度评分;Vi+1为第i+1层的Value向量,即该词向量的值;Wq、Wk和Wv是可训练的模型参数,hi为第i个遮罩自注意力区块的状态参数,Si+1为softmax函数的求解值,dk为Query向量与Key向量的方差,M为可见层计算的可见矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网湖北省电力有限公司经济技术研究院,未经国网湖北省电力有限公司经济技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211513490.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于牙齿矫正工具的清洗装置
- 下一篇:一种两段式电堆结构及绝缘中置气箱