[发明专利]一种主题指导的文本预测方法有效
申请号: | 201910557270.5 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110457674B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 陈渤;鲁瑞颖;郭丹丹 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/30;G06F16/36;G06N3/08 |
代理公司: | 西安嘉思特知识产权代理事务所(普通合伙) 61230 | 代理人: | 张捷 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 主题 指导 文本 预测 方法 | ||
1.一种基于主题指导的文本预测方法,其特征在于,包括:
S1:获得每篇文章对应的词袋向量;
所述S1包括:
将M篇文章{D1,D2,...Dm,...,DM}分别表示为对应的词袋向量d1,d2,...,dm,...,dM,其中dm∈R1×V表示词汇表中每个词在第m篇文章中出现的次数,V表示字典维度;
S2:根据所述文章的词袋向量,利用主题模型生成所述文章的主题特征向量;
所述S2包括:
将所述词袋向量d1,d2,...,dm,...,dM依次输入L层的主题模型中,分别得到对应的语义特征向量θ1,θ2,...,θm,...,θM,其中θm={θm(1),θm(2),...,θm(L)},m∈1:M表示第m篇文章的语义特征向量;
S3:将所述文章中每个句子中每个词和相应的主题向量输入语言模型中,得到相应的每个词的时序特征向量;
所述S3包括:
将所述文章Dm中的句子{s1,s2,...,sj,...,sJ}及文章Dm的语义特征向量{θ(1),θ(2),...,θ(L)}依次输入语言模型;
将每个句子表示为Tj表示第j个句子包含词的个数,输入的第一个词为起始符,预测得到sj的第一个词yj1,再输入第一个词yj1预测得到第二个词yj2,依此类推直至输出最后一个词将第j个句子的第t个词yjt分别输入语言模型,得到的语言模型的各层隐变量分别记为其中,所述语言模型具体表示如下:
其中,zt(l)表示第t个时刻第l层的隐单元,ht(l)表示第t个时刻第l层的长短时记忆网络LSTM的隐单元,θ(l)表示该单词所在文章对应的第l层的语义特征向量,即第l层的隐变量,zt(l-1)表示第t个时刻第l-1层的隐单元,ht-1(l)表示第t-1个时刻第l层的LSTM隐单元,LSTM(l)表示第l层的LSTM网络,GRU(l)表示门控循环单元的网络,用于将语义特征向量加入语言模型中指导词的生成;
S4:根据每个词的时序特征向量,通过归一化指数函数预测下一个词;
所述S4包括:
将语言模型各隐层拼接起来得到zt,其中表示输入词的时序特征向量,rl为第l层隐变量的维度;
在所述语言模型中将时序特征向量输入归一化指数函数层,得到V维的概率分布向量;
选择所述概率分布向量中值最大的位置在单词表中所对应的单词为最终单步预测的输出结果,目标输出结果为当前输入词的下一个词;
S5:利用随机梯度下降法对所述语言模型以及主题模型中的编码器的参数进行更新,同时利用自适应随机梯度马尔可夫链蒙特卡洛采样方法对所述主题模型中解码器的参数进行采样更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910557270.5/1.html,转载请声明来源钻瓜专利网。