[发明专利]一种基于LSTM的社交网络评论生成方法在审
申请号: | 201910680645.7 | 申请日: | 2019-07-25 |
公开(公告)号: | CN110390018A | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 何慧;张伟哲;方滨兴;邰煜 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/951;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于LSTM的社交网络评论生成方法,属于社交网络评论生成技术领域。本发明为了解现有的社交网络评论生成技术所应用的场景过于狭窄单一、无法对舆情引提供素材库的问题。本发明使用基于LSTM学习的NLG技术,通过学习获得的每个字符之间的概率关系来对句子结构的视觉语义、字符的种类以及每一个字符进行编码。对想要表达的评论信息进行了语义和句法方面的融合,并后期通过特定词替换等方法,生成与社交网络几乎一致的生动、通顺、富于变化的高质量评论文本。本发明为舆情引导提供有利的素材语料库,通过传播更多的真实、值得信赖的言论,还原出正能量的网络环境。本发明可作为素材语料库输入到现有的舆情引导的系统中,用于社交网络特定领域评论生成。 | ||
搜索关键词: | 社交网络 评论 语义 语料库 素材 概率关系 句子结构 评论文本 评论信息 网络环境 引导提供 素材库 引导的 正能量 句法 还原 替换 视觉 狭窄 场景 融合 学习 传播 应用 | ||
【主权项】:
1.一种基于LSTM的社交网络评论生成方法,其特征在于,所述方法包括:对评论文本进行分类,将评论文本分成七种类别:主系表结构,比较级结构,疑问句结构,感叹句结构,主谓宾结构,主谓宾宾补结构,祈使句结构;针对不同的类别,设计不同的LSTM模型,通过对每个LSTM模型的学习得到概率结构,生成不同类别的初始评论IRi,下角标i表示七种类别,i等于1,2,3…7;根据不同类别的自身的特点,制定相应的文本处理策略来修正对应的LSTM模型,进而生成与社交网络真实评论一致的高质量评论文本FRi;社交网络W下给定一个特定领域D,该领域包含的热点话题集合为T={T1,T2,…,Tn},选定某一话题Ti,针对话题Ti选定某一特定主贴P,爬取主贴P下的评论文本集,表示为RR={RR1,RR2,…,RRn},经过分类处理,筛选出不同类别的数据,将其表示为FlR={FlR1,FlR2,…,FlRn},分别输入到不同参数的LSTM模型中,生成相应类别的初始评论集,表示为IR={IR1,IR2,…,IRn};针对不同类别的特点分别对IRi制定不同的策略来进行偏差修正,生成最终评论集表示为FR={FR1,FR2,…,FRn},如公式(1)到(3)所示;其中i∈{1,2,3,…,n},n等于7,其中C函数代表基于随机森林模型的文本分类过程,函数h代表基于LSTM的文本生成过程,函数zj代表偏差修正过程;偏差修正包括文本替换、文本复述和模板定制三种策略;C(RR)→FlRi (1)h(W,D,T,P,FlRi)→IRi (2)zj(IRi)→FRi j∈{1,2,3} (3)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910680645.7/,转载请声明来源钻瓜专利网。