[发明专利]基于多模态的电力营销热点挖掘方法在审
申请号: | 202111435180.2 | 申请日: | 2021-11-29 |
公开(公告)号: | CN114116981A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 何玮;吴伟将;吴卓超;孙少辰;俞阳 | 申请(专利权)人: | 国网江苏省电力有限公司营销服务中心 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06Q50/06;G06N3/04;G06F40/216 |
代理公司: | 北京智绘未来专利代理事务所(普通合伙) 11689 | 代理人: | 张红莲;王萍 |
地址: | 210019 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多模态 电力 营销 热点 挖掘 方法 | ||
1.基于多模态的电力营销热点挖掘方法,其特征在于:
所述方法包括以下步骤:
步骤1,采集电力营销中包括文本描述及其对应的图像描述的客户互动数据,将其汇总构成电力营销多模态热点挖掘数据集;
步骤2,对热点挖掘数据集中的文本描述进行预处理;
步骤3,对预处理后的热点挖掘数据集分别进行图像模态特征抽取和文本模态特征抽取,获取图像模态与文本模态的特征向量;
步骤4,使用跨模态注意力机制将图像模态特征和文本模态特征融合得到多模态融合特征,并基于多模态融合特征,利用CRF模型从文本描述中抽取候选热点词;
步骤5,对步骤4抽取的每个候选热点词计算原始热度值和热度增速;
步骤6,结合原始热度值与热度增速,从候选热点词中筛选最终的热点词。
2.根据权利要求1所述的基于多模态的电力营销热点挖掘方法,其特征在于:
步骤1中,最终得到的电力营销多模态热点挖掘数据集表示为D={(xi,yi)}L,其中L为样本个数,xi表示第i个样本的文本描述,yi表示xi对应的图像描述;
所述文本描述为用户对事件的咨询与申诉。
3.根据权利要求1所述的基于多模态的电力营销热点挖掘方法,其特征在于:
步骤2中,对热点挖掘数据集中的文本描述进行预处理,具体为:对文本描述中的无效字符或者停用词进行清洗。
4.根据权利要求1所述的基于多模态的电力营销热点挖掘方法,其特征在于:
步骤3所述图像模态特征抽取,具体为:
采用VGG网络中的VGG-16结构配置对图像描述进行视觉特征提取,提取公式为:
e(y)=VGG16(y)
其中,y为输入的图像描述,e(y)为VGG-16输出的低维编码特征向量,描述图像的视觉特征,图像特征转化成一个向量。
5.根据权利要求1所述的基于多模态的电力营销热点挖掘方法,其特征在于:
步骤3所述文本模态特征抽取,具体为:
从文本描述提取文本特征,公式为:
zt=σ(Wxzxt+Whzht-1)
rt=σ(Wxrxt+Whrht-1)
其中,
Wxz和Whz分别表示在求解zt时,为xt和ht-1分配的可训练的二维参数矩阵;
Wxr和Whr分别表示在求解rt时,为xt和ht-1分配的可训练的二维参数矩阵;
和分别表示在求解时,为xt和ht-1分配的可训练的二维参数矩阵;
σ表示sigmoid激活函数;
xt是在文本描述的第t个字;tanh表示tanh激活函数;
ht-1是在解码步骤t-1的隐藏层输出;
是综合ht与xt的隐藏状态;
rt是控制隐藏层ht-1在先前时间对于此时单词xt的影响;
zt是隐含向量,决定是否需要遗忘此时单词xt;
e’(xt)为最后输出的局部文本模态特征;
之后,采用预训练语言模型BERT对知识进行表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司营销服务中心,未经国网江苏省电力有限公司营销服务中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111435180.2/1.html,转载请声明来源钻瓜专利网。