[发明专利]一种基于生成对抗网络的情绪差分隐私保护方法有效
申请号: | 202010405749.X | 申请日: | 2020-05-14 |
公开(公告)号: | CN111666588B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 牛晓光;徐远卓;沈达;谢璐遥;林青海;陈闯 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F40/284;G06V40/16;G06V10/80;G06V10/82;G06N3/0464;G06N3/0442;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 网络 情绪 隐私 保护 方法 | ||
1.一种基于生成对抗网络的情绪差分隐私保护方法,其特征在于,包括:
S1:接收隐私保护数据;
S2:识别隐私保护数据的类型并进行向量化,当隐私保护数据的类型为文本时执行步骤S3,当隐私保护数据的类型为图片时执行步骤S4;
S3:利用预设分词算法对文字类型的数据进行分词后,通过情绪分类器进行情绪类型识别,然后构建文本对抗生成网络,生成目标语句并进行隐私保护;
S4:通过预设人脸检测算法对图片类型的数据进行检测,获得面部图像,利用人脸特征点检测算法确定其面部情绪,通过表情分类器进行情绪识别,然后构建图像对抗生成网络,生成目标人脸图片并进行隐私保护;
其中,文本对抗生成网络包括LSTM生成器部分、CNN判别器部分和情绪判别器,S3中具体包括:
S3.1:采用最短路径分词算法匹配出隐私保护数据中包含的词语,构成词图,然后基于词图寻找从起始点到终点的最短路径作为分词组合结果,得到分词后的语句;
S3.2:将分词后的语句根据词序进行向量化,采用情绪分类器进行情绪类型识别,获得第一情绪类别,并将第一情绪类别作为情绪标签与向量化后的语句向量进行融合;
S3.3:根据融合后的向量获取向量化后的语句向量,通过LSTM生成器部分根据向量化后的语句生成目标语句,并通过CNN判别器部分判别生成的目标语句是否为满足要求的真实语句,当判定目标语句为满足要求的真实语句时,通过情绪判别器判定目标语句的第二情绪类别,当第一情绪类别与第二情绪类别不一致时,将LSTM生成器部分生成的新语句作为隐私保护后的语句。
2.如权利要求1所述的方法,其特征在于,S1中识别隐私保护数据的类型并进行向量化,包括:
S1.1:根据接收的隐私保护数据的格式识别为文本或者图片类型;
S1.2:根据隐私保护数据生成向量序列,并根据识别出的类型附加类别向量,其中,类别向量用以标识数据的类型,当类型为文本时,附加的类别向量为[-1,…,-1]T,当类型为图片时,附加的类别向量为[0,…,0]T。
3.如权利要求1所述的方法,其特征在于,S3.3中LSTM生成器部分采用长短记忆网络LSTM,并基于随机噪声指导目标语句的生成,生成过程具体包括:
LSTM生成器部分将随机噪声向量R1映射成一个目标语句生成概率为:
其中,p(w1|R1)=arg max(Vh1),为随机噪声向量R1指导下的条件输出,p(wt|w<t,R1)=arg max(Vht),句子wt表示句子的第t个单词,每一个单词wt都映射为一个k维向量xt=We[wt],其中是训练过程中逐渐学习的词嵌入矩阵,V是词典大小,
所有词语则按顺序使用LSTM计算得出,直至遇到结束标志符,计算方法如下:
p(wt|w<t,R1)=arg max(Vht)
ht=LSTM(yt-1,ht-1,R1)
yt-1=We[wt-1],ht-1为循环迭代得到的结果,直至最后一个词语生成完毕,则生成一个目标语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010405749.X/1.html,转载请声明来源钻瓜专利网。