[发明专利]隐私保护方法、装置、电子设备及存储介质在审
申请号: | 202010464829.2 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111625863A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 郭欣;唐大闰;梁志婷;徐浩 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/32;G10L15/06 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 孔默 |
地址: | 200030 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 隐私 保护 方法 装置 电子设备 存储 介质 | ||
1.一种隐私保护方法,其特征在于,包括:
接收媒体信息;
确定所述媒体信息中属于指定隐私类别的隐私信息,以及所述隐私信息在所述媒体信息中的目标位置;
基于预设规则将所述目标位置处的所述隐私信息删除,以得到去隐私的目标媒体信息。
2.根据权利要求1所述的方法,其特征在于,所述媒体信息为音频信息,所述确定所述媒体信息中属于指定隐私类别的隐私信息,以及所述隐私信息在所述媒体信息中的目标位置,包括:
采用隐私语音识别模型对所述媒体信息进行识别,所述隐私语音识别模型对应至少一种隐私类别,以确定所述音频信息中属于任一所述隐私类别的隐私信息;
确定所述隐私信息在所述媒体信息中的目标位置。
3.根据权利要求2所述的方法,其特征在于,所述隐私语音识别模型包括完成训练的声学模型和完成训练的语言模型,在所述采用隐私语音识别模型,基于预设的至少一种隐私类别确定所述媒体信息中属于任一所述隐私类别的目标信息,所述方法包括:
获取历史音频信息;
获取所述历史音频信息对应的语料集;
将所述语料集中的隐私信息对应的标注,替换为每个隐私信息所属的隐私类别的标识,得到替换语料集;
在所述历史音频信息对应的词表中将隐私信息替换为每个隐私信息所属的隐私类别的标识、所述每个隐私信息的发音保持不变,得到修改后的词表;
基于所述修改后的词表使用所述历史音频信息训练声学模型,以得到所述完成训练的声学模型;
使用所述替换语料集训练所述语言模型,以得到所述完成训练的语言模型。
4.根据权利要求1所述的方法,其特征在于,所述隐私信息为至少一个时,所述基于预设规则将所述目标位置处的所述隐私信息删除,以得到去隐私的目标媒体信息,包括:
计算每个所述隐私信息的置信度;
根据每个所述隐私信息的置信度,确定置信度大于或等于预设值的第一隐私信息,以及置信度小于所述预设值的第二隐私信息;
删除所有所述第一隐私信息,保留所述第二隐私信息,以得到所述目标媒体信息。
5.一种隐私保护装置,其特征在于,包括:
接收模块,用于接收媒体信息;
确定模块,用于确定所述媒体信息中属于指定隐私类别的隐私信息,以及所述隐私信息在所述媒体信息中的目标位置;
删除模块,基于预设规则将所述目标位置处的所述隐私信息删除,以得到去隐私的目标媒体信息。
6.根据权利要求5所述的装置,其特征在于,所述确定模块具体用于采用隐私语音识别模型对所述媒体信息进行识别,所述隐私语音识别模型对应至少一种隐私类别,以确定所述媒体信息中属于任一所述隐私类别的隐私信息。
7.根据权利要求6所述的装置,其特征在于,所述确定模块具体用于:
获取历史音频信息;获取所述历史音频信息对应的语料集;将所述语料集中的隐私信息对应的标注,替换为每个隐私信息所属的隐私类别的标识,得到替换语料集;在所述历史音频信息对应的词表中将隐私信息替换为每个隐私信息所属的隐私类别的标识、所述每个隐私信息的发音保持不变,得到修改后的词表;基于所述修改后的词表使用所述历史音频信息训练声学模型,以得到完成训练的声学模型;使用所述替换语料集训练语言模型,以得到完成训练的语言模型。
8.根据权利要求5所述的装置,其特征在于,所述删除模块具体用于:
计算每个所述隐私信息的置信度;根据每个所述隐私信息的置信度,确定置信度大于或等于预设值的第一隐私信息,以及置信度小于所述预设值的第二隐私信息;删除所有所述第一隐私信息,保留所述第二隐私信息,以得到所述目标媒体信息。
9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器中存储有程序指令,所述处理器运行所述程序指令时,执行权利要求1-4中任一项所述方法中的步骤。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器运行时,执行权利要求1-4任一项所述方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010464829.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种废旧电池回收处理方法
- 下一篇:一种用于税务系统的数据治理方法及系统