[发明专利]隐私保护方法、装置、电子设备及存储介质在审
申请号: | 202010464829.2 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111625863A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 郭欣;唐大闰;梁志婷;徐浩 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/32;G10L15/06 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 孔默 |
地址: | 200030 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 隐私 保护 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种隐私保护方法、装置、电子设备及存储介质,涉及隐私保护技术领域,该方法包括:接收媒体信息;确定媒体信息中属于指定隐私类别的隐私信息,以及隐私信息在媒体信息中的目标位置;基于预设规则将目标位置处的隐私信息删除,以得到去隐私的目标媒体信息。本申请能够基于隐私类别找到隐私信息并删除,避免通过穷举各个不同的隐私信息找到隐私信息在媒体信息中的位置,能够提高得到去隐私的目标媒体信息的速率。
技术领域
本申请涉及隐私保护技术领域,具体而言,涉及一种隐私保护方法、装置、电子设备及存储介质。
背景技术
在商业活动过程中,顾客的隐私信息譬如住址、姓名、电话等信息需要被保护起来,包含顾客隐私信息的用户信息可以是音频等多种形式的媒体信息,进行隐私保护后达到隐私信息不被数据处理人员接触到的效果。现有的处理隐私信息的方法是穷举每个不同的隐私信息然后进行去隐私处理,由于隐私信息非常庞大,通过穷举法逐一定位每个隐私信息再对其进行处理,存在对媒体信息进行隐私保护处理速率低的问题。
发明内容
本申请的实施例在于提供一种隐私保护方法、装置、电子设备及存储介质,以解决目前方法对媒体信息进行隐私保护处理速率低的问题。
本申请的实施例提供了一种隐私保护方法,所述方法包括:接收媒体信息;确定所述媒体信息中属于指定隐私类别的隐私信息,以及所述隐私信息在所述媒体信息中的目标位置;基于预设规则将所述目标位置处的所述隐私信息删除,以得到去隐私的目标媒体信息。
在上述实现过程中,能够基于每个隐私类别找到对应的隐私信息并删除,避免通过穷举每种隐私类别下各个不同的隐私信息找到并找到各个不同的隐私信息在所述媒体信息中的位置,能够提高得到去隐私的目标媒体信息的速率,以提高隐私保护方法的速率。
可选地,所述媒体信息为音频信息,所述确定所述媒体信息中属于指定隐私类别的隐私信息,以及所述隐私信息在所述媒体信息中的目标位,包括:
采用隐私语音识别模型对所述媒体信息进行识别,所述隐私语音识别模型对应至少一种隐私类别,以确定所述音频信息中属于任一所述隐私类别的隐私信息;确定所述隐私信息在所述媒体信息中的目标位置。
在上述实现过程中,所述隐私语音识别模型基于所述隐私类别,得到所述去隐私的目标媒体信息需要处理的所述隐私类别的隐私信息的位置,避免通过对各个不同隐私信息进行逐一搜索定位得到所述隐私信息的位置,提高隐私保护的效率。
可选地,所述隐私语音识别模型包括完成训练的声学模型和完成训练的语言模型,在所述采用隐私语音识别模型,基于预设的至少一种隐私类别确定所述媒体信息中属于任一所述隐私类别的目标信息包括:
获取历史音频信息;获取所述历史音频信息对应的语料集;将所述语料集中的隐私信息对应的标注,替换为每个隐私信息所属的隐私类别的标识,得到替换语料集;在所述历史音频信息对应的词表中将隐私信息替换为每个隐私信息所属的隐私类别的标识、所述每个隐私信息的发音保持不变,得到修改后的词表;基于所述修改后的词表使用所述历史音频信息训练声学模型,以得到所述完成训练的声学模型;使用所述替换语料集训练所述语言模型,以得到所述完成训练的语言模型。
在上述实现过程中,基于所述历史音频信息对所述隐私语音识别模型进行训练,能够使隐私语音识别模型将音频信息中的属于某一隐私类别的隐私信息识别为该隐私类别,从而通过模型提高隐私信息识别的准确性和效率,以提高隐私信息保护的可靠性。
可选地,所述隐私信息为至少一个时,所述基于预设规则将所述目标位置处的所述隐私信息删除,以得到去隐私的目标媒体信息,包括:
计算每个所述隐私信息的置信度;根据每个所述隐私信息的置信度,确定置信度大于或等于预设值的第一隐私信息,以及置信度小于所述预设值的第二隐私信息;删除所有所述第一隐私信息,保留所述第二隐私信息,以得到所述去隐私的目标媒体信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010464829.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种废旧电池回收处理方法
- 下一篇:一种用于税务系统的数据治理方法及系统