[发明专利]在文本中添加水印的方法、装置、电子设备及存储介质在审
申请号: | 202011079509.1 | 申请日: | 2020-10-10 |
公开(公告)号: | CN112199944A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 刘顺 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289;G06F40/247;G06N3/04;G06N3/08 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 迟珊珊 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 添加 水印 方法 装置 电子设备 存储 介质 | ||
本发明涉及人工智能技术领域,提供一种在文本中添加水印的方法、装置、电子设备及存储介质,所述方法包括:获取待添加水印的文本并进行分词处理,计算每个分词的频率,并根据频率从多个分词中选取出多个目标分词输入至预先训练好的水印词向量模型中,得到多个相似度列表;计算每个目标分词与对应相似度列表中的每个水印分词的相似度,并将相似度最高的水印分词作为对应的目标分词的目标水印分词;将待添加水印的文本中的多个目标分词替换为对应的目标水印分词得到水印文本。本发明可应用于医疗管理中的处方流转,通过将待添加水印的文本如处方中的多个目标分词替换为对应的目标水印分词,提高了处方流转过程中的安全性及可移植性。
技术领域
本发明涉及人工智能技术领域,具体涉及一种在文本中添加水印的方法、装置、电子设备及存储介质。
背景技术
文本数字水印是水印领域非常重要的一种技术,广泛应用于电子商务、数字版权保护等领域。但是文本数字水印容易被光学字符识别以及格式变换等自动化识别技术识别,识别后破坏水印,导致文本的安全性不高,此外,目前通过移动字符以及移动文本的行还有特征编码等技术对在文本中添加水印的,虽然解决了基本的在文本中添加水印的问题,但是加入水印的信息量有限,无法根据用户的需求及时移植水印,导致水印文本的使用率低、可移植性差。
发明内容
鉴于以上内容,有必要提出在文本中添加水印的方法、装置、电子设备及存储介质,通过将待添加水印的文本中的多个目标分词替换为对应的目标水印分词,提高了水印文本的安全性及可移植性。
本发明的第一方面提供一种在文本中添加水印的方法,所述方法包括:
获取待添加水印的文本;
对所述待添加水印的文本进行分词处理,得到多个分词;
计算每个分词的频率,并根据所述频率从所述多个分词中选取出多个目标分词;
将所述多个目标分词分别输入至预先训练好的水印词向量模型中,得到多个相似度列表,其中,每个相似度列表中包括至少一个水印分词;
计算每个目标分词与对应相似度列表中的每个水印分词的相似度,并将相似度最高的水印分词作为对应的目标分词的目标水印分词;
将所述待添加水印的文本中的所述多个目标分词替换为对应的目标水印分词得到水印文本。
可选的,所述水印词向量模型的训练过程包括:
获取多个文本语料;
对所述多个文本语料进行分词处理,得到多个分词;
根据所述多个分词建立水印词汇表,并对所述水印词汇表中的每个分词进行自编码处理得到每个分词的自编码向量;
计算所述每个分词的自编码向量与预设的输入层权重矩阵的乘积,得到每个分词的词向量;
累加所述水印词汇表中的每个分词的词向量之和再求平均值得到隐藏层向量;
计算所述隐藏层向量与预设的输出层权重矩阵的乘积,得到输出层向量;
使用激活函数将所述输出层向量进行映射得到每个分词的概率分布;
采用损失度量函数计算所述每个分词的概率分布与预设的标签向量之间的损失值;
根据所述损失值采用反向传播算法对所述预设的输入层权重矩阵和所述预设的输出层权重矩阵进行更新得到水印词向量模型。
可选的,所述根据所述频率从所述多个分词中选取出多个目标分词包括:
对所述频率进行降序排序;
从所述降序排序结果中选取排序在前的多个分词作为多个目标分词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011079509.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种重症监护室药液供给装置
- 下一篇:一种产科护理用移动清洗装置