[发明专利]一种敏感信息展示方法及装置有效
申请号: | 201910193716.0 | 申请日: | 2019-03-14 |
公开(公告)号: | CN110110238B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 涂高元;邱志斌;郭永兴;陆云燕;杨其栓;时宜 | 申请(专利权)人: | 厦门天锐科技股份有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/957;G06F16/903;G06Q50/00 |
代理公司: | 福州君越知识产权代理事务所(普通合伙) 35299 | 代理人: | 梁锦平 |
地址: | 361000 福建省厦门市厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 敏感 信息 展示 方法 装置 | ||
1.一种敏感信息展示方法,其特征在于,包括:
在检测到文本内容中存在敏感信息的情形下,计算文本内容大小;
判断所述文本内容大小,在所述文本内容大小未超过预设值的情形下,展示所述文本内容,结束操作;
在所述文本内容大小超过预设值的情形下,获取各敏感信息所在的位置信息;
对所述各敏感信息所在位置信息进行过滤处理,得到去重信息集合;
根据所述去重信息集合对所述文本内容,生成包含敏感信息的待展示内容,展示所述待展示内容;
所述在检测到文本内容中存在敏感信息的情形下,计算文本内容大小,包括:
对文本内容进行检测,在检测到文本内容中存在预设字段的情形下,判定文本内容中存在敏感信息,计算存在所述敏感信息的文本内容大小;
所述在所述文本内容大小超过预设值的情形下,获取各敏感信息所在的位置信息,包括:
从所述文本内容中获取所有的敏感信息所在的起始位置及敏感信息长度,将各敏感信息所在的起始位置和敏感信息长度作为敏感信息所在的位置信息;
根据算法检测模块获取到的位置信息,求取匹配范围的简单合集all_ranges,此时不管顺序和是否重叠;
排序简单合集all_ranges,对集合的排序采用list的sort排序方法;
至此,获取到一个有序的简单的包含匹配范围的集合all_ranges;
对各敏感信息所在位置信息进行过滤处理,得到去重信息集合,包括:
对所述各敏感信息所在位置信息进行合并去重、前后延伸预设字节数,以及匹配位置处理,生成去重信息集合;
所述对所述各敏感信息所在位置信息进行合并去重、前后延伸预设字节数,以及匹配位置处理,生成去重信息集合,包括:
对所述各敏感信息所在位置信息进行合并去重处理;
从所述敏感信息所在的起始位置开始,获取与所述敏感信息长度相同的数据,作为所述敏感信息所在位置信息前后延伸结果;
根据所述敏感信息所在位置信息前后延伸结果进行匹配位置处理,生成去重信息集合;定义两个双向链表(iterPrev、iterCurr),保存当前匹配范围与前一个匹配范围,开始进入合并去重的工作;
进入遍历all_ranges判断接口,进行合并all_range的交叠区域工作,For循环遍历;
在iterCurr到all_ranges的尾部的情形下,定义临时链表RuleMatchRangeprev_range=*iterPrev;临时变量,保存前一个匹配范围的信息;
在iterCurr没有到all_ranges的尾部的情形下,定义临时链表RuleMatchRangecurr_range=*iterCurr;得到临时变量curr_range,保存当前匹配范围的信息,定义start_pos/end_pos,保存计算每次curr_range得到的文本中位置信息;进入延伸匹配位置信息的工作;
所述根据所述去重信息集合对所述文本内容,生成包含敏感信息的待展示内容,包括:
在所述文本内容的基础上,根据去重信息集合,对所述去重信息集合中的各敏感信息进行叠加处理,具体按照预设方式在每个敏感信息的开端增加分隔符做分割,生成包含所述敏感信息的待展示内容;
对当前的range信息进行填充curr_range.start=start_pos;curr_range.length=end_pos-start_pos;
通过if(curr_range.start=prev_range.start+prev_range.length),判断当前的起始位置是否小于前一个的匹配范围range,如果是的话,说明存在交叠部分;否则说明没有交叠部分;
在存在交叠部分的情形下,iterCurr=all_ranges.erase(iterCurr);返回遍历all_ranges判断接口,进行合并all_range的交叠区域工作,进入下一次的迭代;
如果没有交叠部分,将当前匹配范围信息赋值给前一个匹配范围信息iterPrev=iterCurr;当前匹配范围信息自增一处理iterCurr++;完成一次迭代;返回遍历all_ranges判断接口,进行合并all_range的交叠区域工作,进入下一次的迭代;
遍历all_ranges结束;
至此,获取到整理后的信息集合,进入从原始文本串content_org生成裁剪版字符串的工作;
为裁剪文本的子段content_trim预分配内存;
开始遍历all_range,进行叠加拼接;
判断rang的第一个位置如果不是在文本头部则增加省略号,以表示有内容被省略;
计算需要增加的文本串长度,to_add_len=curr_range.length;同时,初始化boolto_break=false,表示文本串未达到上限;
如果叠加的文本串长度(content_trim.length()+to_add_len)超过10k,则重新计算本次应该叠加的长度,to_add_len=10*1024-content_trim.length(),并标记to_break=true,表示完成最后一次叠加后,退出叠加步骤,此时,进行叠加content_trim.append(org_content,curr_range.start,to_add_len);且记录最后一次的文本位置last_end_pos=curr_range.start+to_add_len;
同样,在没超过预设值的情形下,
进行叠加content_trim.append(org_content,curr_range.start,to_add_len);且记录最后一次的文本位置last_end_pos=curr_range.start+to_add_len;如果遍历完成,进行叠加content_trim.append(org_content,curr_range.start,to_add_len);
遍历完如果没有到文本的末尾,则最后加省略号,表示后面有内容被省略,完成拼接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门天锐科技股份有限公司,未经厦门天锐科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910193716.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置