[发明专利]用户信息识别方法、装置、计算机设备和存储介质在审
申请号: | 202210527283.X | 申请日: | 2022-05-16 |
公开(公告)号: | CN115329034A | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 张丹丹;张源;张军帅 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G06Q30/02 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 陈金普 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户信息 识别 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种用户信息识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别的用户信息和敏感词集合;用户信息包括多个子用户信息;对多个子用户信息进行拼接,得到用户信息对应的子用户拼接信息;从敏感词集合中获取一个目标敏感词,若子用户拼接信息包含目标敏感词,则确定用户信息为包含敏感词的目标用户信息。采用本方法能够通过对用户信息中的多个子用户信息进行拼接,将拼接后的子用户拼接信息与敏感词进行匹配,可以根据子用户拼接信息是否包含目标敏感词,确定用户信息是否包含敏感词,从而提高用户信息识别的效率。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种用户信息识别方法、装置、 计算机设备和存储介质。
背景技术
在日常业务中,新增客户资料和更新客户资料时需要采集用户信息,并且 对采集后的用户信息进行用户信息识别,其中包括对敏感词进行识别,判断用 户信息中是否存在敏感词。用户信息包括了多个子用户信息,对敏感词进行识 别需要对用户信息中的多个子用户信息进行敏感词识别。
现有技术利用逐一匹配的方法,对每个敏感词与敏感词库进行逐一匹配识 别。在需要对多项用户信息进行识别时,现有技术存在效率低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高用户信息识别效率 的用户信息识别方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种用户信息识别方法,该方法包括:
获取待识别的用户信息和敏感词集合;用户信息包括多个子用户信息;
对多个子用户信息进行拼接,得到用户信息对应的子用户拼接信息;
从敏感词集合中获取一个目标敏感词,若子用户拼接信息包含目标敏感词, 则确定用户信息为包含敏感词的目标用户信息。
在其中一个实施例中,该方法还包括:
若子用户拼接信息不包含目标敏感词,则返回从敏感词集合中获取一个目 标敏感词的步骤,直到取完敏感词集合中的敏感词。
在其中一个实施例中,用户信息还包括标识信息;
对多个子用户信息进行拼接,包括:
若用户信息中的标识信息未携带敏感词标识,则对用户信息对应的多个子 用户信息进行拼接;敏感词标识用于表征用户信息包含敏感词;
确定用户信息为包含敏感词的目标用户信息之后,包括:
将包含敏感词的目标用户信息对应的标识信息标记为敏感词标识。
在其中一个实施例中,获取待识别的用户信息,包括:
获取存储有用户信息的目标信息数据库;
从目标信息数据库中获取具有预设标识的用户信息,作为待识别的用户信 息。
在其中一个实施例中,从目标信息数据库中获取具有预设标识的用户信息 之前,包括:
获取目标信息数据库当前存储的第一用户信息,以及目标信息数据库预设 日期前存储的第二用户信息;
将第一用户信息中,与第二用户信息不相同的第一用户信息作为增量信息;
为增量信息设置预设标识。
在其中一个实施例中,该方法还包括:
响应于针对敏感词集合的更新操作,获取更新后的敏感词;
利用更新后的敏感词对敏感词集合进行更新处理,得到更新后的敏感词集 合;
从敏感词集合中获取一个目标敏感词,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210527283.X/2.html,转载请声明来源钻瓜专利网。