[发明专利]一种非法用户名的识别方法和系统在审
申请号: | 201611037983.1 | 申请日: | 2016-11-10 |
公开(公告)号: | CN106657016A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 宗志远 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 非法 用户名 识别 方法 系统 | ||
1.一种非法用户名的识别方法,应用于网络服务器,其特征在于,包括如下步骤:
获取用户输入的用户名,所述用户名中包括字符串;
利用预设的基于逻辑斯特回归模型的字符串识别模型对所述用户名进行处理,得到所述用户名的置信度指标;
当所述置信度指标低于预设的置信度阈值时,将所述用户名判定为非法用户名。
2.如权利要求1所述的识别方法,其特征在于,字符串识别模型通过如下步骤获取:
获取多个字符串样本;
提取所述字符串样本的字符串特征;
利用所述字符串特征对预设的逻辑斯特回归模型进行训练,得到所述字符串识别模型。
3.如权利要求2所述的识别方法,其特征在于,所述字符串特征包括:
所述字符串样本的熵;
预选的特征字符在所述字符串样本中出现的次数和概率;
所述特征字符最大连续长度;
任意两种所述特征字符在所述字符串样本中出现次数的比率;
任意两种所述特征字符在所述字符串样本中相互切换的次数和比例;
和/或,任意所述特征字符在所述字符串样本中相互切换的次数和比例。
4.如权利要求3所述的识别方法,其特征在于,所述特征字符为所述字符串样本中的小写字母、大写字母、数字和特殊字符中的部分或全部。
5.如权利要求2所述的识别方法,其特征在于,所述利用所述字符串特征对预设的逻辑斯特回归模型进行训练,得到所述字符串识别模型,包括:
利用所述字符串特征对所述逻辑斯特回归模型进行训练;
在训练过程中对所述逻辑斯特回归模型进行交叉验证和参数调优,得到所述字符串识别模型。
6.一种非法用户名的识别系统,应用于网络服务器,其特征在于,包括:
用户名获取模块,用于获取用户输入的用户名,所述用户名中包括字符串;
置信度计算模块,用于利用预设的基于逻辑斯特回归模型的字符串识别模型对所述用户名进行处理,得到所述用户名的置信度指标;
用户名判定模块,用于当所述置信度指标低于预设的置信度阈值时,将所述用户名判定为非法用户名。
7.如权利要求6所述的识别系统,其特征在于,还包括模型训练模块,所述模型训练模块包括:
样本获取单元,用于获取多个字符串样本;
特征提取单元,用于提取所述字符串样本的字符串特征;
模型训练单元,用于利用所述字符串特征对预设的逻辑斯特回归模型进行训练,得到所述字符串识别模型。
8.如权利要求7所述的识别系统,其特征在于,所述字符串特征包括:
所述字符串样本的熵;
预选的特征字符在所述字符串样本中出现的次数和概率;
所述特征字符最大连续长度;
任意两种所述特征字符在所述字符串样本中出现次数的比率;
任意两种所述特征字符在所述字符串样本中相互切换的次数和比例;
和/或,任意所述特征字符在所述字符串样本中相互切换的次数和比例。
9.如权利要求8所述的识别系统,其特征在于,所述特征字符为所述字符串样本中的小写字母、大写字母、数字和特殊字符中的部分或全部。
10.如权利要求7所述的识别系统,其特征在于,所述模型训练单元包括:
第一训练子单元,用于利用所述字符串特征对所述逻辑斯特回归模型进行训练;
第二训练子单元,用于在训练过程中对所述逻辑斯特回归模型进行交叉验证和参数调优,得到所述字符串识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611037983.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于SDN网络的数据传输方法
- 下一篇:一种农业种植培训信息交互系统