[发明专利]一种人机识别的方法和系统在审
申请号: | 201210330851.3 | 申请日: | 2012-09-07 |
公开(公告)号: | CN103678346A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 刘海峰 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/12 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人机 识别 方法 系统 | ||
1.一种人机识别的方法,其特征在于,包括:
生成用户行为模型,所述用户行为模型包括正常用户行为概率值范围;
接收WEB页面请求;
依据所述WEB页面请求计算相应的用户行为概率值;
判断所述用户行为概率值是否在所述正常用户行为概率值范围内,若是,则所述WEB页面请求为正常用户发起的请求;若否,则所述WEB页面请求为异常用户发起的请求。
2.根据权利要求1所述的方法,其特征在于,所述用户行为模型还包括异常用户行为概率值范围,
所述判定为异常用户发起的请求为在所述异常用户行为概率值范围内的用户行为概率值所对应的WEB页面请求。
3.根据权利要求1或2所述的方法,其特征在于,所述生成用户行为模型的步骤包括:
采集WEB请求信息的原始数据,所述原始数据包括:用户浏览的多WEB页面的跳转关系;用户WEB页面请求对应的页面的停留时间;用户WEB页面请求的初始页面;和/或,客户端抓取的鼠标和键盘信息输出值;
根据所述原始数据获得WEB请求信息的样本数据,所述样本数据包括正常用户行为的样本数据;
依据所述样本数据进行模型训练,获得概率值范围,所述概率值范围包括正常用户行为概率值范围;
依据所述概率值范围生成用户行为模型。
4.根据权利要求3所述的方法,其特征在于,所述根据样本数据的概率值范围生成用户行为模型的步骤包括:
将所述样本数据的正常用户行为概率值范围通过均值和方差计算得到正常用户的正态分布;
将所述正常用户的正态分布作为用户行为模型。
5.根据权利要求4所述的方法,其特征在于,所述样本数据还包括异常用户行为的样本数据;所述概率值范围还包括异常用户行为概率值范围;
所述根据样本数据的概率值范围生成用户行为模型的步骤还包括:
将所述样本数据的异常用户行为概率值范围通过均值和方差计算得到异常用户的正态分布;
将所述异常用户的正态分布作为用户行为模型。
6.根据权利要求1或2或3或4或5所述的方法,其特征在于,所述依据样本数据进行模型训练,获得概率值范围的步骤,进一步包括:
选取隐半马尔科夫模型,获得所述隐半马尔科夫模型的初始参数;
将所述样本数据分成N部分,计算每部分的隐半马尔科夫模型的初始参数,所述N为正整数;
根据所述每部分的隐半马尔科夫模型的初始参数,采用遗传算法计算得到最优的隐半马尔科夫模型的初始参数;
对所述最优的隐半马尔科夫模型的初始参数进行参数重估,得到重估的隐半马尔科夫模型的初始参数;
依据所述重估的隐半马尔科夫模型的初始参数计算样本数据的概率值范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210330851.3/1.html,转载请声明来源钻瓜专利网。