[发明专利]通过网站跟踪识别因特网服务提供商的机器学习分类器在审
申请号: | 202080038760.5 | 申请日: | 2020-04-24 |
公开(公告)号: | CN113924563A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 拉维纳·乔杜里;詹姆斯·贝弗里奇;亚历山大·T·施韦尔姆;阿努迪特·维克拉姆 | 申请(专利权)人: | 邓白氏公司 |
主分类号: | G06F16/95 | 分类号: | G06F16/95;G06N20/00;G06N3/02;G06Q10/10 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;李德山 |
地址: | 美国新*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 网站 跟踪 识别 因特网 服务 提供商 机器 学习 分类 | ||
一种用于识别和分类在网站上跟踪的访问者信息以识别因特网服务提供商(ISP)和非因特网服务提供商(非ISP)的方法和系统。该技术采用机器智能,以通过网站跟踪技术,在企业统计结构上丰富的访问者智能上训练分类器。ISP分类器可以将ISP与非ISP区分开,以识别可归因于ISP的给定网站的网站业务。
相关申请的交叉引用
本申请要求于2019年4月25日提交的美国临时专利申请第62/838,782号的优先权,该美国临时专利申请的全部内容通过引用并入本文。
公开内容的背景
1.技术领域
本公开内容涉及用于商业智能、客户关系管理(CRM)系统、营销自动化平台和网络分析系统的系统和方法。
2.背景技术
用于网络业务的当前系统——例如,如由CRM系统、商业智能和网络分析系统使用的——想要用于区分网站上的业务类型(例如,人类业务与非人类业务)的解决方案。
发明内容
期望能够准确地识别来自网站上的访问者客户端计算机活动的业务是因特网服务提供商(ISP)还是非ISP。通常依赖于已知ISP或高知名商业(例如财富500强)的简单列表的方法和系统在识别客户端计算机网络业务的识别方面可能存在技术上的缺陷。这些方法产生许多误报(错误标记的ISP)和漏报(错误标记的非ISP)。它们也不利用来自访问者智能(VI)的网站上真实的、跟踪的网络业务数据。这些其他方法也无法使用本地公司名称识别全球业务。如本文中所描述的实施方式使用VI和机器智能来确定被跟踪实体是否是VI背景下的ISP。
以下简要描述实施方式的一些方面的基本理解。其目的仅仅是以简化的形式呈现一些概念,作为稍后呈现的更详细的描述的序言。
本文中的描述是用于使用机器智能的计算机系统、方法和计算机程序产品的实施方式。
数据库、映射和分类器的布置提供了改进的潜在定位平台,该平台相比于当前的客户关系管理(CRM)系统而言包括以下非限制性的优点。
在以下实施方式中,描述了被配置成执行用于识别网站上的ISP业务的分析的系统及其过程。
因此,在实施方式中,本文中描述了一种方法和计算机系统以及针对由计算机系统执行的方法的计算机程序产品,该计算机系统包括一个或更多个处理器以及计算机可读存储介质,该计算机可读存储介质被编码有能够由处理器中的至少一个执行的指令,并且可操作地耦接至处理器中的至少一个,该方法包括:
获得网站数据业务内容,网站数据业务内容包括网站的IP地址数据;
将IP地址数据映射到商业实体标识符,以识别与网站数据业务数据相关联的商业实体;
获得与商业实体标识符相关联的每个商业实体的属性数据,以识别与映射到IP地址数据的商业实体相关联的商业属性;
根据网站数据业务内容和属性数据生成训练数据集,用于训练因特网服务提供商(ISP)分类器以识别与所映射的网络业务数据相关联的ISP;
将ISP分类器应用于网站跟踪数据的数据库;以及
识别可归因于ISP的网站的网站业务。
在实施方式中,该方法包括:
根据映射到商业实体标识符的网站业务数据获得IP地址的匹配接受率;以及
根据来自与商业实体标识符匹配的网站业务数据的IP地址生成训练数据集。
在实施方式中,该方法包括:用来自先前映射或匹配到其他商业实体的网站业务数据的先前识别的IP地址替换来自映射到商业实体标识符的网站业务数据的IP地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邓白氏公司,未经邓白氏公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080038760.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多用途机器人臂的控制
- 下一篇:用于制造石墨烯膜的设备、方法和系统