[发明专利]一种发现互联网金融舆情监管目标的方法在审

专利信息
申请号: 201711166896.0 申请日: 2017-11-21
公开(公告)号: CN108009219A 公开(公告)日: 2018-05-08
发明(设计)人: 吴震;王秀文;唐兆涵;苏沐冉;冯凯;李秀旺;牛广方 申请(专利权)人: 国家计算机网络与信息安全管理中心;中科天玑数据科技股份有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06Q40/00
代理公司: 北京市盛峰律师事务所 11337 代理人: 于国富
地址: 100029*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 发现 互联网 金融 舆情 监管 目标 方法
【说明书】:

发明公开了一种发现互联网金融舆情监管目标的方法,涉及互联网金融大数据领域。所述方法包括:实时获取备选互联网金融企业的网站地址,并将所述网站地址存储在网页待解析库中;对网页待解析库中新增的网站地址所对应的网页解析,得到备选互联网金融企业的名称,将验证成功后的名称作为互联网金融企业监测目标,完成发现互联网金融舆情监管目标。本发明所述方法自动发现互联网金融企业目标,找到其对应的网站地址,通过初期配置后自循环发现,不需要长期人工干预,通过长期运行有效地发现新增互联网金融企业目标。

技术领域

本发明涉及互联网金融大数据领域,尤其涉及一种发现互联网金融舆情监管目标的方法。

背景技术

近年来随着互联网技术的发展和普及,传统金融机构与互联网企业结合,利用互联网技术提供金融类相关服务,以互联网为平台开展各类金融活动,传统金融机构与互联网企业结合的模式为广大网民带来方便的同时产生诸多弊端。由于信息不透明,行业准入门槛低,相关服务以及资金缺乏监管等原因,造成部分企业资金断裂、无法按约定履行金融合同乃至毁约,给相关参与者造成巨大经济损失,给社会造成巨大不良影响。

舆情监测是现有互联网监测中的一种重要解决方案,舆情监测众多方式中,关键词监测是一种行之有效的手段,通过配置关键词能够对目标在互联网的信息进行监测,及时有效进行预警,但互联网金融企业众多,需要一种能够及时发现互联网金融的监管目标并形成监测关键词的方法。

发明内容

本发明的目的在于提供一种发现互联网金融舆情监管目标的方法,从而解决现有技术中存在的前述问题。

为了实现上述目的,本发明所述发现互联网金融舆情监管目标的方法,所述方法包括:

S1,实时获取备选互联网金融企业的网站地址,并将所述网站地址存储在网页待解析库中;

S2,对网页待解析库中新增的网站地址所对应的网页解析,得到备选互联网金融企业的名称,将验证成功后的名称作为互联网金融企业监测目标,完成发现互联网金融舆情监管目标。

优选地,S1中,通过搜索和/或门户网站扫描,实时获取备选互联网金融企业的网站地址。

更优选地,通过搜索,实时获取备选互联网金融企业的网站地址,具体为:

设置互联网金融行业搜索目标关键词集合,通过自动化采集搜索方式在搜索引擎检索,将搜索引擎返回结果中前三页的每个搜索结果对应的网站地址作为备选互联网金融企业的网站地址。

更优选地,通过门户网站扫描,实时获取备选互联网金融企业的网站地址,具体为:通过扫描互联网金融企业门户网站的网贷平台推荐、查询功能,获取新出现的互联网金融企业的网站页面所对应的网站地址,并将该网站地址作为备选互联网金融企业的网站地址。

优选地,在实时获取备选互联网金融企业的网站地址与将网站地址存储在网页待解析库之间还包括:判断获取的任意一个备选互联网金融企业的网站地址a是否被采集过,如果是,则忽略该网站地址a;如果否,则将该网站地址a存储到网页待解析库中。

优选地,S2具体按照下述实现:

S21,获取网页待解析库中任意一个新增网站地址b对应的网页,判断所述网页是否为互联网金融企业的网站首页,如果是,则进入S22;如果否,则忽略新增网站地址b,继续判断下一个新增网站地址;

S22,从所述互联网金融企业的网站首页上获取页面标题信息;

解析页面标题信息,通过页面标题信息中的分隔符将页面标题信息划分为多段,对每一段进行分词,将分词结果作为新产生的关键词存入标题分词结果库;所述分隔符包括下划线、横杠;

S23,在预先建立的金融语料库的基础上,通过加权方式计算新产生关键词的出现率,得出现率排序低的词,将排序低的词组合为备选互联网金融企业的名称集合;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;中科天玑数据科技股份有限公司,未经国家计算机网络与信息安全管理中心;中科天玑数据科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711166896.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top