[发明专利]一种企业软件著作权公告信息抓取方法在审
申请号: | 201810324746.6 | 申请日: | 2018-04-12 |
公开(公告)号: | CN108563740A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 周宜星 | 申请(专利权)人: | 苏州市铜钱草科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/18 |
代理公司: | 北京君泊知识产权代理有限公司 11496 | 代理人: | 王程远 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息码 抓取 著作权 公告信息 企业软件 信息库 知识产权信息 知识产权 标记分析 公告数据 基于软件 页面级别 写入 变更 管理 | ||
1.一种企业软件著作权公告信息抓取方法,其特征包括,其主要包含以下结构:
企业信息库、编码管理程序、软件著作权公布数据采集管理模块、信息码管理模块、第一比对信息库、第二比对信息库、企业软件著作权公告信息库和接口管理模块 ;其中信息码管理模块由第一信息码、第二信息码、第三信息码和第四信息码组成 ;企业信息库包含企业信息数据和 SQL 语句管理模块,其通过 SQL 语句条件检索后返回值给编码管理程序确定编码方式,然后输出对应编码方式编码后的企业名称,同时发送到软件著作权公布数据采集管理模块生成相应的以上述编码后的企业名称为变量的 URL,信息码管理模块通过getHTTPPage 方式访问生成的URL,并将获得的页面 HTML 静态化,同时执行信息码管理模块中的标记识别截取页面信息以对应生成第一信息码、第二信息码、第三信息码和第四信息码 ;当第一信息码为空时,系统将返回重新执行企业信息库的 SQL 语句操作,并检查网络、数据可靠性以及各模块运作是否正常 ;当第一信息码不为空,第二信息码为空时,将第三信息码和第四信息码设置为“0”,然后写入第一比对信息库,同时写入企业软件著作权公告信息库 ;当第二信息码不为空,通过信息码管理模块标记识别截取页面信息,去杂后生成第三信息码,当第三信息码也为空时,设置第四信息码为“1”,当第三信息码不为空时,设置第四信息码的值与第三信息码的值相同,与辅助信息一并写入第二比对信息库,同时写入企业软件著作权公告信息库 ;企业软件著作权公告信息库通过 SQL 语句与存贮过程共同组成接口,通过接口管理模块供第三方系统调用。
2.根据权利要求 1 所述的一种企业软件著作权公告信息抓取方法,其特征包括,所述的企业信息库所包含的 SQL 语句管理模块,包括企业类型、企业成立时间、企业注册资金、企业注册地址和企业是否是高新技术企业分别或者组合作为条件检索筛选时所需要的SQL 语句或 SQL 语句集合。
3.根据权利要求 1 和权利要求 2 所述的一种企业软件著作权公告信息抓取方法,其特征包括,企业信息库还可以包含采集比对记录字段集,将比对的结果、比对次数和比对时间进行记录。
4.根据权利要求 1 所述的一种企业软件著作权公告信息抓取方法,其特征包括,所述的辅助数据包括企业名、当前的系统时间、操作人员的 session 值或值的组合和数据对比的次数的信息的一种或多种的集合。
5.根据权利要求 1 和权利要求 2 所述的一种企业软件著作权公告信息抓取方法,其特征包括,每个企业信息库还可以设置一定数量的采样数据进行采样,采样数据包括企业拥有软件著作权公告的一定量的企业,以及没有任何软件著作权的一定量的企业,采样走完整个流程,查看相关采集是否正常,确定网络是否正常,官方公布数据格式是否发生变化和确定所设置的数据编码方式是否正确,采样数据通过独立的字段值进行标识,或者通过单独的表进行存放,在进行比对时,通过 SQL 语句检索获得相应的数据。
6.根据权利要求 1 所述的一种企业软件著作权公告信息抓取方法,其特征包括,当第二信息码不为空时,信息码管理模块还可以设置第四信息码的值为“1”而不采集生成第三信息码。
7.根据权利要求 1 所述的一种企业软件著作权公告信息抓取方法,其特征包括,所述软件著作权公布数据采集管理模块包含手动设置 URL、编码方式和采集规则的程序,当官方机构公布的 URL、发布的编码方式、发布的数据结构发生变更时,软件著作权公布数据采集管理模块的手动设置程序对所发生的变化进行容错更正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州市铜钱草科技有限公司,未经苏州市铜钱草科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810324746.6/1.html,转载请声明来源钻瓜专利网。