[发明专利]一种实现区域企业专利信息摸底与管理的方法在审
申请号: | 201510539883.8 | 申请日: | 2015-08-31 |
公开(公告)号: | CN105160471A | 公开(公告)日: | 2015-12-16 |
发明(设计)人: | 黄庆梅;郑俊杰;其他发明人请求不公开姓名 | 申请(专利权)人: | 佛山市恒南微科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/18;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 528000 广东省佛山市禅*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种实现区域企业专利信息摸底与管理的方法。本发明公开了一种基于专利的公众公开的登记或变更公告数据的页面级别的通过getHTTPPage方法的抓取技术,再结合数据库技术,采用企业数据预处理,第一次定性查询,第二次定量查询和第三次详情查询,最后进行第二数据库为基础的专利状态监控、年费提醒等监控与管理的方法,本方法无需第三方的各种许可,而是通过合法的数据获取而低成本高速度地实现。 | ||
搜索关键词: | 一种 实现 区域 企业 专利 信息 摸底 管理 方法 | ||
【主权项】:
一种实现区域企业专利信息摸底与管理的方法,其特征包括,其主要包含以下步骤:步骤S102,在企业信息库中读出企业名称的待查数据;步骤S103,将步骤S102所读出的企业名称通过函数转为UTF8编码方式进行数据编码;步骤S104,在步骤S103生成的对应编码方式的数据后,通过URLencode/URLDecode加密/解密函数将上述步骤S103的数据进行加密,并输出为第一变量;步骤S105,以上述第一变量作为对应的URL的对应参数值生成第一URL;步骤S106,通过getHTTPPage方式访问步骤S105生成的第一URL,获得第一URL对应的页面的HTML格式的数据源码供步骤S107进行标记截取;步骤S107,通过S106获得的HTML格式的数据源码,通过以“<title>”标记开始和“</title>”标记结束生成第一信息码;通过如下标记截取生成第二信息码:开始标记为“sop‑totalCount”,结束标记为“</span>]”;当第一信息码的值为空时,返回S102步骤,同时检查网络是否正常;当第二信息码为空时,跳过步骤S108和S109,并设置第三信息码的值为“0”;当第二信息码不为空时,执行步骤S108;步骤S108,生成第三信息码:第二信息码不为空时,第三信息码通过第二信息码去杂质后剩下数字获得;步骤S109,当第二信息码不为空时,将第一信息码、第二信息码和第三信息码的信息,以及相应的辅助数据对应存贮在拥有专利申请的企业信息库中;将所有数据执行步骤S110存入专利企业信息总表,同时返回步骤S101将已经成功检索的记录的进行已执行的标记然后,返回步骤S102循环执行,直至所有符合条件的企业数据检索完成为止;当全部待查的企业信息库中符合条件的数据均已被正确执行,并存入第一比对信息库后,第一比对信息库里的信息即为拥有专利公告信息的企业,接下来执行步骤S201获取详细的专利状态记录及年费信息;步骤S201从第一比对信息库中获取企业名称,将编码方式改为UTF8和URLencode/URLDecode加密/解密函数对应生成符合规范的企业名称数据,并设置为第二变量;步骤S202,生成对应的带第二变量的第二URL,并通过getHTTPPage方式访问第二URL,将结果HTML静态化,供步骤S203分别进行标记截取;步骤S203,根据标记进行HTML内容截取获得第五信息码、第六信息码、第七信息码和第八信息码;当第五信息码为空时,对应的企业的专利公告信息截取出错,返回步骤S201,并检查网络连接状态、第一信息库连接情况和对应的专利公告信息发布网站的URL是否发生变化;当第五信息码不为空,第六信息码为空时,表明该企业对应的专利公告信息公布页面中显示只有一页的对应的专利公告信息,不翻页,程序依次标记并截取生成如下字段:企业名称、专利名称、专利类型、专利法律状态、专利申请号或者专利号和专利公开时间,同时与第二辅助信息存贮到第一企业知识产权信息库;当第五信息码和第六信息码同时不为空,并且第七信息码为空时,第八信息码即为页码,将第八信息码去杂余数字后加入URL的页码参数,生成第三URL,以第三URL中的第八信息码为结束码,0为开始码生成FOR循环列出第三URL的子URL,并且依次执行步骤S203步骤,直至FOR循环结束;步骤S204,通过步骤S203,专利的基本信息存入第一企业知识产权信息库后,按照步骤S201和步骤S202的方法,以第一企业知识产权信息库为数据基础,读取出企业名称、专利名称和专利申请号或者专利号,经过格式转化后获得对应的非加密的企业名称,不带点的专利号和通过URLencode加密后的专利名称,并通过专利号或专利申请号为变量参数,与专利公告发布网站的URL形成第三URL,并通过getHTTPPage方式访问第三URL,将结果HTML静态化,供步骤S205分别进行标记截取;步骤S205,通过标记截取获得第九信息码、第十信息码、第十一信息码和第十二信息码,其中第九信息为申请人名称,第十信息码为专利申请号或者专利号,第十一信息码为申请日期,第十二信息码为专利状态,当专利法律状态为“专利权维持”时,转到对应的以专利申请号或者专利号为变量参数的指向“专利费用信息”的第四URL,并通过getHTTPPage方式访问第四URL,将结果HTML静态化,通过标识截取首年年费金额,将上述信息与第三辅助信息一并存入第二企业知识产权信息库;步骤S206,读出第二企业知识产权信息库的专利状态为“专利权维持”的专利的专利申请号或专利号、专利名称、专利申请日期、专利首年年费金额信息,通过公式计算出第二年所需要缴纳的年费金额及缴费时间,然后发出信号提醒年费时间;步骤S301,上述所有步骤完成后,分别对第一组步骤S101、S102、S103、S104、S105、S106、S107、S108和S109,第二组步骤S201、S202、S203、S204、S205和S206分别设定下一次的执行时间以定期检索,并且可以对S101的企业信息库中新增的企业进行增量的检索;步骤S302,上述所有步骤完成后,结束全部步骤。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山市恒南微科技有限公司,未经佛山市恒南微科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510539883.8/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理