[发明专利]一种知识产权大数据情报检索系统及存储介质在审

专利信息
申请号: 202010790501.X 申请日: 2020-08-07
公开(公告)号: CN111737421A 公开(公告)日: 2020-10-02
发明(设计)人: 耿德强;武伟;刘洋;李杨 申请(专利权)人: 杭州六棱镜知识产权科技有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/335;G06F16/338;G06F40/289
代理公司: 杭州创智卓英知识产权代理事务所(普通合伙) 33324 代理人: 唐超文
地址: 310051 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 知识产权 数据 情报 检索系统 存储 介质
【权利要求书】:

1.一种知识产权大数据情报检索系统,其特征在于,包括数据获取模块、数据处理模块、企业评价模块、数据库模块、数据检索模块、数据收藏模块和数据下载模块;

其中,所述数据获取模块用于对多源异构数据进行采集;

所述多源异构数据是指自第三方购买的数据信息,或利用网络蜘蛛技术从网页抓取的数据信息,所述自第三方购买的数据信息来源包括国家知识产权局官方知识产权数据提供方、国家工商局企业注册信用信息提供方、巨潮资讯网、中国行业经济网、中国产业信息网、中国行业信息网、企查查、启信宝和天眼查,所述从网页抓取的数据信息来源包括中国政府网、各地方政府网、企业官方网站、各类征信网、社区论坛和舆情网站;

所述多元异构数据包括企业的知识产权信息、工商注册企业数据信息、企业投资和融资信息以及风险信息,

所述知识产权信息包括企业的技术演进、知识产权获取、知识产权维护、知识产权运用、研发体系、科技团队、高管背景、公司资质、权威奖项、技术标准、研发中心、实验室等信息;

所述工商注册企业数据信息包括公司名称、曾用名、法人名称、成立日期、企业状态、成立日期、社会统一信用社会代码、经营范围、企业logo、注册地、公司简介、官网地址等信息;

所述企业投资和融资信息包括投融资事件、并购事件、投资方等信息;

所述风险信息包括诉讼、知识产权的许可、知识产权的变更、知识产权的质押、知识产权的丧失等信息;

所述数据处理模块包括数据清洗子模块、数据预处理子模块、特征工程子模块、数据分类子模块和标签赋予子模块,所述数据清洗子模块用于去除文本中的噪音信息,所述数据预处理子模块用于执行文本切分处理,所述特征工程子模块用于将原始数据转变成模型的训练数据,所述数据分类子模块用于将数据分类,所述标签赋予子模块用于给企业添加标签;

所述去除文本中的噪音信息是指利用有效信息和噪音信息的区别特征,去除各种导航、链接,广告、声明信息等噪音信息;

所述文本切分处理是指降低文本粒度,去除文本中的停用词、数字、英文及标点符号;

所述将原始数据转变成模型的训练数据是指基于TF-IDF算法,将文本内容转化成数值形式的特征向量,从而得到每篇文档中较为重要的特征向量;

所述企业评价模块用于综合企业各维度知识产权大数据情报对企业投资指数进行评价;

所述数据库模块用于储存添加标签的知识产权大数据情报;

所述数据检索模块用于检索数据库模块知识产权大数据情报;

所述数据收藏模块用于将指定的知识产权大数据情报进行收藏;

所述数据下载模块用于下载目标知识产权大数据情报。

2.根据权利要求1所述的知识产权大数据情报检索系统,其特征在于,所述知识产权大数据情报检索的方法包括以下步骤:

步骤一、数据获取步骤,获取企业相关的多源异构数据信息;

步骤二、数据处理步骤,包括数据清洗、数据预处理、特征工程、数据分类、赋予标签;

步骤三、企业评价步骤:综合企业各维度知识产权大数据情报对企业投资指数进行评价;

步骤四、情报信息存储步骤:储存添加标签的知识产权大数据情报;

步骤五、数据检索步骤:利用检索词、检索式和标签综合索引数据库中的知识产权大数据情报;

步骤六、数据收藏步骤:对指定的知识产权大数据情报进行收藏;

步骤七、数据下载步骤:下载目标知识产权大数据情报。

3.根据权利要求1所述的知识产权大数据情报检索系统,其特征在于,所述有效信息和噪音信息的区别特征包括文本路径比特征、文本路径长度特征、文本标点特征和文本路径层次特征,所述文本路径比特征是指有效信息和噪音信息各自拥有相同或相似的标签路径,且有效信息的标签路径与噪音信息的标签路径不同,所述文本路径长度特征是指有效信息的文本长度比噪音信息的文本长度更长,所述文本标点特征是指有效信息的文本比噪音信息包含有更多的标点符号,所述文本路径层次特征是指网页有效信息比噪音信息拥有更少的修饰信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州六棱镜知识产权科技有限公司,未经杭州六棱镜知识产权科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010790501.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top