[发明专利]一种专利技术预测方法及系统在审
申请号: | 201610067078.4 | 申请日: | 2016-01-29 |
公开(公告)号: | CN105760946A | 公开(公告)日: | 2016-07-13 |
发明(设计)人: | 林鸿飞;赵虹杰 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/18;G06F17/27 |
代理公司: | 大连星海专利事务所 21208 | 代理人: | 徐雪莲 |
地址: | 116023 辽宁省大连市高新园区凌工路2号*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 专利技术 预测 方法 系统 | ||
技术领域
本发明涉及对于专利文本的自然语言处理及专利预测领域,尤其是一种专利技术预测方法及系统。
背景技术
随着社会的快速发展,专利在国家科技、经济、和社会发展中起着越来越重要的作用,专利技术也逐渐受到企业的重视。依靠专利技术,不仅可以提高企业的整体竞争力,甚至可以促使企业的发展从无到有,从小到大,从弱到强,所以怎样在海量的专利数据中,找到日后可能成为主流的专利技术(也就是专利机会),在激烈的市场竞争中抢占先机,获得领先优势,受到了社会各界的广泛关注。因此,专利技术的预测是是富有价值的研究工作,但目前在中文专利挖掘中专利技术预测的研究,包括等将数学分析中的形式概念分析法应用于专利挖掘中,跟踪技术变化趋势或者通过时间区间的划分,考察专利数量的变化趋势进行机会发现。前者是理论梳理,缺乏实证性研究,后者但是基于粒度是分类号,很难对付更低层次的特征词级别的发现。
发明内容
本发明的目的是提供一种可应用于大规模的非结构化专利数据,为公众提供一定的指导和参考信息的专利技术预测方法及系统。
本发明解决现有技术问题所采用的技术方案:一种专利技术预测方法,其特征在于,包括以下步骤:
S1、预处理:
采集预定领域的专利摘要组成专利摘要集,利用分词工具对所述专利摘要集中的专利摘要进行分词处理并去除停用词,得到摘要词语集;同时提取专利摘要集中每条专利摘要的专利的申请日,得到与专利摘要集相对应的时间集;
S2、获取词语重要程度:
通过如下公式计算摘要词语集中的每个词语对于每条专利摘要的权重,将该权重作为该词语对于该条专利摘要所对应专利的词语重要度:
其中,weight(i,d)表示词语i对于专利摘要d的权重,tfi,d表示词语i在专利摘要d中出现的频次;ni表示词语i在专利摘要集中出现的频次;N表示专利摘要集中包含的专利摘要总数;
S3、构建高权词集:
预设阈值,将词语重要度大于该预设阈值的词语提取出来作为高权词集,高权词集中的每个词语为高权词;
S4、计算时间因子:
根据时间集由时间函数f(y)获得每个专利的时间因子:
f(y)=eN(y)
其中,y表示专利摘要集中最早的专利的申请日,即起始时间,N(y)表示专利摘要集中专利申请日的最大时间差,即相对的时间间隔;
S5、获取关联强度:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610067078.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理