[发明专利]一种专利技术演化分析方法及系统在审
申请号: | 201610087487.0 | 申请日: | 2016-02-16 |
公开(公告)号: | CN105677907A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 林鸿飞;祖坤琳 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/18 |
代理公司: | 大连星海专利事务所 21208 | 代理人: | 徐雪莲 |
地址: | 116023 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 专利技术 演化 分析 方法 系统 | ||
技术领域
本发明涉及本发明涉及文本挖掘、机器学习和专利分析领域,尤其是一种 专利技术演化分析方法及系统。
背景技术
专利信息集是目前世界上最大的技术信息集,几乎囊括了一切应用领域的技 术成果。专利体现特定技术领域的发明情况,以往的研究也指出专利中的相当 一部分信息是较新的。专利中包含的研究成果具有商业、工业、法律和决策等 多种价值,如果进行仔细分析,发现技术细节和技术之间的关联,可以揭示商 业趋势,激发新的工业解决方案,帮助决策者制定投资政策。
专利文献的快速增长推动先进的专利分析技术的发展,所谓专利分析,就是 从专利文献中采集专利信息,通过科学的方法对专利信息进行加工、整理、分 析,最终形成专利情报和谋略。随着专利信息量的不断增长,无论从法律还是 管理角度,专利的检索和分析任务都变得非常重要。专利文献中包含了十多个 可供分析的项目,包括结构化信息和非结构化信息。结构化信息具有统一的语 义和格式,如专利号、申请日期、分类号等,非结构化的信息是自由的文本信 息,如专利标题、摘要和正文描述等。
关于专利技术演化历程的研究,CN101989268.A提供了一种专利技术发展趋 势分析系统及分析方法,根据预设主题在各国专利文献数据库中通过检索建立 专利数据库;采用专题建立模块在专利数据库中检索专利数据库中专利,建立 专利分析专题库;采用技术分类模块对专利分析库中的专利文献按技术进行分 类;通过技术选择模块选择分析的技术分类;通过图像显示模块显示所选技术 分类下历年专利申请数量或公开数量曲线图;该发明通过曲线图直观反映专利 技术的历年发展趋势情况。CN103177010.A提供的专利分析方法,设定进行专 利分析的纵轴属性,并根据该属性查找相应的专利信息;设定进行专利分析的 横轴属性,并根据该属性查找相应的专利信息项目;绘制由横轴和纵轴组成的 表格,同时将前两步查找到的专利信息交集进行数量统计后输入表格中。
然而,专利的内容本身含有重要的技术信息。以上成果均没有利用专利数 据的深层文本信息。任何技术都有萌芽期、成长期、成熟期、衰落期,因此技 术发展周期的划分和对其发展阶段的判断是重要的专利分析任务,目前对于时 空维度的分析手段远远不能满足我们认识技术演化过程及其特征的需要。
发明内容
本发明的目的是提供一种利用专利的深层文本信息预测技术发展趋势、使用 户充分直观的了解技术演化过程的专利技术演化分析方法及系统。
本发明解决现有技术问题所采用的技术方案:一种专利技术演化分析方法, 包括以下步骤:
S1:专利数据采集:
利用网络爬虫技术从专利信息网站中采集包含有预设时间区间和关键词的 专利信息数据并保存至本地;
S2、专利信息抽取:包括以下步骤:
A1、创建专利信息数据库,将步骤S1采集到的专利信息数据进行格式化处 理,存入所述专利信息数据库;
A2、从专利数据库中抽取字段信息并将其以文本文件格式保存至本地,并使 每一个专利对应文本中的一行;所述字段信息包括:申请日、专利标题和专利 摘要;
S3、技术发展阶段自动化分:包括以下步骤:
B1、建立专利数据的向量空间模型:对步骤S2抽取到的字段信息中的专利 摘要部分进行分词得到分词词语集,将分词词语集中的词语作为特征词,统计 每个特征词在多少专利摘要中出现过,以及该特征词在每个专利摘要中出现的 次数,得到每个特征词在每个专利中的权重;以每个专利中所包有的特征词的 个数作为向量维度,而将每个特征词在该专利中的权重作为向量元素生成每个 专利所对应的专利向量表示;按照字段信息中申请日的时间先后顺序,以预设 年度区间为时间区间对所述专利向量进行排序,得到该年度区间专利的向量空 间模型;
B2、使用有序聚类方法自动划分技术的发展阶段:
利用有序聚类方法对向量空间中的向量作为有序样本进行聚类,将聚类结果 作为技术发展阶段,并递归计算不同分类结果的类的直径和误差函数,根据误 差函数衡量聚类的性能以确定最佳分类;
S4、技术演化分析:
统计步骤B2得到的每个技术发展阶段中所有特征词的词频,得到词频最高 的若干个特征词作为本技术发展阶段的技术热点;
S5技术发展趋势预测:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610087487.0/2.html,转载请声明来源钻瓜专利网。