[发明专利]一种专利技术演化分析方法及系统在审
申请号: | 201610087487.0 | 申请日: | 2016-02-16 |
公开(公告)号: | CN105677907A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 林鸿飞;祖坤琳 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/18 |
代理公司: | 大连星海专利事务所 21208 | 代理人: | 徐雪莲 |
地址: | 116023 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 专利技术 演化 分析 方法 系统 | ||
1.一种专利技术演化分析方法,其特征在于,包括以下步骤:
S1:专利数据采集:
利用网络爬虫技术从专利信息网站中采集包含有预设时间区间和关键词的 专利信息数据并保存至本地;
S2、专利信息抽取:包括以下步骤:
A1、创建专利信息数据库,将步骤S1采集到的专利信息数据进行格式化处 理,存入所述专利信息数据库;
A2、从专利数据库中抽取字段信息并将其以文本文件格式保存至本地,并使 每一个专利对应文本中的一行;所述字段信息包括:申请日、专利标题和专利 摘要;
S3、技术发展阶段自动化分:包括以下步骤:
B1、建立专利数据的向量空间模型:对步骤S2抽取到的字段信息中的专利 摘要部分进行分词得到分词词语集,将分词词语集中的词语作为特征词,统计 每个特征词在多少专利摘要中出现过,以及该特征词在每个专利摘要中出现的 次数,得到每个特征词在每个专利中的权重;以每个专利中所包有的特征词的 个数作为向量维度,而将每个特征词在该专利中的权重作为向量元素生成每个 专利所对应的专利向量表示;按照字段信息中申请日的时间先后顺序,以预设 年度区间为时间区间对所述专利向量进行排序,得到该年度区间专利的向量空 间模型;
B2、使用有序聚类方法自动划分技术的发展阶段:
利用有序聚类方法对向量空间中的向量作为有序样本进行聚类,将聚类结果 作为技术发展阶段,并递归计算不同分类结果的类的直径和误差函数,根据误 差函数衡量聚类的性能以确定最佳分类;
S4、技术演化分析:
统计步骤B2得到的每个技术发展阶段中所有特征词的词频,得到词频最高 的若干个特征词作为本技术发展阶段的技术热点;
S5技术发展趋势预测:
利用统计软件统计专利信息数据库中每年专利的数量,以年份为横坐标, 数量为纵坐标,绘制数量变化曲线,并将曲线与标准的技术生命周期曲线对比, 作为技术未来发展趋势预测结果。
2.根据权利要求1所述的一种专利技术演化分析方法,其特征在于,步骤 A2中,将抽取的字段信息,以“日期/标题/摘要”的文本文件格式存储到本地。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610087487.0/1.html,转载请声明来源钻瓜专利网。