[发明专利]一种技术趋势预测方法和系统有效
申请号: | 201911358709.8 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111125315B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 鲍云锋 | 申请(专利权)人: | 北京本应科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F18/23213;G06F40/268;G06Q10/04;G06N7/01;G06N3/0442 |
代理公司: | 北京驰纳南熙知识产权代理有限公司 11999 | 代理人: | 李佳佳 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 技术 趋势 预测 方法 系统 | ||
本发明提供一种技术趋势预测方法和系统,其中方法包括采集论文数据,还包括以下步骤:对所述论文数据进行处理,生成候选的技术词库;基于互信息筛选所述技术词库;计算新词独立成词的概率;使用双向长短记忆网络BI‑LSTM和条件随机场CRF模型提取标题中漏掉的词;预测技术趋势。本发明提出的技术趋势预测方法和系统,通过自然语言处理和时间序列算法通过提取论文的技术特征,解析技术在高维空间下变化关系,并从时间角度预测技术趋势的发展。
技术领域
本发明涉及文献分析的技术领域,特别是一种技术趋势预测方法和系统。
背景技术
随着科学技术的日益发展,技术发展方向也越来越多,技术变化关系也越来越复杂,现阶段已经有数个判断技术趋势的方法,但是这些方法多数是通过专家小组的意见进行判断,但是方法过程复杂,时间成本大。
众所周知的是,对技术趋势进行准确有效的判断,缩小技术判断时间,因此,开发一种技术趋势预测方法和系统是非常具备市场前景的。
公开号为CN106709021A的发明专利公开了一种技术趋势预测方法及系统,其中系统包含一搜寻模块、一专利趋势模块、一商业趋势模块以及一预测模块;搜寻模块用以搜寻对应于一特定技术的多个专利数据;专利趋势模块用以依据所述专利数据产生一第一专利信息;商业趋势模块用以依据相关于所述专利数据的多个目标商业数据产生对应于第一专利信息的一商业趋势信息;专利趋势模块用以依据商业趋势信息产生一第二专利信息,且依据多个预测商业数据产生一第三专利信息。预测模块用以依据第一专利信息、第二专利信息以及第三专利信息产生一技术趋势预测信息。该方法的缺点是仅从检索和商业趋势进行预测,维度单一,难以体现技术对其他技术的价值。
发明内容
为了解决上述的技术问题,本发明提出的技术趋势预测方法和系统,通过自然语言处理和时间序列算法通过提取论文的技术特征,解析技术在高维空间下变化关系,并从时间角度预测技术趋势的发展。
本发明的第一目的是提供了一种技术趋势预测方法,包括采集论文数据,还包括以下步骤:
步骤1:对所述论文数据进行处理,生成候选的技术词库;
步骤2:基于互信息筛选所述技术词库;
步骤3:计算新词独立成词的概率;
步骤4:使用双向长短记忆网络BI-LSTM和条件随机场CRF模型提取标题中漏掉的词;
步骤5:预测技术趋势。
优选的是,所述采集论文数据步骤还包括构建论文数据集合。
在上述任一方案中优选的是,所述步骤11包括采用现有的词性标注进行词性过滤,完成后得到初步的词库。
在上述任一方案中优选的是,所述步骤1还包括使用隐马尔可夫模型HMM方法提高所述技术词库的新词发现。
在上述任一方案中优选的是,所述HMM方法的公式为
其中,x是观察序列,y是状态序列,π(y1)表示第一个状态为y1的概率,表示P表示状态转移概率,i表示第i个状态,n表示状态的数量。
在上述任一方案中优选的是,所述步骤2包括计算新词的互信息,选取合适的阈值,将互信息值低于阈值的新词去掉,计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京本应科技有限公司,未经北京本应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911358709.8/2.html,转载请声明来源钻瓜专利网。