[发明专利]一种新术语自动发现识别方法有效
申请号: | 201811099604.0 | 申请日: | 2018-09-20 |
公开(公告)号: | CN109344402B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 刘伟;吴雯娜;王星;雷晓 | 申请(专利权)人: | 中国科学技术信息研究所 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/216;G06F40/242 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 梁艳 |
地址: | 100038*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种新术语自动发现识别方法,涉及数据库技术、自然语言处理和新术语自动识别技术领域。该方法首先从中文期刊论文文献的关键词获取候选新术语,然后根据候选新术语的词频在年代分布和学科分布上的特征对候选新术语进行筛选,最后,综合利用候选新术语在各学科上的词频分布、历年词频变化趋势、以及影响因子等多个指标对候选新术语的综合指数进行计算,将综合指数符合学科阈值要求的确定为学科新术语。所以,采用本发明提供的方法,可以自动发现或识别出新术语,为知识组织工具能够及时融入新术语提供了条件。 | ||
搜索关键词: | 一种 术语 自动 发现 识别 方法 | ||
【主权项】:
1.一种新术语自动发现识别方法,其特征在于,包括如下步骤:S1,从文献信息中获取其中的关键词信息和用于对关键词进行处理的相关信息;S2,根据S1中得到的每一条关键词记录,对不规范的关键词进行清洗,得到候选新术语;S3,对S2中得到的候选新术语进行词频统计;S4,根据S3中得到的词频统计结果,将低频候选新术语从候选新术语表中删除;S5,对候选新术语进行词频分析,得到候选新术语的综合指数;S6,将S5中计算得到的综合指数与设定的阈值进行比较,符合条件的综合指数对应的候选新术语为新术语。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术信息研究所,未经中国科学技术信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811099604.0/,转载请声明来源钻瓜专利网。