[发明专利]工程关键词提取方法及装置在审
申请号: | 201711245444.1 | 申请日: | 2017-11-30 |
公开(公告)号: | CN108038100A | 公开(公告)日: | 2018-05-15 |
发明(设计)人: | 张森;杨晓欢;曾勇华 | 申请(专利权)人: | 四川隧唐科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 赵志远 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种工程关键词提取方法及装置,涉及数据处理领域。方法包括:从工程文本中确定出每个具有词性的工程关键词,获得包括多个具有词性的工程关键词的多个工程关键词集合;从多个工程关键词集合中确定出至少一个特征词组;将每个特征词组中的至少一个工程关键词均与预设工程关键词数据库匹配,将匹配度最高的一特征词组作为目标特征词组,将目标特征词组中的待提取的工程关键词作为目标工程关键词提取。通过词性去确定特征词组,再从各特征词组中确定出匹配度最高的特征词组,连续执行确定操作使得目标工程关键词提取的误差率被有效的减小,进而能够准确的提取出目标工程关键词,使得工程关键词在实际应用中的适用性得到提升。 | ||
搜索关键词: | 工程 关键词 提取 方法 装置 | ||
【主权项】:
1.一种工程关键词提取方法,其特征在于,所述方法包括:从工程文本中确定出每个具有词性的工程关键词,获得包括多个具有词性的工程关键词的多个工程关键词集合;从所述多个工程关键词集合中确定出至少一个特征词组,所述至少一个特征词组中每个特征词组均包括根据每个工程关键词的词性确定出:一待提取的工程关键词和与所述待提取的工程关键词的词性相同而词名不同的至少一个工程关键词;将所述每个特征词组中的所述至少一个工程关键词均与预设工程关键词数据库匹配,将匹配度最高的一特征词组作为目标特征词组,将所述目标特征词组中的所述待提取的工程关键词作为目标工程关键词提取。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川隧唐科技股份有限公司,未经四川隧唐科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711245444.1/,转载请声明来源钻瓜专利网。