[发明专利]工程关键词提取方法及装置在审
申请号: | 201711245444.1 | 申请日: | 2017-11-30 |
公开(公告)号: | CN108038100A | 公开(公告)日: | 2018-05-15 |
发明(设计)人: | 张森;杨晓欢;曾勇华 | 申请(专利权)人: | 四川隧唐科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 赵志远 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 工程 关键词 提取 方法 装置 | ||
1.一种工程关键词提取方法,其特征在于,所述方法包括:
从工程文本中确定出每个具有词性的工程关键词,获得包括多个具有词性的工程关键词的多个工程关键词集合;
从所述多个工程关键词集合中确定出至少一个特征词组,所述至少一个特征词组中每个特征词组均包括根据每个工程关键词的词性确定出:一待提取的工程关键词和与所述待提取的工程关键词的词性相同而词名不同的至少一个工程关键词;
将所述每个特征词组中的所述至少一个工程关键词均与预设工程关键词数据库匹配,将匹配度最高的一特征词组作为目标特征词组,将所述目标特征词组中的所述待提取的工程关键词作为目标工程关键词提取。
2.根据权利要求1所述的工程关键词提取方法,其特征在于,所述从所述多个工程关键词集合中确定出至少一个特征词组,包括:
根据预设的词性规则,从所述多个工程关键词集合中确定出词性满足所述预设的词性规则的至少一个工程关键词,所述预设的词性规则为所提取的工程关键词的词性为:人名、联系方式、地名或机构名;
将所述至少一个工程关键词中每个工程关键词均作为所述待提取的工程关键词,共至少一个待提取的工程关键词;
从所述多个工程关键词集合中获得所述至少一个待提取的工程关键词中每个待提取的工程关键词所对应的所述至少一个工程关键词,所述至少一个工程关键词与对应的一所述待提取的工程关键词的词性相同而词名不同;
将所述每个待提取的工程关键词和该所述每个待提取的工程关键词对应的所述至少一个工程关键词建立为一特征词组,共获得所述至少一个特征词组。
3.根据权利要求2所述的工程关键词提取方法,其特征在于,所述从所述多个工程关键词集合中获得所述至少一个待提取的工程关键词中每个待提取的工程关键词所对应的所述至少一个工程关键词,包括:
根据所述工程文本的段落信息,获得所述至少一个待提取的工程关键词中所述每个待提取的工程关键词在所述工程文本中的所在段落;
从所述多个工程关键词集合中获得与所述每个待提取的工程关键词的所述所在段落相同的所述至少一个工程关键词。
4.根据权利要求1所述的工程关键词提取方法,其特征在于,所述将所述每个特征词组中的所述至少一个工程关键词均与预设工程关键词数据库匹配,将匹配度最高的一特征词组作为目标特征词组,将所述目标特征词组中的所述待提取的工程关键词作为目标工程关键词提取之前,所述方法包括:
基于用户预先输入的需要获得工程关键词,获得所述预设工程关键词数据库中与所述需要获得工程关键词对应的一预设特征词组。
5.根据权利要求3所述的工程关键词提取方法,其特征在于,所述将所述每个特征词组中的所述至少一个工程关键词均与预设工程关键词数据库匹配,将匹配度最高的一特征词组作为目标特征词组,将所述目标特征词组中的所述待提取的工程关键词作为目标工程关键词提取,包括:
将所述每个特征词组中的所述至少一个工程关键词均与预设特征词组中的至少一个预设工程关键词匹配,获得所述每个特征词组的匹配度;
将匹配度最高的一所述特征词组作为所述目标特征词组,将所述目标特征词组中的所述待提取的工程关键词作为所述目标工程关键词提取。
6.根据权利要求1所述的工程关键词提取方法,其特征在于,所述将所述每个特征词组中的所述至少一个工程关键词均与预设工程关键词数据库匹配,将匹配度最高的一特征词组作为目标特征词组,将所述目标特征词组中的所述待提取的工程关键词作为目标工程关键词提取之后,所述方法还包括:
将所述目标工程关键词所在的所述目标特征词组存储到所述预设工程关键词数据库中,以更新所述预设工程关键词数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川隧唐科技股份有限公司,未经四川隧唐科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711245444.1/1.html,转载请声明来源钻瓜专利网。