[发明专利]一种政务文章标题关键字提取方法、设备及存储设备有效
申请号: | 202310467705.3 | 申请日: | 2023-04-27 |
公开(公告)号: | CN116187307B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 李颖;陈胜鹏;梅龙 | 申请(专利权)人: | 吉奥时空信息技术股份有限公司 |
主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F40/216;G06F40/289;G06F40/30;G06F18/22 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 王佩 |
地址: | 430200 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 政务 文章 标题 关键字 提取 方法 设备 存储 | ||
1.一种政务文章标题提取方法,其特征在于:包括以下步骤:
S1:获取短文本集合
S2:从分词结果
S3:根据逆文本频率值IDF对短文本
所述预处理,具体指:去除短文本
S4:计算分词结果
S5:在短文本
S6:根据语义相似度
其中,maxP为分词结果
S7:计算由相邻两个关键词和组成的关键短语
关键短语
S8、按关键词短语得分,由高到低输出提取结果。
2.如权利要求1所述的一种政务文章标题提取方法,其特征在于:步骤S2中逆文本频率值IDF的计算公式如下:
其中
3.如权利要求1所述的一种政务文章标题提取方法,其特征在于:步骤S4中计算语义相似度采用KeyBert方法。
4.如权利要求1所述的一种政务文章标题提取方法,其特征在于:所述占位符为不具备语义的符号。
5.一种存储设备,其特征在于:所述存储设备存储指令及数据用于实现权利要求1~4的任意一种政务文章标题提取方法。
6.一种政务文章标题提取设备,其特征在于:包括:处理器及存储设备;所述处理器加载并执行存储设备中的指令及数据用于实现权利要求1~4的任意一种政务文章标题提取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉奥时空信息技术股份有限公司,未经吉奥时空信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310467705.3/1.html,转载请声明来源钻瓜专利网。