[发明专利]一种社会治理文档摘要抽取方法、装置及电子设备在审
申请号: | 202211219856.9 | 申请日: | 2022-09-30 |
公开(公告)号: | CN115481239A | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 肖刚;吴振刚;姜国晨;孔凡尘;韩府澎 | 申请(专利权)人: | 高创安邦(北京)技术有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/35;G06F40/211;G06F40/284;G06Q50/26 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 王娜 |
地址: | 100071 北京市丰台区南四环西路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社会 治理 文档 摘要 抽取 方法 装置 电子设备 | ||
1.一种社会治理文档摘要抽取方法,其特征在于,包括:
获取待抽取文档数据;
对所述待抽取文档数据进行分句处理得到多个分句数据;
对每一个分句数据进行分词处理,得到每一个分句数据对应的分词数据;
计算所述分词数据对应的词向量数据;
根据所述每一个分句数据对应的词向量数据计算每一分句数据与其他分句数据之间的相似值;
根据所述每一分句数据与其他分句数据之间的相似值计算每一个分句数据在所述待抽取文档数据中的重要等级;
根据所述重要等级确定所述待抽取文档数据对应的摘要。
2.根据权利要求1所述的方法,其特征在于,所述对每一个分句数据进行分词处理,得到每一个分句数据对应的分词数据之后,所述方法还包括:
计算所述分词数据中每一个分词的词频;
根据所述每一个分词的词频确定所述待抽取文档的第一关键词。
3.根据权利要求1所述的方法,其特征在于,所述计算所述分词数据对应的词向量数据之后,所述方法还包括:
根据所述每一个分词的词向量数据计算每一个分词数据与其他分词数据之间的相似值;
根据所述每一个分词数据与其他分词数据之间的相似值计算所述每一个分词的在所述待抽取文档数据中的重要等级;
根据所述每一个分词的在所述文档数据中的重要等级确定所述待抽取文档的第二关键词。
4.根据权利要求1所述的方法,其特征在于,所述待抽取文档数据包括民生类文档数据和/或民安类文档数据。
5.根据权利要求1所述的方法,其特征在于,所述计算所述分词数据对应的词向量数据,包括:
对所述每一个分词数据进行词性标注;
根据词性标注结果确定目标词性的分词数据;
计算每一个目标词性的分词数据对应的词向量数据。
6.一种社会治理文档摘要抽取装置,其特征在于,包括:
获取模块,用于获取待抽取文档数据;
分句模块,用于对所述待抽取文档数据进行分句处理得到多个分句数据;
分词模块,用于对每一个分句数据进行分词处理,得到每一个分句数据对应的分词数据;
第一计算模块,用于计算所述分词数据对应的词向量数据;
第二计算模块,用于根据所述每一个分句数据对应的词向量数据计算每一分句数据与其他分句数据之间的相似值;
第三计算模块,用于根据所述每一分句数据与其他分句数据之间的相似值计算每一个分句数据在所述待抽取文档数据中的重要等级;
第一确定模块,用于根据所述重要等级确定所述待抽取文档数据对应的摘要。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第四计算模块,用于计算所述分词数据中每一个分词的词频;
第二确定模块,用于根据所述每一个分词的词频确定所述待抽取文档的第一关键词。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第五计算模块,用于根据每一个分词的词向量数据计算所述每一个分词的在所述待抽取文档数据中的重要等级;
第三确定模块,用于根据所述每一个分词的在所述文档数据中的重要等级确定所述待抽取文档的第二关键词。
9.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-5任一所述的社会治理文档摘要抽取方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的社会治理文档摘要抽取方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高创安邦(北京)技术有限公司,未经高创安邦(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211219856.9/1.html,转载请声明来源钻瓜专利网。