[发明专利]公文辅助写作方法及系统在审
申请号: | 202211546271.8 | 申请日: | 2022-12-05 |
公开(公告)号: | CN115809316A | 公开(公告)日: | 2023-03-17 |
发明(设计)人: | 熊子奇;孔德智;薛彦凯;谭敏 | 申请(专利权)人: | 中电科大数据研究院有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/289;G06F40/30;G06F18/22 |
代理公司: | 北京智桥联合知识产权代理事务所(普通合伙) 11560 | 代理人: | 赵景平 |
地址: | 550081 贵州省贵阳市贵阳*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 公文 辅助 写作 方法 系统 | ||
1.一种公文辅助写作方法,其特征在于,所述方法包括:
获取用户的输入文本;
确定所述输入文本的向量;
利用预先构建的公文文本索引库检索所述输入文本,得到相似标题集合及对应的第一文本块集合;
利用预先构建的公文向量索引库检索所述向量,得到相似向量集合及对应的第二文本块集合;
根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文;
将所述推荐下文推送给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:按照以下方式构建公文文本索引库:
收集公文资料,所述公文资料包括公文标题和正文;
对所述公文资料进行拆分处理,得到并记录所述公文标题及正文信息,所述正文信息:一个或多个文本块、以及文本块的相对位置;
对所述公文标题和所述文本块建立索引,得到公文文本索引库。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:按照以下方式构建公文向量索引库:
利用对比学习模型确定各公文标题及对应的所有文本块的向量;
对所述向量建立索引,得到公文向量索引库。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括按照以下方式建立所述对比学习模型:
以所述文本块为单位,对所述公文标题和正文进行文本主题聚类,得到多个类别的文本主题和对应的文本数据;
根据所述多个类别的文本主题和对应的文本数据,生成对比数据集;
利用所述对比数据集建立所述对比学习模型。
5.根据权利要求4所述的方法,其特征在于,建立所述对比学习模型还包括:
在对所述公文标题和正文进行文本主题聚类之前,对所述文本块进行分词得到短文本,去除所述短文本中的停用词。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述相似标题集合中包括多个相似标题及其相似度得分;所述相似向量集合中包括多个相似向量及其相似度得分;
所述根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文包括:
根据所述相似标题集合和所述相似向量集合确定最终相似标题集合;
根据所述最终相似标题集合从所述第一文本块集合和所述第二文本块集合中选出相应的文本块作为推荐下文。
7.一种公文辅助写作系统,其特征在于,所述系统包括:
接收模块,用于获取用户的输入文本;
向量确定模块,用于确定所述输入文本的向量;
文本检索模块,用于利用预先构建的公文文本索引库检索所述输入文本,得到相似标题集合及对应的第一文本块集合;
向量检索模块,用于利用预先构建的公文向量索引库检索所述向量,得到相似向量集合及对应的第二文本块集合;
推荐文本确定模块,根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文;
推送模块,用于将所述推荐下文推送给所述用户。
8.根据权利要求7所述的系统,其特征在于,所述系统还包括:公文文本索引库建立模块,用于构建公文文本索引库;所述公文文本索引库建立模块包括:
资料收集单元,用于收集公文资料,所述公文资料包括公文标题和正文;
拆分处理单元,用于对所述公文资料进行拆分处理,得到并记录所述公文标题及正文信息,所述正文信息:一个或多个文本块、以及文本块的相对位置;
文本索引建立单元,用于对所述公文标题和所述文本块建立索引,得到公文文本索引库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电科大数据研究院有限公司,未经中电科大数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211546271.8/1.html,转载请声明来源钻瓜专利网。