[发明专利]公文辅助写作方法及系统在审
申请号: | 202211546271.8 | 申请日: | 2022-12-05 |
公开(公告)号: | CN115809316A | 公开(公告)日: | 2023-03-17 |
发明(设计)人: | 熊子奇;孔德智;薛彦凯;谭敏 | 申请(专利权)人: | 中电科大数据研究院有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/289;G06F40/30;G06F18/22 |
代理公司: | 北京智桥联合知识产权代理事务所(普通合伙) 11560 | 代理人: | 赵景平 |
地址: | 550081 贵州省贵阳市贵阳*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 公文 辅助 写作 方法 系统 | ||
本发明公开了一种公文辅助写作方法及系统,该方法包括:获取用户的输入文本;确定所述输入文本的向量;利用预先构建的公文文本索引库检索所述输入文本,得到相似标题集合及对应的第一文本块集合;利用预先构建的公文向量索引库检索所述向量,得到相似向量集合及对应的第二文本块集合;根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文;将所述推荐下文推送给所述用户。利用本发明,可以更好地辅助用户完成公文的写作,提升工作效率及写作质量。
技术领域
本发明涉及信息处理技术领域,具体涉及一种公文辅助写作方法及系统。
背景技术
公文是国家机关及政府部门的主要工作方式和展示形式,公文写作对于辅助决策、指导工作、完成任务和政务公开具有重要作用。政策公文具有严格的规范要求和详实的具体内容,要求在文章结构上逻辑清晰、层次清楚,行文结构不能“乱”,要有明确的主题和主线,因此对于工作人员的公文写作能力有很高的要求。公文写作需要一个漫长的学习、训练和积累的过程,对于负责公文写作的工作人员来说,不仅要求具有业务熟悉能力、文笔表达能力,更重要的是知识储备,没有充足的知识储备和业务经验,造成“素材贫乏,资料匮乏,句子缺乏”是公文写作人员面对公文写作的一大问题。现实中更多的工作人员对于公文写作的内心反应就是“不会写、害怕写”,公文写作不仅在素材管理成本、人才培养成本和写作时间成本都是巨大的消耗,更是给工作人员在心理上和精神上造成畏难情绪,影响工作效率。
随着人工智能的兴起,自然语言处理领域的各项技术不断攀高,基于大数据的自动化技术也得到广泛的应用。对于公文写作而言,业界流行两种方法:一是提供搜索能力,即通过搜索引擎提供与写作关键词相似的公文以作参考,在智能化方面,针对关键词的搜索仅仅能够作为写作素材使用,存在公文素材过于粗糙等问题;二是提供文本生成能力,这种方案发挥了人工智能的优势,但是公文领域是一个业务与描述都相对固定、格式化的一个领域,完全基于人工智能的文本生成会导致公文文本过度自由化,仍需要大量的人工参与,在写作成本上并未真正降低。
发明内容
本发明提供一种公文辅助写作方法及系统,可以更好地辅助用户完成公文的写作,提升工作效率及写作质量。
为此,本发明提供如下技术方案:
本发明提供一种公文辅助写作方法,所述方法包括:
获取用户的输入文本;
确定所述输入文本的向量;
利用预先构建的公文文本索引库检索所述输入文本,得到相似标题集合及对应的第一文本块集合;
利用预先构建的公文向量索引库检索所述向量,得到相似向量集合及对应的第二文本块集合;
根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文;
将所述推荐下文推送给所述用户。
可选地,所述方法还包括:按照以下方式构建公文文本索引库:
收集公文资料,所述公文资料包括公文标题和正文;
对所述公文资料进行拆分处理,得到并记录所述公文标题及正文信息,所述正文信息:一个或多个文本块、以及文本块的相对位置;
对所述公文标题和所述文本块建立索引,得到公文文本索引库。
可选地,所述方法还包括:按照以下方式构建公文向量索引库:
利用对比学习模型确定各公文标题及对应的所有文本块的向量;
对所述向量建立索引,得到公文向量索引库。
可选地,所述方法还包括按照以下方式建立所述对比学习模型:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电科大数据研究院有限公司,未经中电科大数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211546271.8/2.html,转载请声明来源钻瓜专利网。