[发明专利]一种业务需求文本检查方法及相关设备在审
申请号: | 202111061516.3 | 申请日: | 2021-09-10 |
公开(公告)号: | CN113779989A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 陈鑫;高崟鑫;付云攀;李彤敏;闫凌珍 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/194;G06F16/335 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李海建 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 业务 需求 文本 检查 方法 相关 设备 | ||
本公开提供的一种业务需求文本检查方法及相关设备,可以获得目标业务需求文本;对所述目标业务需求文本进行词组分块,获得至少一个第一词组块;对所述至少一个第一词组块进行去重处理,获得至少一个第二词组块;利用所述至少一个第二词组块与预设标准需求文档进行相似度对比,确定所述目标业务需求文本是否为不规范文档。本公开实施例采用自然语言处理技术,对业务需求文档规范进行智能分析,自动审查,筛选出不规范的文档。
技术领域
本公开涉及文本处理技术领域,尤其涉及一种业务需求文本检查方法及相关设备。
背景技术
业务需求文本是体现系统需求结构化的信息,用于实现业务部门和系统开发团队之间进行交流的文本。当前,业务人员编写的业务需求文本常常出现不规范的问题。例如:编写的业务需求文本中的项目编号、项目命名等不规范。因此,如何有效地筛选出不规范的业务需求文档,成为本领域技术人员急需解决的问题。
发明内容
鉴于上述问题,本公开提供一种克服上述问题或者至少部分地解决上述问题的一种业务需求文本检查方法及相关设备,技术方案如下:
一种业务需求文本检查方法,包括:
获得目标业务需求文本;
对所述目标业务需求文本进行词组分块,获得至少一个第一词组块;
对所述至少一个第一词组块进行去重处理,获得至少一个第二词组块;
利用所述至少一个第二词组块与预设标准需求文档进行相似度对比,确定所述目标业务需求文本是否为不规范文档。
可选的,所述对所述目标业务需求文本进行词组分块,获得至少一个第一词组块,包括:
利用Open NLP对述目标业务需求文本进行词组分块,获得至少一个第一词组块,其中,所述第一词组块包括名词短语或动词短语。
可选的,所述对所述至少一个第一词组块进行去重处理,获得至少一个第二词组块,包括:
对所述至少一个第一词组块进行冗余度计算,对重复的所述第一词组块进行去重,将去重后保留下的所述第一词组块确定为第二词组块。
可选的,所述预设标准需求文档中包括预先定义的至少一个标准词语结构模板,所述利用所述至少一个第二词组块与预设标准需求文档进行相似度对比,确定所述目标业务需求文本是否为不规范文档,包括:
在所述至少一个第二词组块中,确定由一个或多个所述第二词组块组成的至少一个目标词语结构;
在预设标准需求文档中分别确定各所述目标词语结构对应的所述标准词语结构模板;
对任一所述目标词语结构:将该目标词语结构与对应的所述标准词语结构模板进行相似度对比,获得该目标词语结构对应的相似度结果,根据所述相似度结果,确定该目标词语结构是否符合规范;
若各所述目标词语结构均符合规范,则确定所述目标业务需求文本为规范文档,若任一所述目标词语结构不符合规范,则确定所述目标业务需求文本为不规范文本。
可选的,所述方法还包括:
在确定任一所述目标词语结构不符合规范之后,根据组成所述目标词语结构的一个或多个所述第二词语块,确定所述目标词语结构在所述目标业务需求文本中的文本位置,并在所述目标业务需求文本的所述文本位置上添加可视化标记,获得携带有所述可视化标记的业务需求处理文本。
可选的,在所述获得携带有所述可视化标记的业务需求处理文本之后,所述方法还包括:
对所述业务需求处理文本进行展示。
可选的,所述标准词语结构模板包括项目编号词语结构、项目名称词语结构以及专业术语结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111061516.3/2.html,转载请声明来源钻瓜专利网。