[发明专利]规章制度文件的处理方法及装置在审
申请号: | 202110338385.2 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113077362A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 林雪能;蒋炜;刘焱军;马楠 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06Q50/18 | 分类号: | G06Q50/18;G06F16/31;G06F16/33;G06F16/35;G06F40/284;G06F40/289 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 贾磊;李辉 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 规章制度 文件 处理 方法 装置 | ||
本发明公开了一种规章制度文件的处理方法及装置,其中,该方法包括:接收待审查的规章制度文件;对待审查的规章制度文件进行文本切割,得到待审查的规章制度条目;对待审查的规章制度条目进行关键词提取;将提取到的关键词输入预先建立的规章制度条目库,查询与待审查的规章制度条目相关的已发布的规章制度条目,根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目,本发明能够提高规章制度文件的审查处理的效率和准确性。
技术领域
本发明涉及数据处理技术领域,特别涉及一种规章制度文件的处理方法及装置。
背景技术
内控合规是境企业机构经营管理的头等大事,要及时和准确地掌握国家法律法规、行业政策和各类监管规定,并将这些外部规定内化为银行及员工行为依据,这是商业银行合规经营的源头和起点,银行规章制度体系庞杂,补丁文件多,存在交叉矛盾的地方,目前银行规章制度的审查处理主要通过人工比对查找相关条目,处理效率和准确性较低。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种规章制度文件的处理方法,用于提高规章制度文件的审查处理的效率和准确性,该方法包括:
接收待审查的规章制度文件;
对待审查的规章制度文件进行文本切割,得到待审查的规章制度条目;
对待审查的规章制度条目进行关键词提取;
将提取到的关键词输入预先建立的规章制度条目库,查询与待审查的规章制度条目相关的已发布的规章制度条目,其中,规章制度条目库存储有多条已发布的规章制度条目;
根据与待审查的规章制度条目相关的已发布的规章制度条目,处理待审查的规章制度条目。
进一步的,在将提取到的关键词输入预先建立的规章制度条目库之前,还包括:
按照如下方式建立规章制度条目库;
获得OA信息系统发送和人工录入的多个已发布的规章制度文件;
对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目;
对已发布的规章制度条目进行关键词提取;
根据提取到的关键词,为已发布的规章制度条目建立数据库索引。
进一步的,还包括:
根据提取到的关键词,确定已发布的规章制度条目的类型;
根据已发布的规章制度条目的类型,对已发布的规章制度条目进行分类存储。
进一步的,对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目,包括:
根据预设的标点符号对已发布的规章制度文件进行文本切割,得到已发布的规章制度条目。
进一步的,对已发布的规章制度条目进行关键词提取,包括:
基于tf-idf算法求解已发布的规章制度条目中每个词的tf-idf值;
将多个词的tf-idf值按照从大到小的顺序排序;
根据排序结果,筛选预定数目词作为已发布的规章制度条目的关键词。
进一步的,基于tf-idf算法求解已发布的规章制度条目中每个词的tf-idf值,包括:按照如下方式确定每个词的tf-idf值:
tf-idf(t,d)=tf(t,d)×idf(t);
其中,t为词,d为文档,tf(t,d)为一个词在文档中出现的次数,n为文档总数,df(t)为包含词t的文档个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110338385.2/2.html,转载请声明来源钻瓜专利网。