[发明专利]制度信息处理方法、装置、计算机系统和介质在审
申请号: | 202010481834.4 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111639161A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 肖向博 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06Q10/10 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 葛琪妮 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 制度 信息处理 方法 装置 计算机系统 介质 | ||
本公开提供了一种制度信息处理方法,应用于计算机系统。该方法包括:获取指定企业的制度信息,并构建用于表征该制度信息的第一特征向量。获取用于表征指定企业所在地区的监管要求信息的第二特征向量。基于第一特征向量和第二特征向量,确定监管要求信息和制度信息之间的匹配度。当二者之间匹配度低于预定阈值时,向指定企业的终端推送指示指定企业的制度制定不符合其所在地区的监管要求的提示信息。本公开还提供了一种制度信息处理装置、计算机系统和介质。
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种制度信息处理方法、装置、计算机系统和介质。
背景技术
通常情况下,企业可对制度信息进行发布和管理。企业所属地区可基于监管要求信息针对企业的制度信息进行监管。企业的制度信息决定了企业的实际业务的实施规范。面对数量众多的企业,监督企业的制度信息其所属地区的监管要求的一致性非常重要。大多数情况下,需要人为比对企业制度信息与地区监管要求的一致性,效率低、时效性差、且准确性也不高。
发明内容
本公开的一个方面提供了一种制度信息处理方法,应用于计算机系统。该方法包括:获取指定企业的制度信息,并构建用于表征该制度信息的第一特征向量。获取用于表征指定企业所在地区的监管要求信息的第二特征向量。基于第一特征向量和第二特征向量,确定监管要求信息和制度信息之间的匹配度。当二者之间匹配度低于预定阈值时,向指定企业的终端推送指示指定企业的制度制定不符合其所在地区的监管要求的提示信息。
可选地,上述方法还包括:在上述构建用于表征所述制度信息的第一特征向量之前,确定制度信息的语言是否为简体中文。如果否,则将制度信息的语言转换为简体中文。
可选地,上述构建用于表征制度信息的第一特征向量包括:利用预先构建的词频-逆文档频率模型对制度信息进行处理,以得到第一特征向量。
可选地,上述利用预先构建的词频-逆文档频率模型对制度信息进行处理,以得到第一特征向量包括:将制度信息输入词频-逆文档频率模型,以由词频-逆文档频率模型执行如下操作:对制度信息进行分词处理,以得到多个分词结果。统计多个分词结果中的每个分词结果在制度信息中的词频。基于每个分词结果的词频和预设语料库,确定每个分词结果的词频-逆文档频率特征。接着,基于多个分词结果各自的词频-逆文档频率特征,构建第一特征向量。
可选地,上述构建用于表征所述制度信息的第一特征向量包括:利用预先构建的词集模型将制度信息表示为独热向量,以作为第一特征向量。
可选地,上述获取用于表征指定企业所在地区的监管要求信息的第二特征向量包括:确定计算机系统的预定存储区域是否存在该监管要求信息的第二特征向量。如果是,则从预定存储区域读取第二特征向量。如果否,则利用网络爬虫从指定网页抓取监管要求信息,其中指定网页用于展示监管要求信息,接着构建用于表征监管要求信息的第二特征向量,并将第二特征向量存储至预定存储区域。
可选地,上述方法还包括:监测上述指定网页。当监测到上述指定网页的更新事件时,利用网络爬虫从上述指定网页抓取更新后的监管要求信息。然后构建用于表征更新后的监管要求信息的第二特征向量,并将第二特征向量存储至预定存储区域。
可选地,上述构建用于表征监管要求信息的第二特征向量和上述构建用于表征更新后的监管要求信息的第二特征向量包括:利用预先构建的词频-逆文档频率模型对监管要求信息进行处理,以得到第二特征向量。或者,利用预先构建的词集模型将监管要求信息表示为独热向量,以作为第二特征向量。
可选地,上述基于第一特征向量和第二特征向量,确定监管要求信息和制度信息之间的匹配度包括如下至少一项:计算第一特征向量和第二特征向量之间的匹配系数,并根据二者之间的匹配系数确定匹配度。计算第一特征向量和第二特征向量之间的余弦相似度,并根据二者之间的余弦相似度确定匹配度。以及计算第一特征向量和第二特征向量之间的明科夫斯基距离,并根据二者之间的明科夫斯基距离确定匹配度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010481834.4/2.html,转载请声明来源钻瓜专利网。