[发明专利]一种申报表的分类方法、装置、设备及存储介质在审
申请号: | 201911420087.7 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111190973A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 钱力扬;王培勇;陈宏仁 | 申请(专利权)人: | 税友软件集团股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郄晨芳 |
地址: | 310053 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 申报 分类 方法 装置 设备 存储 介质 | ||
本申请公开了一种申报表的分类方法,包括:预先利用深度学习神经网络训练出分类模型;获取目标申报表的各目标项目名称;将各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。由于分类模型预先学习了各不同类型的财务报表的特征,因此相较于现有技术中通过将目标申报表与标准财务报表进行项目名称匹配以确定目标申报表的报表类型的方式,本方法能够排除掉无关符号、乱码以及表述上的差异等情况对分类的影响,进而提高对申报表进行分类的准确度。本申请还公开了一种申报表的分类装置、设备及计算机可读存储介质,均具有上述有益效果。
技术领域
本发明涉及文件分类领域,特别涉及一种申报表的分类方法、装置、设备及计算机可读存储介质。
背景技术
财务报表包括资产负债表、利润表和现金流量表三种类型;其中,每种类型的财务报表,根据财务制度不同,又包含多种类型的子表。在需要将用户提供的目标申报表整合成上述对应类型财务报表时,需要将目标申报表与上述各类型的财务报表(子表)进行匹配,从而确定出申报表的类型。目前,一般是将目标申报表的各目标项目名称分别与各标准财务报表的各标准项目名称进行匹配,目标申报表的各项目名称与某个标准财务报表的各标准项目名称的整体匹配度达到预设匹配阈值时,则根据该标准财务报表的报表类型确定出该目标申报表的报表类型。但是,由于不同的现实因素影响,用户的目标申报表中可能存在无关符号、乱码以及表述上的差异等情况,因此,按照现有技术中的方法进行匹配,将大大降低与标准财务报表的匹配度,从而使得无法准确地确定出目标申报表的报表类型。
因此,如何准确地对申报表进行分类,是本领域技术人员目前需要解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种申报表的分类方法,能够准确地对申报表进行分类;本发明的另一目的是提供一种申报表的分类装置、设备及计算机可读存储介质,均具有上述有益效果。
为解决上述技术问题,本发明提供一种申报表的分类方法,包括:
预先利用深度学习神经网络训练出分类模型;
获取目标申报表的各目标项目名称;
将所述各目标项目名称输入至预设的分类模型中,并得出对应的分类结果。
优选地,在所述获取目标申报表的各目标项目名称之后,进一步包括:
分别计算各所述目标项目名称与各标准财务报表的标准项目名称的相似度;
确定出相似度超过预设阈值的目标项目名称,并利用标准项目名称更新所述目标项目名称;
对应的,所述将所述各目标项目名称输入至预设的分类模型中,并得出对应的分类结果的过程,具体为:
将更新后的各所述目标项目名称输入至预设的所述分类模型中,并得出对应的分类结果。
优选地,进一步包括:
将所述目标申报表中的各目标项目名称与预先按照预设数据结构存储的预存项目名称进行匹配;
将匹配成功的目标项目名称修改为对应的预存项目名称;
筛选出所述目标申报表中未修改的所述目标项目名称,并进入所述分别计算各所述目标项目名称与各标准财务报表的标准项目名称的相似度的步骤。
优选地,所述分别计算各所述目标项目名称与各标准财务报表的标准项目名称的相似度的过程,具体包括:
将所述目标项目名称和所述标准项目名称分别切分为目标词语和标准词语;
依据所述目标词语和所述标准词语将所述目标项目名称和所述标准项目名称分别转换为对应的目标向量和标准向量;
将所述目标向量和所述标准向量拼接,并计算出对应的相似度值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于税友软件集团股份有限公司,未经税友软件集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911420087.7/2.html,转载请声明来源钻瓜专利网。