[发明专利]发票类别识别方法、装置、电子设备及可读存储介质在审
申请号: | 201811555038.X | 申请日: | 2018-12-19 |
公开(公告)号: | CN109740642A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 乔媛媛;余剑扬;林文辉;舒南飞;杨洁 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;项京 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键信息 发票类别 分类编码 发票 矩阵 可读存储介质 神经网络模型 电子设备 分类概率 向量 数据挖掘技术 矩阵输入 向量表示 预先建立 应用 | ||
1.一种发票类别识别方法,其特征在于,所述方法包括:
提取待识别发票中的关键信息,对所述关键信息中的每个词进行向量表示,得到关键信息矩阵;
将所述关键信息矩阵输入预先建立的神经网络模型中,得到所述关键信息矩阵对应的分类概率向量,所述神经网络模型是根据各发票中的关键信息以及所述各发票对应的分类编码得到的;
将所述分类概率向量中最大值元素对应的分类编码作为所述待识别发票的分类编码。
2.根据权利要求1所述的发票类别识别方法,其特征在于,所述神经网络模型的建立方法包括:
针对所述各发票中的每个发票,提取该发票中的关键信息,对该发票中的关键信息中的每个词进行向量表示,得到该发票对应的关键信息矩阵;
针对所述各发票中的每个发票,确定该发票对应的分类概率向量,若所述各发票的分类编码中分类编码的种类为N,则分类概率向量的维数为N,且分类概率向量中的N个元素值分别为对应N个分类编码的概率,N为大于1的整数;
对得到的各关键信息矩阵以及所述各关键信息矩阵对应的分类概率向量进行神经网络训练,得到所述神经网络模型。
3.根据权利要求1所述的发票类别识别方法,其特征在于,所述对所述关键信息中的每个词进行向量表示,得到关键信息矩阵,包括:
通过Word2vec对所述关键信息中的每个词进行向量表示,得到关键信息矩阵。
4.根据权利要求1所述的发票类别识别方法,其特征在于,所述关键信息包括:商品和服务名称、规格型号和单位。
5.一种发票类别识别装置,其特征在于,所述装置包括:
关键信息矩阵确定模块,用于提取待识别发票中的关键信息,对所述关键信息中的每个词进行向量表示,得到关键信息矩阵;
神经网络模型处理模块,用于将所述关键信息矩阵输入预先建立的神经网络模型中,得到所述关键信息矩阵对应的分类概率向量,所述神经网络模型是根据各发票中的关键信息以及所述各发票对应的分类编码得到的;
发票类别识别模块,用于将所述分类概率向量中最大值元素对应的分类编码作为所述待识别发票的分类编码。
6.根据权利要求5所述的发票类别识别装置,其特征在于,所述装置还包括:
输入矩阵确定模块,用于针对所述各发票中的每个发票,提取该发票中的关键信息,对该发票中的关键信息中的每个词进行向量表示,得到该发票对应的关键信息矩阵;
输入向量确定模块,用于针对所述各发票中的每个发票,确定该发票对应的分类概率向量,若所述各发票的分类编码中分类编码的种类为N,则分类概率向量的维数为N,且分类概率向量中的N个元素值分别为对应N个分类编码的概率,N为大于1的整数;
神经网络训练模块,用于对得到的各关键信息矩阵以及所述各关键信息矩阵对应的分类概率向量进行神经网络训练,得到所述神经网络模型。
7.根据权利要求5所述的发票类别识别装置,其特征在于,所述关键信息矩阵确定模块,具体用于通过Word2vec对所述关键信息中的每个词进行向量表示,得到关键信息矩阵。
8.根据权利要求5所述的发票类别识别装置,其特征在于,所述关键信息包括:商品和服务名称、规格型号和单位。
9.一种电子设备,其特征在于,包括:处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1~4任一所述的发票类别识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1~4任一所述的发票类别识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811555038.X/1.html,转载请声明来源钻瓜专利网。