[发明专利]一种对发票中的商品名称进行归集的方法、装置及设备在审
申请号: | 201811488931.5 | 申请日: | 2018-12-06 |
公开(公告)号: | CN109614616A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 涂昶;王培勇;张帆 | 申请(专利权)人: | 税友软件集团股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06Q30/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 310053 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 遍历 相似度 发票 计算机可读存储介质 装置及设备 发票数据 目标商品 相似程度 选取规则 预设要求 预设 统计 | ||
1.一种对发票中的商品名称进行归集的方法,其特征在于,包括:
提取发票数据中的多个商品名称;
计算各个所述商品名称之间的相似度;
遍历所述商品名称,根据预设选取规则,从与当前遍历到的商品名称之间的相似度满足预设要求的商品名称中选取目标商品名称,作为所述当前遍历到的商品名称的归集结果。
2.如权利要求1所述的方法,其特征在于,所述遍历所述商品名称,根据预设选取规则,从与当前遍历到的商品名称之间的相似度满足预设要求的商品名称中选取目标商品名称,作为所述当前遍历到的商品名称的归集结果,具体包括:
遍历所述商品名称,筛选与当前遍历到的商品名称之间的相似度满足预设要求的商品名称;
通过对比在所述发票数据中与商品名称相关联的特征,对筛选得到的商品名称进行再次筛选;
根据预设选取规则,从经过再次筛选的商品名称中选取目标商品名称,作为所述当前遍历到的商品名称的归集结果。
3.如权利要求2所述的方法,其特征在于,所述在所述发票数据中与商品名称相关联的特征包括商品单位和/或商品价格。
4.如权利要求2所述的方法,其特征在于,所述根据预设选取规则,从经过再次筛选的商品名称中选取目标商品名称,作为所述当前遍历到的商品名称的归集结果,具体包括:
根据预设选取规则,从经过再次筛选的商品名称中选取目标商品名称;
若所述目标商品名称的数量为多个,则判断所述当前遍历到的商品名称的归集次数是否超过预设次数;
若未超过,则根据所述预设选取规则,从所述目标商品名称中选取最终的目标商品名称,作为所述当前遍历到的商品名称的归集结果。
5.如权利要求4所述的方法,其特征在于,在所述根据所述预设选取规则,从所述目标商品名称中选取最终的目标商品名称,作为所述当前遍历到的商品名称的归集结果之后,还包括:
保存所述当前遍历到的商品名称与所述归集结果之间的对应关系。
6.如权利要求1所述的方法,其特征在于,在所述提取发票数据中的多个商品名称之后,且在所述计算各个所述商品名称之间的相似度之前,还包括:
对所述商品名称进行数据清洗。
7.如权利要求1-6任意一项所述的方法,其特征在于,所述遍历所述商品名称,根据预设选取规则,从与当前遍历到的商品名称之间的相似度满足预设要求的商品名称中选取目标商品名称,作为所述当前遍历到的商品名称的归集结果,具体包括:
遍历所述商品名称,根据商品名称的名称长度小于等于当前遍历到的商品名称的名称长度的选取规则,从与所述当前遍历到的商品名称之间的相似度满足预设要求的商品名称中选取目标商品名称,作为所述当前遍历到的商品名称的归集结果。
8.一种对发票中的商品名称进行归集的装置,其特征在于,包括:
商品名称提取模块:用于提取发票数据中的多个商品名称;
相似度计算模块:用于计算各个所述商品名称之间的相似度;
目标商品名称筛选模块:用于遍历所述商品名称,根据预设选取规则,从与当前遍历到的商品名称之间的相似度满足预设要求的商品名称中选取目标商品名称,作为所述当前遍历到的商品名称的归集结果。
9.一种对发票中的商品名称进行归集的设备,其特征在于,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如权利要求1-7任意一项所述的一种对发票中的商品名称进行归集的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任意一项所述的一种对发票中的商品名称进行归集的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于税友软件集团股份有限公司,未经税友软件集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811488931.5/1.html,转载请声明来源钻瓜专利网。