[发明专利]一种行业识别模型确定方法和装置有效
申请号: | 201910014638.3 | 申请日: | 2019-01-08 |
公开(公告)号: | CN110009364B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 王立 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06Q20/42 | 分类号: | G06Q20/42;G06Q20/40;G06K9/62 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行业 识别 模型 确定 方法 装置 | ||
本申请提供一种行业识别模型确定方法和装置。先获取已确定行业类型的样本商户,通过预定义的数据提取策略从所述交易信息集合中提取出描述样本商户所在行业的营业形态的行业特征数据,通过行业特征数据训练用于识别商户行业的识别模型。进而可利用识别模型通过识别行业特征确定商户的所在行业,和现有技术汇总基于词库的筛选策略相比,虚假行业类型商户难以规避对于本申请对于行业特征的识别。
技术领域
本说明书涉及互联网技术领域,尤其涉及一种行业识别模型确定方法和装置。
背景技术
随着电子支付的发展,很多商户选择接入支付平台,交易时买家可通过扫码等方式进行电子支付。而对于不同行业的商家,支付平台可能会采用不同的接入规则。举例说明:商户是支付宝会员体系中重要的一部分,为了支持餐饮商户和支付宝的合作,支付宝规定,所有餐饮商户接入支付宝收银即可享受支付宝收款零费率。而与此同时,很多非餐饮商家为了利益,可能会伪造商户门头照、商户名称等申请参与零费率活动。针对这类风险,虽然已经有人工客服的排查,还是会漏过一批非餐饮商户。为了避免不符合条件的商户伪造信息。需要一种商户行业识别方法。
现有技术中,对于商户的行业识别只有基于关键词的识别策略,即维护不同行业对应的相关词库,对提交审核商户的商户名称,商品名称进行排查,但是这种方法比较容易被对方规避,同时还需要定期的对词库进行扩充。
发明内容
针对上述技术问题,本说明书实施例提供一种行业识别模型确定方法和装置,技术方案如下:
根据本说明书实施例的第一方面,提供一种行业识别模型确定方法,该方法包括:
获取至少一个已确定行业类型的样本商户;
获取预设时间段内,包含样本商户每笔交易信息的交易信息集合;
通过预定义的数据提取策略从所述交易信息集合中提取出样本商户的行业特征数据,所述行业特征数据通过样本商户在不同时间点的交易信息描述样本商户所在行业在不同时间点的营业形态;
将样本商户的行业特征数据作为输入数据,训练用于识别商户行业的识别模型。
根据本说明书实施例的第二方面,提供一种基于行业识别模型的商户行业确定方法,该方法包括:
获取预设时间段内,包含待检验商户每笔交易信息的交易信息集合;
通过预定义的数据提取策略从所述交易信息集合中提取出待检验商户的行业特征数据;
将待检验商户的行业特征数据输入训练好的行业识别模型,以确定待检验商户的所在行业。
根据本说明书实施例的第三方面,提供一种行业识别模型确定装置,该装置包括:
样本确定模块:用于获取至少一个已确定行业类型的样本商户;
信息获取模块:用于获取预设时间段内,包含样本商户每笔交易信息的交易信息集合;
数据提取模块:用于通过预定义的数据提取策略从所述交易信息集合中提取出样本商户的行业特征数据,所述行业特征数据通过样本商户在不同时间点的交易信息描述样本商户所在行业在不同时间点的营业形态;
模型训练模块:用于将样本商户的行业特征数据作为输入数据,训练用于识别商户行业的识别模型。
根据本说明书实施例的第四方面,提供一种基于行业识别模型的商户行业确定装置,该装置包括:
信息获取模块:用于获取预设时间段内,包含待检验商户每笔交易信息的交易信息集合;
数据提取模块:用于通过预定义的数据提取策略从所述交易信息集合中提取出待检验商户的行业特征数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910014638.3/2.html,转载请声明来源钻瓜专利网。