[发明专利]一种人员识别方法及系统在审
申请号: | 201910548568.X | 申请日: | 2019-06-24 |
公开(公告)号: | CN110275956A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 成都数之联科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27;G06K9/62 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 熊曦 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 投诉电话 投诉 构建 分类模型 人员识别 属性向量 训练数据 词向量 标注 投诉电话号码 关键词表 人工识别 训练分类 分词 拼接 聚合 采集 分析 | ||
1.一种人员识别方法,其特征在于,所述方法包括:
步骤1:采集投诉电话数据,以投诉电话号码作为投诉人唯一的标识,聚合同一投诉人的投诉电话数据;
步骤2:构建表征职业打假人投诉内容的关键词表;
步骤3:对投诉内容进行分词,并比对分词结果与关键词表,构建基于one-hot编码方式的风险词向量;
步骤4:构建投诉人基本属性向量,包括:投诉次数、投诉频率、投诉区域、投诉最长间隔、投诉最短间隔;
步骤5:人工识别投诉电话内容是否为职业打假电话,根据识别结果将相应投诉人标注为职业打假人或非职业打假人,将标注后的投诉电话内容作为训练数据;
步骤6:拼接投诉人基本属性向量和风险词向量,使用梯度提升树进行建模,得到职业打假人分类模型;
步骤7:使用训练数据训练职业打假人分类模型,利用训练后的职业打假人分类模型识别待识别的投诉电话数据。
2.根据权利要求1所述的一种人员识别方法,其特征在于,构建的关键词表包括6个关键词:标签、过期、日期、赔偿、规定、法规。
3.根据权利要求1所述的一种人员识别方法,其特征在于,采用中科院分词工具进行中文分词,首先构建一个6维风险词向量,每个维度对应关键词表中的一个关键词,如果分词结果中存在关键词表中的词,则将风险词向量对应维度的值设置为1。
4.根据权利要求1所述的一种人员识别方法,其特征在于,投诉次数为该投诉人对应的所有投诉记录数;投诉频率的计算方法为:(投诉人最后一次投诉时间-投诉人首次投诉时间)/投诉人投诉次数;投诉最长间隔即为该投诉人所有投诉中相邻两次投诉的最长间隔时间;投诉最短间隔即为该投诉人所有投诉中相邻两次投诉的最短间隔时间。
5.根据权利要求1所述的一种人员识别方法,其特征在于,梯度提升树为决策树集成算法,描述公式如下:
式(1)为一个叠加模型,即模型的最终输出是多个子模型输出的加权求和,其中βm为子模型h(x;am)的权重,每个子模型h(x;am)使用CART决策树表示;CART决策树是一种二分决策树,在每个节点划分时采用基尼系数来判断一次划分的好坏;梯度提升树采用迭代学习方式;首先让第一棵树h(x;a1)直接拟合数据集的目标列,然后让第二棵树拟合第一棵树与目标列之间的残差,再让第三棵树拟合第二棵树与第一棵树之间的残差,以此类推。
6.一种人员识别系统,其特征在于,所述系统包括:
采集单元,用于采集投诉人的投诉电话数据,以投诉电话号码作为投诉人唯一的标识,聚合同一投诉人的投诉电话数据;
关键词表构建单元,用于构建表征职业打假人投诉内容的关键词表;
分词与风险词向量构建单元,用于对投诉电话内容进行分词,并比对分词结果与关键词表,构建基于one-hot编码方式的风险词向量;
投诉人基本属性向量构建单元,用于构建投诉人基本属性向量,包括:投诉次数、投诉频率、投诉区域、投诉最长间隔、投诉最短间隔;
人工识别和标注训练数据,人工识别投诉电话内容是否为职业打假电话,根据识别结果将投诉人标注为职业打假人或非职业打假人,将标注后的投诉电话内容作为训练数据;
建模单元,用于拼接投诉人基本属性向量和风险词向量,使用梯度提升树进行建模,得到职业打假人分类模型;
训练与识别单元,用于使用训练数据训练职业打假人分类模型,利用训练后的职业打假人分类模型识别待识别的投诉电话内容。
7.根据权利要求6所述的一种人员识别系统,其特征在于,构建的关键词表包括6个关键词:标签、过期、日期、赔偿、规定、法规。
8.根据权利要求6所述的一种人员识别系统,其特征在于,采用中科院分词工具进行中文分词,首先构建一个6维风险词向量,每个维度对应关键词表中的一个关键词,如果分词结果中存在关键词表中的词,则将风险词向量对应维度的值设置为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数之联科技有限公司,未经成都数之联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910548568.X/1.html,转载请声明来源钻瓜专利网。