[发明专利]一种人员识别方法及系统在审
申请号: | 201910548568.X | 申请日: | 2019-06-24 |
公开(公告)号: | CN110275956A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 成都数之联科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27;G06K9/62 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 熊曦 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种人员识别方法及系统,包括:采集投诉电话数据,以投诉电话号码作为投诉人唯一的标识,聚合同一投诉人的投诉电话数据;构建关键词表;对投诉电话内容进行分词,构建风险词向量;构建投诉人基本属性向量;人工识别与标注投诉电话数据,将标注后的投诉电话数据作为训练数据;拼接投诉人基本属性向量和风险词向量,构建职业打假人分类模型;使用训练数据训练分类模型,利用训练后的分类模型识别待识别的投诉电话数据,通过分析投诉数据和投诉人的投诉行为准确识别职业打假人。 | ||
搜索关键词: | 投诉电话 投诉 构建 分类模型 人员识别 属性向量 训练数据 词向量 标注 投诉电话号码 关键词表 人工识别 训练分类 分词 拼接 聚合 采集 分析 | ||
【主权项】:
1.一种人员识别方法,其特征在于,所述方法包括:步骤1:采集投诉电话数据,以投诉电话号码作为投诉人唯一的标识,聚合同一投诉人的投诉电话数据;步骤2:构建表征职业打假人投诉内容的关键词表;步骤3:对投诉内容进行分词,并比对分词结果与关键词表,构建基于one‑hot编码方式的风险词向量;步骤4:构建投诉人基本属性向量,包括:投诉次数、投诉频率、投诉区域、投诉最长间隔、投诉最短间隔;步骤5:人工识别投诉电话内容是否为职业打假电话,根据识别结果将相应投诉人标注为职业打假人或非职业打假人,将标注后的投诉电话内容作为训练数据;步骤6:拼接投诉人基本属性向量和风险词向量,使用梯度提升树进行建模,得到职业打假人分类模型;步骤7:使用训练数据训练职业打假人分类模型,利用训练后的职业打假人分类模型识别待识别的投诉电话数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数之联科技有限公司,未经成都数之联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910548568.X/,转载请声明来源钻瓜专利网。