[发明专利]一种在线售前客服效果评价方法在审
申请号: | 202010016769.8 | 申请日: | 2020-01-08 |
公开(公告)号: | CN111221953A | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 李莉;戚文敏;黄骏;邹苇;吴苛;陆嘉毅 | 申请(专利权)人: | 南京新贝金服科技有限公司;南京理工大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06Q10/06;G06Q30/02;G06F16/951 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210000 江苏省南京市南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 在线 客服 效果 评价 方法 | ||
1.一种在线售前客服效果评价方法,其特征在于,包括如下步骤:
步骤1.基于电子商务网站企业数据库收集原始数据,所述原始数据包括平台用户的注册信息数据、用户访问行为日志数据、购买记录数据与客服记录数据;
步骤2.对原始数据进行预处理,所述预处理包括清理、用户识别与会话切分,从而获得基础数据集;
步骤3.在集成后的基础数据集上构建用于分析的特征指标,所述特征指标的类目包括用户基本属性特征、访问行为特征、购买行为特征与客服特征;
步骤4.使用客服记录数据中的用户满意度作为客服效果评价指标,构建客服效果模型,估计模型参数,计算客服效果;
步骤5.基于客服效果模型参数,对客服效果进行评价。
2.根据权利要求1所述的一种在线售前客服效果评价方法,其特征在于,所述步骤1中,具体包括:
所述步骤1中,具体包括:
所述用户的注册信息数据包括用户性别、年龄、地区、积分数和审核备注字段;所述用户访问行为日志数据记录并存储在网络日志数据库,包括点击的时间、用户点击时的网络IP地址、用户的来源网页和用户的访问请求网页,对于有客服使用记录的用户,提取用户自注册起到首次咨询客服的用户访问日志数据,对于没有客服使用记录的用户,提取用户自注册起至今的用户访问日志数据;所述购买记录数据包括购买时间、商品ID、商品价格、优惠价格、商品类别;从客服记录数据中提取预设的一段时间内完整的客服记录,所述客服记录包括消息ID、会话ID、消息时间、客服消息记录、发送人ID、接收人ID、消息流向,所述客服消息记录以LOB型数据存储,在处理时转换为varchar型数据。
3.根据权利要求2所述的一种在线售前客服效果评价方法,其特征在于,所述步骤2中,对原始数据进行预处理具体包括:
步骤2-1.数据清洗,具体为:
步骤2-1-1.在用户的注册信息数据中,通过用户出生日期计算用户年龄,通过用户注册时间计算其注册时长,在用户注册信息数据中通过审核备注字段剔除测试人员与未录入指定注册信息的人员的数据,所述指定注册信息包括用户出生日期与电话号码;
步骤2-1-2.删除无关的字段和无关的数据记录;所述无关的字段是指在用户访问行为日志数据中除用户IP、cookies、用户代理、访问日期、访问时间、访问来源地址和访问请求地址以外的其他字段;所述无关的数据记录包括网站内部测试账号产生的数据记录、用户注册信息数据中非用户记录的数据以及用户访问行为日志数据中的爬虫数据、图片视频请求数据和异常访问数据,通过用户访问IP判断其所在区域;
步骤2-1-3.在购买记录数据中的用户购买记录中,只保留有效购买订单的用户,删除客服记录数据中的客服广告数据、异常订单记录与企业批量购买的大宗订单记录;
步骤2-1-4.在客服记录数据中,对客服数据进行主题挖掘,具体为:根据会话主题将客服分为售前客服记录数据与售后客服记录数据两类,删除售后客服记录数据,仅提取售前客服记录数据:首先对文档进行会话切分、分词处理并去除停用词与特殊词汇,将短文本的对话信息转化为符合模型要求的词向量表现形式,然后进行特征选择,所述特征选择包括名词短语提取、高频词提取、外部数据集引入与信息熵过滤,特征选择后代入主题挖掘模型提取每段客服对话的主题,删除客服文本中涉及售后服务部分主题的对话记录,所述售后服务部分主题的对话记录包括主题为“理赔”、“赔付”、“发票”、“退保”、“退款”、“保单号”的记录;
步骤2-1-5.对所收集的数据进行无量纲化处理,得到标准化参数数据;
步骤2-2.用户识别,具体为:
步骤2-2-1.将数据清洗后的用户原始数据整理成以用户唯一标示身份为维度;企业数据库中,用户注册信息数据与购买记录数据以用户ID为单位存储;用户访问行为日志数据以cookie、IP地址为单位存储;对于用户访问行为日志数据,提取用户的用户ID、用户姓名、用户访问时间、用户访问模块URL后,通过网络日志数据中的cookies字段来区分不同的用户,若cookie为空值,则用IP地址区分用户;
步骤2-2-2.通过用户ID和cookie或IP地址之间的对应关系将上述数据整合,统一按用户ID存储,在此过程中过滤重复用户,即使用同一IP地址的用户,结合用户代理字段值区分用户,完成用户识别,生成用户的基本数据宽表,将数据集通过计算集成为衡量用户价值的变量,所述衡量用户价值的变量包括用户在整体网站的访问频率、单一网页的访问频率和各类商品的消费频率;
步骤2-3.会话切分具体为:使用日志数据中的时间戳对用户点击流进行会话切分,将同一Cookie离开半小时内再进入的访问记录算作同一个会话。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京新贝金服科技有限公司;南京理工大学,未经南京新贝金服科技有限公司;南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010016769.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电子病历痕迹保留的方法
- 下一篇:混合式培训的实现方法及装置