[发明专利]一种机器人催收获取客户意向标签的多标签分类方法有效
申请号: | 202110037569.5 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112732871B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 李电祥;陈学珉;毛骏 | 申请(专利权)人: | 上海畅圣计算机科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06F40/211;G06F40/216;G06F40/289;G06F40/30;G06F18/241;G06F18/2415;G06N3/048;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 丁曼曼 |
地址: | 200433 上海市杨浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器人 催收 获取 客户 意向 标签 分类 方法 | ||
1.一种机器人催收获取客户意向标签的多标签分类方法,其特征在于,包括:
获取催收语音数据,并利用自动语音识别技术将所述催收语音数据转化为文本信息,以得到目标文本数据;
将所述目标文本数据与预设正则表达式进行匹配,得到第一预测标签集;
通过构建词共现矩阵对所述目标文本数据进行特征提取以得到特征词集,并将所述特征词集输入至预先基于注意力机制构建的多标签分类模型,以得到第二预测标签集;
基于所述第一预测标签集和所述第二预测标签集得到客户意向标签集;
其中,所述通过构建词共现矩阵对所述目标文本数据进行特征提取以得到特征词集,包括:
对所述目标文本数据进行语料预处理得到处理后文本数据,并基于所述处理后文本数据构建词共现矩阵;
利用BERT模型对所述词共现矩阵对应的词语进行语义相似度计算,并根据计算得到的语义相似度对所述词共现矩阵对应的词语添加词语权重;
从所述含有词语权重的词共现矩阵中筛选出预设数量的共现词语,以得到所述特征词集;
其中,所述多标签分类模型的构建过程,包括:
按照BERT嵌入层、双向门控循环单元、注意力模块、全连接层和softmax层的顺序构造神经网络模型;
获取催收文本数据,并对每条催收文本数据添加对应的意向标签;
将含有所述意向标签的催收文本数据划分为训练集、验证集和测试集,将所述训练集输入至所述神经网络模型进行训练,并通过所述验证集和所述测试集进行验证和测试,以得到所述标签分类模型;
其中,所述将所述特征词集输入至预先基于注意力机制构建的多标签分类模型,以得到第二预测标签集,包括:
将所述特征词集输入至所述多标签分类模型,通过BERT嵌入层进行向量化操作,并通过双向门控循环单元进行特征提取得到文本特征;
基于所述文本特征得到作为所述注意力模块输入的矩阵Q、矩阵K和矩阵V,并根据预设维度参数,对所述矩阵Q和矩阵K进行尺寸扩大处理;
将所述矩阵V、扩大后矩阵Q和扩大后矩阵K输入至所述注意力模块,并将所述注意力模块的输出结果输入至全连接层和softmax层,以得到所述第二预测标签集;
其中,所述基于所述第一预测标签集和所述第二预测标签集得到客户意向标签集,包括:
对所述第一预测标签集和所述第二预测标签集进行冲突检测,判断是否存在冲突标签;
若存在,则剔除所述第二预测标签集中与所述冲突标签对应的标签,得到剔除后第二预测标签集;
计算所述第一预测标签集和所述剔除后第二预测标签集的并集,以得到所述客户意向标签集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海畅圣计算机科技有限公司,未经上海畅圣计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110037569.5/1.html,转载请声明来源钻瓜专利网。