[发明专利]投诉工单结构化处理方法、装置、设备及存储介质在审
申请号: | 202110304054.7 | 申请日: | 2021-03-22 |
公开(公告)号: | CN113064992A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 李骁;赖众程;王亮;高洪喜;吴鹏召;张舒婷;李会璟;李林毅 | 申请(专利权)人: | 平安银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/295;G06K9/62 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 518001 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 投诉 结构 处理 方法 装置 设备 存储 介质 | ||
1.一种投诉工单结构化处理方法,其特征在于,所述投诉工单结构化处理方法包括:
获取当前投诉工单文本、预先训练好的层级文本分类模型和结构化信息抽取模型,其中,所述结构化信息抽取模型是基于Bert-CRF模型构建的;
将所述当前投诉工单文本输入层级文本分类模型中,得到所述当前投诉工单文本的若干个业务层级;
将所述当前投诉工单文本输入所述结构化信息抽取模型的BERT层,得到所述当前投诉工单中各字符的编码向量;
将所述编码向量输入所述结构化信息抽取模型的CRF层,得到所述当前投诉工单文本中所有字符对应的所有标签的概率序列组成的所述当前投诉工单文本的概率矩阵;
根据所述概率矩阵确定所述当前投诉工单文本的最优标注序列,并根据所述最优标注序列得到所述当前投诉工单文本的结构化信息和所述结构化信息对应的命名实体;
根据所述当前投诉工单文本的业务层级、结构化信息以及所述结构化信息对应的命名实体生成所述投诉工单的结构化文档,并将所述结构化文档保存至预设数据库中;
获取用户输入的分析维度,并根据所述分析维度从所述数据库中调取对应的结构化文档,以供所述用户进行分析,其中,所述分析维度与所述命名实体、所述业务层级对应。
2.根据权利要求1所述的投诉工单结构化处理方法,其特征在于,所述根据所述概率矩阵确定所述当前投诉工单文本的最优标注序列,并根据所述最优标注序列得到所述当前投诉工单文本的结构化信息和所述结构化信息对应的命名实体包括:
使用维特比算法处理所述当前投诉工单文本的概率矩阵,得到最优标注序列;
根据所述最优标注序列确定所述当前投诉工单文本中各字符的标注类型,得到所述当前投诉工单文本的标注字序列;
筛选所述标注字序列中标注类型相同且字序为连续的字符,组成结构化信息;
根据所述结构化信息对应的标注类型确定所述结构化信息对应的命名实体。
3.根据权利要求1所述的投诉工单结构化处理方法,其特征在于,在所述获取当前投诉工单文本、预先训练好的层级文本分类模型和结构化信息抽取模型之前,还包括:
获取历史投诉工单数据,并对所述历史投诉工单数据进行数据预处理,得到模型训练样本;
根据所述模型训练样本训练得到层级文本分类模型;
将所述模型训练样本根据预设的标注方法进行标注,得到标注数据;
根据预设的划分比例,将所述标注数据划分为训练集和验证集;
根据所述训练集和所述验证集训练得到结构化信息抽取模型。
4.根据权利要求3所述的投诉工单结构化处理方法,其特征在于,所述层级文本分类模型是基于bert-base模型构建的;
所述根据所述模型训练样本训练得到层级文本分类模型包括:
将所述模型训练样本转化为bert-base模型所需的输入数据格式;
将所述模型训练样本输入bert-base模型中通过所述bert-base模型得到所述模型训练样本的向量表征;
将所述向量表征输入第一分类层得到所述模型训练样本的业务类别一级,并将所述第一分类层的输出与所述向量表征拼接,得到第一特征向量;
将所述第一特征向量输入第二分类层得到所述模型训练样本的业务类别二级,并将所述向量表征、所述第二分类层的输出与所述第一分类层的输出拼接,得到第二特征向量;
将所述第二特征向量输入至第三分类层得到所述模型训练样本的业务类别三级,并将所述第一分类层、所述第二分类层和所述第三分类层的损失函数均设为交叉熵;
将所述模型训练样本进行模型训练得到的业务类别与未进行模型训练时的业务类别进行比较,经过反复迭代优化,得到层级文本分类模型。
5.根据权利要求4所述的投诉工单结构化处理方法,其特征在于,所述将所述模型训练样本转化为bert-base模型所需的输入数据格式包括:
在所述模型训练样本前增加[CLS]标记;
将所述模型训练样本转换为对应的词嵌入,并计算得到每个词所对应的位置嵌入;
将各个词对应的词嵌入和位置嵌入相加,得到bert-base模型所需的输入数据格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110304054.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像清晰度检测方法、装置、设备及存储介质
- 下一篇:摄像镜头