[发明专利]针对业务问题的数据处理方法及其装置在审
申请号: | 202111447931.2 | 申请日: | 2021-11-30 |
公开(公告)号: | CN115344690A | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 薛苏杰 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/216;G06N3/04;G06K9/62;G06F16/332 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 臧霁晨;李啸 |
地址: | 200135 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 业务 问题 数据处理 方法 及其 装置 | ||
本发明涉及一种针对业务问题的数据处理方法及其数据处理装置。该方法包括:特征提取步骤,对于用户输入的业务问题提取关键词,并且获取该用户的用户画像,基于所述关键词和所述用户画像生成特征数据;分类步骤,将所述特征数据输入到预先训练好的分类模型,利用所述分类模型得到所述业务问题对应的业务分类;以及第一匹配步骤,基于所述业务分类将所述特征数据输入到与该业务分类相对应的匹配模型,利用匹配模型得到该业务问题对应的第一解答,其中,对应于不同的业务分类预先训练好对应的匹配模型。根据本发明能够提高业务问题匹配的时效性和准确性。
技术领域
本发明涉及计算机网络技术,具体地涉及一种针对业务问题的数据处理方法以及针对业务问题的数据处理装置。
背景技术
现有技术中对于业务问题进行分类一般采用贝叶斯分类算法、K近邻分类算法、神经网络等。但是,现有的技术方案不能很好的处理小样本数据的分类,同时对于特征数较多地样本不能很好的进行处理,同时没有结合考虑一些先验的知识,针对对外服务咨询过程中的业务分类问题不能进行很好的处理。
现有的问答系统通常是要求用户主动选取需要咨询的问题分类,然后进行相关解答推送和人工处理,用户体验比较差,并且针对同一分类统筹有类似的问题的描述,容易造成用户混淆。
发明内容
鉴于上述问题,本发明旨在提出一种能够对于业务问题进行准确匹配的针对业务问题的数据处理方法以及针对业务问题的数据处理装置。
本发明一方面的针对业务问题的数据处理方法,其特征在于,包括:
特征提取步骤,对于用户输入的业务问题提取关键词,并且获取该用户的用户画像,基于所述关键词和所述用户画像生成特征数据;
分类步骤,将所述特征数据输入到预先训练好的分类模型,利用所述分类模型得到所述业务问题对应的业务分类;以及
第一匹配步骤,基于所述业务分类将所述特征数据输入到与该业务分类相对应的匹配模型,利用匹配模型得到该业务问题对应的第一解答,其中,对应于不同的业务分类预先训练好对应的匹配模型。
可选地,在所述匹配步骤之后进一步包括:
第一判断步骤,判断所述第一匹配步骤输出的第一解答的相似度是否高于预先设置的第一阈值,若高于第一阈值则将所述第一匹配步骤输出的第一解答作为最终结果并结束流程,否则进一步继续以下的第二匹配步骤;以及
第二匹配步骤,将所述特征数据输入预先训练好的兜底模型,利用所述兜底模型得到所述业务问题对应的第二解答。
可选地,在所述第二匹配步骤之后进一步包括:
第二判断步骤,判断所述第二匹配步骤输出的第二解答的相似度是否高于预先设定的第二阈值,若高于第二阈值则将所述第二匹配步骤输出的第二解答作为最终结果并结束流程,否则进一步继续以下的转接步骤;以及
转接步骤,转接到人工处理以实现所述业务问题的解答。
可选地,所述特征提取步骤包括:
分词子步骤,对于与业务问题相关的基础数据进行分词处理得到词向量;
权重获取子步骤,结合预先形成的自定义词库得到该词对应的权重;以及
拼接子步骤,基于所述词向量和所述权重拼接构成句向量并作为所述特征数据,
其中,所述自定义词库通过对多轮分词方法构成。
可选地,所述分类模型是基于支持向量机算法对于收集到已知的业务问题和用户画像进行训练而构建。
可选地,所述分类模型通过以下步骤而构建:
收集子步骤,收集与业务问题和用户画像相关的基础数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111447931.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种样本分析系统和耗材补充的方法
- 下一篇:一种逆止阀生产用逆止功能检验设备