[发明专利]智能客服中的会话主题识别方法在审
申请号: | 201711305527.5 | 申请日: | 2017-12-11 |
公开(公告)号: | CN107861951A | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 章振增 | 申请(专利权)人: | 康成投资(中国)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06Q30/00 |
代理公司: | 上海盈盛知识产权代理事务所(普通合伙)31294 | 代理人: | 孙佳胤 |
地址: | 200436*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 客服 中的 会话 主题 识别 方法 | ||
技术领域
本发明涉及语义识别技术领域领域,尤其涉及一种智能客服中的会话主题识别方法。
背景技术
随着在线购物规模的不断扩大以及线上购物顾客数不断增长,电商网站需要提供越来越多的客服人员以满足顾客在购物过程中的信息咨询需求。随着当前人力成本的不断上升,电商企业需要投入的客单维护成本也逐渐成为制约电商规模化发展制约要素之一,因而在这过程中电商智能客服机器人需求也变得越来越加强烈。电商智能客服机器人不仅可以极大的减少客服成本,而且还可以实现当客户规模迅速增大时只需简单地增加机器就可以快速满足需求,而不需要大量扩大客服人员队伍。
电商智能客服机器人的本质为问答系统,根据用户发出的咨询从知识库中或者通过推理寻找答案返回给客户。然而在电商客服领域的问答中,存在着口语化严重、信息缺省、强上下文关系、问答中有着严密的业务逻辑性等特点,现有的问答语义理解技术还无法达到电商领域智能客服机器人的语义理解需求。和传统的主题识别不同智能客服系统的主题是为了区分不同的业务处理场景。智能客服中的会话的主题决定了答案所属的范畴和不同的业务处理方式,是语义理解中一个关键的子问题。会话主题识别问题实际上是属于一个会话文本的分类问题。文本分类即给定一组已经定义好的类别集合C={c1,c2,…,cn}和一组文本集D={d1,d2,…,dn},找到文本D与分类C之间的映射关系δ:D→C。文本分类在自然语言理解、信息整理、信息过滤筛选等领域都着广泛的使用。
文本分类主要是两个步骤:(1)文本表示,(2)分类学习。文本表示是指将文本内容提取出特征并进行量化作为分类模型的输入参数,这也是一个特征工程,需要进行特征选择、特征提取和特征构造。分类学习主要是训练分类器使得文本的量化特征作为输入可以得到正确的分类。分类学习任务属于监督学习,目的是给定一组分类好的数据集进行训练最终得到一个分类器实现文档与分类间的映射δ:D→C。
然而,目前还没有很好的方法对电商领域中智能客服与客户的会话主题进行识别,进而导致智能客服与客户的沟通效率较低,用户体验较差。
发明内容
本发明提供一种智能客服中的会话主题识别方法,用以解决现有技术不能对智能客服中的会话主题进行准确识别的问题,以提高智能客服的语义理解能力,改善智能客服与客户沟通效率低下的问题,进而增强用户的使用体验。
为了解决上述问题,本发明提供了一种智能客服中的会话主题识别方法,包括如下步骤:
提供多组智能客服与客户的会话语料,并建立多种会话主题类别;
对所述会话语料中客户的问话内容进行语义泛化处理;
对经过语义泛化处理的会话语料进行文本特征提取;
通过领域本体对提取的文本特征进行扩展;
使用主题分类算法对经过扩展的文本特征按照多种会话主题类别进行分类。
优选的,所述多种会话主题类别包括订单、账户、优惠券、商品、其他中的一种或几种。
优选的,所述文本特征包括主题相关词、词性特征、命名实体、句式特征、逻辑特征中的一种或几种。
优选的,对经过语义泛化处理的会话语料进行文本特征提取的具体步骤包括:
采用Tf-Idf方法对经过语义泛化处理的会话语料进行文本特征提取。
优选的,对所述会话语料中客户的问话内容进行语义泛化处理的具体步骤包括:
对所述会话语料中客户问话内容中的实体信息进行语义泛化处理。
优选的,通过领域本体对所述文本特征进行扩展的具体步骤包括:
通过领域本体对所述文本特征进行上位扩展、下位扩展、同义扩展、平级扩展。
优选的,通过领域本体对提取出的文本特征进行扩展的具体步骤还包括:
通过领域本体对提取出的一文本特征进行扩展,以获得与该文本特征对应的扩展集,所述扩展集中包括多个与该文本特征对应的扩展特征;
根据所述扩展集中每个扩展特征与其对应的文本特征之间的关系,赋予每个扩展特征一权重值,以表征每一扩展特征对主题识别的贡献度。
优选的,所述主题分类算法为K最邻近算法或朴素贝叶斯算法。
优选的,使用主题分类算法并根据经过扩展的文本特征对所述会话语料进行分类的具体步骤包括:
所述多种会话主题类别包括订单、账户、优惠券、商品、其他共5种特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康成投资(中国)有限公司,未经康成投资(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711305527.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:异常文本的检测方法和装置
- 下一篇:一种名称自动翻译系统及方法