[发明专利]智能客服中的会话主题识别方法在审
申请号: | 201711305527.5 | 申请日: | 2017-12-11 |
公开(公告)号: | CN107861951A | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 章振增 | 申请(专利权)人: | 康成投资(中国)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06Q30/00 |
代理公司: | 上海盈盛知识产权代理事务所(普通合伙)31294 | 代理人: | 孙佳胤 |
地址: | 200436*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 客服 中的 会话 主题 识别 方法 | ||
1.一种智能客服中的会话主题识别方法,其特征在于,包括如下步骤:
建立多种会话主题类别;
对智能客服与客户的会话语料中客户的问话内容进行语义泛化处理;
对经过语义泛化处理的会话语料进行文本特征提取;
通过领域本体对提取的文本特征进行扩展;
使用主题分类算法并根据经过扩展的文本特征对所述会话语料进行分类。
2.根据权利要求1所述的智能客服中的会话主题识别方法,其特征在于,所述多种会话主题类别包括订单、账户、优惠券、商品、其他中的一种或几种。
3.根据权利要求1所述的智能客服中的会话主题识别方法,其特征在于,所述文本特征包括主题相关词、词性特征、命名实体、句式特征、逻辑特征中的一种或几种。
4.根据权利要求1所述的智能客服中的会话主题识别方法,其特征在于,对经过语义泛化处理的会话语料进行文本特征提取的具体步骤包括:
采用Tf-Idf方法对经过语义泛化处理的会话语料进行文本特征提取。
5.根据权利要求1所述的智能客服中的会话主题识别方法,其特征在于,对所述会话语料中客户的问话内容进行语义泛化处理的具体步骤包括:
对所述会话语料中客户问话内容中的实体信息进行语义泛化处理。
6.根据权利要求1所述的智能客服中的会话主题识别方法,其特征在于,通过领域本体对所述文本特征进行扩展的具体步骤包括:
通过领域本体对所述文本特征进行上位扩展、下位扩展、同义扩展、平级扩展。
7.根据权利要求6所述的智能客服中的会话主题识别方法,其特征在于,通过领域本体对提取出的文本特征进行扩展的具体步骤还包括:
通过领域本体对提取出的一文本特征进行扩展,以获得与该文本特征对应的扩展集,所述扩展集中包括多个与该文本特征对应的扩展特征;
根据所述扩展集中每个扩展特征与其对应的文本特征之间的关系,赋予每个扩展特征一权重值,以表征每一扩展特征对主题识别的贡献度。
8.根据权利要求1所述的智能客服中的会话主题识别方法,其特征在于,所述主题分类算法为K最邻近算法或朴素贝叶斯算法。
9.根据权利要求8所述的智能客服中的会话主题识别方法,其特征在于,使用主题分类算法并根据经过扩展的文本特征对所述会话语料进行分类的具体步骤包括:
所述多种会话主题类别包括订单、账户、优惠券、商品、其他共5种特征;假设当前会话已经产生的会话内容S,S经过特征提取得到的一系列的特征F1,F2...Fm,Ci表示会话的主题类型,则主题分类就是找到某个Ci使得满足如下式子:
P(Ci|Fm)>P(Cj|Fm)(i≠j,1≤i,j≤5)
得到概率P(Ci|Fm)最大的主题即为当前的会话所属主题。
10.根据权利要求1所述的智能客服中的会话主题识别方法,其特征在于,对所述会话语料中客户的问话内容进行语义泛化处理之前还包括如下步骤:
对所述会话语料进行分词处理;
去除经分词处理的会话语料中的低频词、停用词、标记信息,所述低频词是在所述会话语料中出现的频率小于预设值的词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康成投资(中国)有限公司,未经康成投资(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711305527.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:异常文本的检测方法和装置
- 下一篇:一种名称自动翻译系统及方法