[发明专利]智能客服中解决知识库冷启动的方法和装置在审

专利信息
申请号: 202010302957.7 申请日: 2020-04-17
公开(公告)号: CN111538821A 公开(公告)日: 2020-08-14
发明(设计)人: 吴科;徐正虹;吴立楠 申请(专利权)人: 北京智齿博创科技有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/35;G06F40/216;G06F40/30;G06K9/62;G06N20/00
代理公司: 北京远大卓悦知识产权代理事务所(普通合伙) 11369 代理人: 程丽娜
地址: 100020 北京市朝阳*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 智能 客服 解决 知识库 冷启动 方法 装置
【权利要求书】:

1.一种智能客服中解决知识库冷启动的方法,其中,包括:

调取人工客服日志数据进行清洗和预处理,得到候选句集合;

将所述候选句集合中的候选句使用业务词信息进行粗聚类,生成粗分业务簇;

对所述粗分业务簇利用细粒度语义聚合,生成细分业务簇;以及

将每个所述细分业务簇中的句子按照句子出现频次由多至少划分为1个标准句和与所述标准句对应的相似句后,即得到解决知识库冷启动的最终知识库。

2.如权利要求1所述的智能客服中解决知识库冷启动的方法,其中,调取人工客服日志数据进行清洗和预处理包括:

以由同行业或本公司的人工客服获得的人工客服数据作为人工客服日志数据,对所述人工客服日志数据进行去除乱码和网址的清洗操作,然后对清洗后的句子进行长度过滤的预处理操作。

3.如权利要求2所述的智能客服中解决知识库冷启动的方法,其中,以由同行业或本公司的人工客服获得的人工客服数据作为人工客服日志数据包括:

选取人工客服数据中客户一方的句子作为初始句集合,对所述初始句集合中的句子进行清洗和预处理后依存句法分析,过滤掉其中既缺少主语又缺少宾语的句子,获得信息表述清晰的句子,即得到所述候选句集合。

4.如权利要求1所述的智能客服中解决知识库冷启动的方法,其中,将所述候选句集合中的候选句使用业务词信息进行粗聚类包括:

保留候选句中的业务词汇,用K-means聚类算法或者谱聚类算法进行处理。

5.如权利要求1所述的智能客服中解决知识库冷启动的方法,其中,对所述粗分业务簇利用细粒度语义聚合,生成细分业务簇包括:

将粗分业务簇中包含的句子利用机器学习算法或基于正则表达的自然语言处理方式进行分类;

将没有分类标签的句子利用BERT预训练模型结合层次聚类算法进行处理,得到细分业务簇。

6.如权利要求5所述的智能客服中解决知识库冷启动的方法,其中,将没有分类标签的句子利用BERT预训练模型结合层次聚类算法进行处理前,还包括:利用预先收集的客服停用词表中的词汇将分类后的句子中包含的起润滑作用的短语去除;以及

将没有分类标签的句子利用BERT预训练模型结合层次聚类算法进行处理时,还包括:通过内积、JACCARD系数或余弦相似度计算去除了起润滑作用的短语的句子间的相似度,并将相似度高于预设的阈值的句子分到同一簇中,相似度低于所述阈值的句子分到不同的簇中。

7.如权利要求1所述的智能客服中解决知识库冷启动的方法,其中,将每个所述细分业务簇中的句子按照句子出现频次由多至少划分为1个标准句和与所述标准句对应的相似句包括:若所述细分业务簇中无最高频次的句子时,则在所述细分业务簇中求得每个句子跟其他所有句子的余弦相似度之和,选择余弦相似度之和最大的句子作为所述细分业务簇的标准句,其他句子作为与所述标准句对应的相似句。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智齿博创科技有限公司,未经北京智齿博创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010302957.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top