[发明专利]一种客服舆情热点词数据挖掘系统及方法在审
申请号: | 201811038391.0 | 申请日: | 2018-09-06 |
公开(公告)号: | CN109299230A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 张鑫;何云 | 申请(专利权)人: | 华泰证券股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36 |
代理公司: | 南京科知维创知识产权代理有限责任公司 32270 | 代理人: | 杜依民 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于在线人工客服聊天语料的热点咨询挖掘系统及方法,在缺乏专业词库的情况下,基于历史聊天语料快速构建业务词库、与时俱进地更新业务词库,基于业务词库完成文本聊天语料的准确分词,然后借助客服系统自身的知识库,完成客户咨询热点的挖掘。本发明的目的是解决现有技术的不足,基于客服中心积累的大量聊天语料,快速构建业务词库,挖掘客户咨询热点,掌握客户内心的诉求,提升客户服务。 | ||
搜索关键词: | 词库 语料 聊天 快速构建 挖掘系统 客户 咨询 知识库 客服系统 客服中心 客户服务 人工客服 专业词库 词数据 挖掘 分词 客服 文本 内心 更新 积累 | ||
【主权项】:
1.一种客服舆情热点词数据挖掘系统,其特征在于:包括数据提取模块、历史咨询热点词库筛选模块、凝聚度筛选模块、自由度筛选模块以及停用词筛选模块;所述数据提取模块,用于对客服在线文本,提取在线客服系统的当天会话数据,将会话数据拼接成字符串,提取所有词长不超过预设的最大词长的后缀词,遍历所有后缀词,统计出候选词及其词频;所述历史咨询热点词库筛选模块,用于基于历史咨询热点词库筛选候选词,若候选词为非历史咨询热点词库中的热点词,则启动凝聚度筛选模块,若候选词为历史咨询热点词库中的热点词,则舍弃;所述凝聚度筛选模块,用于对候选词进行凝聚度计算,计算候选词凝聚度,若凝聚度大于预设的最低凝聚度,则启动自由度筛选模块,否则舍弃该候选词;所述自由度筛选模块,用于计算候选词自由度,若自由度大于预设的最低自由度,则气动停用词筛选模块,否则舍弃该候选词;所述停用词筛选模块,用于载入停用词表,判断候选词的首尾字是否出现在停用词表中,若候选词的首尾字出现在停用词表中,则舍弃该候选词,否则更新历史咨询热点词库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华泰证券股份有限公司,未经华泰证券股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811038391.0/,转载请声明来源钻瓜专利网。