[发明专利]基于层次聚类的人工智能系统和方法在审
申请号: | 201880043921.2 | 申请日: | 2018-08-31 |
公开(公告)号: | CN111373395A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 柳俊宏;王鹏;吴康康;王杰 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 袁春晓 |
地址: | 100193 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 层次 人工智能 系统 方法 | ||
1.一种用于分类客户查询的人工智能系统,包括:
通信接口,被配置为接收包括至少两个历史客户查询的数据;
处理器,被配置为:
将所述历史客户查询分割成至少两个词语;
确定所述词语中的一组常用词语;
使用所述一组常用词语过滤所述历史客户查询;以及
通过对所述过滤后的历史客户查询进行分类来确定至少两个代表性主题,其中所述分类应用层次聚类方法;以及
存储器,被配置为储存所述常用词语和所述代表性主题。
2.根据权利要求1所述的人工智能系统,其特征在于,所述处理器进一步被配置为:
基于所述历史客户查询确定至少一个关键词;以及
使用所述至少一个关键词识别所述历史客户查询的子集,
其中所述被分割的历史客户查询在所述识别的子集中。
3.根据权利要求1所述的人工智能系统,其特征在于,所述处理器进一步被配置为:
在确定所述一组常用词语之前,去除所述至少两个词语中的非信息性词语。
4.根据权利要求1所述的人工智能系统,其特征在于,所述处理器进一步被配置为:
在确定所述一组常用词语之前,用预设词语替换所述至少两个词语中的同义词语。
5.根据权利要求1所述的人工智能系统,其特征在于,使用FP树模型确定所述一组常用词语。
6.根据权利要求1所述的人工智能系统,其特征在于,所述处理器进一步被配置为:
确定每个过滤后的历史客户查询中每个词语的嵌入向量;以及
基于所述嵌入向量确定所述过滤后的历史客户查询的嵌入表征。
7.根据权利要求6所述的人工智能系统,其特征在于,所述处理器进一步被配置为,将所述层次聚类方法应用于与所述过滤后的历史客户查询对应的所述嵌入表征。
8.根据权利要求1所述的人工智能系统,其特征在于,所述层次聚类方法是AGNES方法。
9.根据权利要求1所述的人工智能系统,其特征在于,所述通信接口被配置为接收新的客户查询,其中所述处理器进一步被配置为:
在所述代表性主题中确定所述新的客户查询的主题;以及
基于所述主题提供信息以响应所述新的客户查询。
10.一种用于分类客户查询的人工智能方法,包括:
接收包括至少两个历史客户查询的数据;
通过处理器将所述历史客户查询分割成至少两个词语;
通过所述处理器确定所述词语中的一组常用词语;
通过所述处理器,使用所述一组常用词语过滤所述历史客户查询;
通过所述处理器,通过对所述过滤后的历史客户查询进行分类来确定至少两个代表性主题,其中所述分类应用层次聚类方法;以及
将所述常用词语和所述代表性主题存储在存储器中。
11.根据权利要求10所述的人工智能方法,进一步包括:
基于所述历史客户查询确定至少一个关键词;以及
使用所述至少一个关键词识别所述历史客户查询的子集,
其中所述被分割的历史客户查询在所述识别的子集中。
12.根据权利要求10所述的人工智能方法,进一步包括:
在确定所述一组常用词语之前,去除所述至少两个词语中的非信息性词语。
13.根据权利要求10所述的人工智能方法,进一步包括:
在确定所述一组常用词语之前,用预设词语替换所述至少两个词语中的同义词语。
14.根据权利要求10所述的人工智能方法,其特征在于,使用FP树模型确定所述一组常用词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880043921.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于自主半卡车的传感器配置
- 下一篇:产生红系祖细胞的方法