[发明专利]生成聚类模型以及基于该聚类模型进行聚类的方法和装置在审

专利信息
申请号: 201410373109.X 申请日: 2014-07-31
公开(公告)号: CN105450497A 公开(公告)日: 2016-03-30
发明(设计)人: 王芝虎;严骏驰;倪渊;祝慧佳;段宁 申请(专利权)人: 国际商业机器公司
主分类号: H04L12/58 分类号: H04L12/58;G10L15/08
代理公司: 北京市金杜律师事务所 11256 代理人: 酆迅;李峥宇
地址: 美国纽*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 生成 模型 以及 基于 进行 方法 装置
【权利要求书】:

1.一种用于生成聚类模型的方法,包括:

响应于接收到来自历史语音对话中的多个历史消息,提取所述多个历史消息中的每个历史消息的特征信息;

获取所述多个历史消息之间的关联关系;以及

基于所述多个历史消息中的每个历史消息的所述特征信息和所述关联关系来生成将所述多个历史消息进行聚类的聚类模型。

2.根据权利要求1所述的方法,其中所述获取所述多个历史消息之间的关联关系包括:

将所述多个历史消息中讨论相同主题的历史消息标识为具有所述关联关系。

3.根据权利要求2所述的方法,其中所述基于所述多个历史消息中的每个历史消息的所述特征信息和所述关联关系来生成将所述多个历史消息进行聚类的聚类模型包括:

基于所述特征信息和所述关联关系来训练所述聚类模型,使得所述聚类模型将具有所述关联关系的历史消息聚类至一个主题分组。

4.根据权利要求1-3中的任一项所述的方法,其中所述响应于接收到来自历史语音对话中的多个历史消息,提取所述多个历史消息中的每个历史消息的特征信息包括:针对所述多个历史消息中的当前历史消息,

获取所述当前历史消息的话题信息;

获取所述当前历史消息的属性信息;以及

集成所述话题信息和所述属性信息以形成所述历史消息的特征信息。

5.根据权利要求4所述的方法,其中所述获取所述当前历史消息的话题信息包括:

获取描述所述历史消息的话题向量;以及

将所述话题向量进行聚类以获取所述话题向量所属于的话题聚类指示符,所述话题信息包括所述话题向量和所述话题聚类指示符。

6.根据权利要求4所述的方法,其中获取所述当前历史消息的属性信息包括:

从所述对话中的所述多个历史消息的时序信息解析所述当前历史消息的所述属性信息,所述属性信息包括以下中的至少任一项:所述当前历史消息的时间以及所述当前历史消息与所述多个历史消息中的其他历史消息之间的距离。

7.根据权利要求4所述的方法,其中所述获取所述当前历史消息的属性信息包括:

通过将所述当前历史消息的文本与所述多个历史消息中的其他历史消息的文本进行比较,获取所述当前历史消息的所述属性信息,所述属性信息包括以下中的至少任一项:语言学特征信息、基于n元语法的相似性信息、以及基于语义的相似性信息。

8.一种用于将当前对话中的多个当前消息进行聚类的方法,包括:

响应于接收到所述对话中的所述多个当前消息,提取所述多个当前消息中的每个当前消息的特征信息;以及

采用根据权利要求1-7中的任一项所述的方法生成的聚类模型,基于所述多个当前消息的每个当前消息的所述特征信息,将所述多个当前消息聚类至至少一个主题分组。

9.根据权利要求8所述的方法,其中所述多个当前消息包括文本消息和语音消息中的至少任一项。

10.根据权利要求8所述的方法,进一步包括以下中的至少任一项:

按照预定义的显示模式显示所述至少一个主题分组中的当前消息;以及

突出显示所述至少一个主题分组中的一个主题分组中的无响应消息。

11.一种用于生成聚类模型的装置,包括:

提取模块,配置用于响应于接收到来自历史语音对话中的多个历史消息,提取所述多个历史消息中的每个历史消息的特征信息;

获取模块,配置用于获取所述多个历史消息之间的关联关系;以及

生成模块,配置用于基于所述多个历史消息中的每个历史消息的所述特征信息和所述关联关系来生成将所述多个历史消息进行聚类的聚类模型。

12.根据权利要求11所述的装置,其中所述获取模块包括:

标识模块,配置用于将所述多个历史消息中讨论相同主题的历史消息标识为具有所述关联关系。

13.根据权利要求12所述的装置,其中所述生成模块包括:

训练模块,配置用于基于所述特征信息和所述关联关系来训练所述聚类模型,使得所述聚类模型将具有所述关联关系的历史消息聚类至一个主题分组。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410373109.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top