[发明专利]生成聚类模型以及基于该聚类模型进行聚类的方法和装置在审
申请号: | 201410373109.X | 申请日: | 2014-07-31 |
公开(公告)号: | CN105450497A | 公开(公告)日: | 2016-03-30 |
发明(设计)人: | 王芝虎;严骏驰;倪渊;祝慧佳;段宁 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;G10L15/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅;李峥宇 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 模型 以及 基于 进行 方法 装置 | ||
技术领域
本发明的各实施方式涉及消息处理,更具体地,涉及在消息处理中生成聚类模型(clusteringmodel)以及基于该聚类模型进行聚类的方法和装置。
背景技术
随着通信技术的发展,目前已经开发出了各种通信应用。广大用户可以通过即时消息应用(例如,微信、Sametime、QQ等)、短消息应用、以及聊天室应用等通信应用来进行沟通。这些通信应用可以运行在具有通信能力的计算设备上(例如,计算机、膝上型计算机、平板式计算机、智能终端、移动终端等),并且用户可以经由这些通信应用与一个或者多个其他用户进行通信。
不同于传统的连续语音通信,用户可以使用这些通信应用在离散的时间点进行通信,并且前后相继的两个消息可能涉及不同的主题。例如,用户Alan可以向用户Teresa发送消息“北京天气好吗?”Teresa在接收到来自Alan的消息之后可能并没有马上回答北京的天气状况,而是可能先向Alan发送了几条问候信息,并且在询问“你哪天到北京?”之后,才回答Alan“北京下雨”。
从上述示例中可以发现,在使用通信应用进行的对话中,来自两个用户的前后相继的两个或者更多消息并不总是讨论相同的主题(theme),而是可以讨论多个相关或者无关的主题(例如,天气、交通、教育、体育等内容)。在群聊(groupchatting)中,多个用户可能同时会讨论更多主题。当基于现有技术的按照时间顺序来逐个呈现来自各个用户的消息时,用户很难快速了解各个消息之间的关联关系;尤其是当用户正在使用诸如移动终端等显示屏幕尺寸有限的设备时,将会造成页面显示的混乱。
另外,目前的通信应用可以支持用户发送语音消息,例如,用户可以按下通信应用中的“语音”按钮录制语音消息,当抬起“语音”按钮时可以将该语音消息发送至一个或者多个其他用户。该语音消息在接收者的用户设备处可以显示为特殊的图标,而当用户按下该图标时则可以听到发送者录制的语音。当两个或者更多用户采用语音方式通信时,在用户设备处的显示屏上根本不能区分哪些语音消息涉及相同的主题。此时用户需要依次收听每个语音消息,这将占用很多时间。
因而,如何按照各个消息所讨论的主题来区分来自于两个或者更多用户的多个消息,成为目前的一个研究热点。
发明内容
因而,期望开发出一种基于通信应用中的对话的特征来生成可以将对话中的多个消息进行聚类的聚类模型的技术方案。进一步,还期望能够基于所生成的聚类模型来将当前对话中的多个消息进行聚类的技术方案。
在本发明的一个实施方式中,提供了一种用于生成聚类模型的方法,包括:响应于接收到来自历史语音对话中的多个历史消息,提取多个历史消息中的每个历史消息的特征信息;获取多个历史消息之间的关联关系;以及基于多个历史消息中的每个历史消息的特征信息和关联关系来生成将多个历史消息进行聚类的聚类模型。
在本发明的一个实施方式中,提供了一种用于将对话中的多个当前消息进行聚类的方法,包括:响应于接收到对话中的多个当前消息,提取多个当前消息中的每个当前消息的特征信息;以及采用本发明的方法生成的聚类模型,基于多个当前消息的每个当前消息的特征信息,将多个当前消息聚类至至少一个主题分组。
在本发明的一个实施方式中,提供了一种用于生成聚类模型的装置,包括:提取模块,配置用于响应于接收到来自历史语音对话中的多个历史消息,提取多个历史消息中的每个历史消息的特征信息;获取模块,配置用于获取多个历史消息之间的关联关系;以及生成模块,配置用于基于多个历史消息中的每个历史消息的特征信息和关联关系来生成将多个历史消息进行聚类的聚类模型。
在本发明的一个实施方式中,提供了一种用于将对话中的多个当前消息进行聚类的装置,包括:第一提取模块,配置用于响应于接收到对话中的多个当前消息,提取多个当前消息中的每个当前消息的特征信息;以及聚类模块,配置用于采用本发明的装置生成的聚类模型,基于多个当前消息的每个当前消息的特征信息,将多个当前消息聚类至至少一个主题分组。
采用本发明所述的方法和装置,可以高效并且准确地生成用于将多个消息进行聚类的聚类模型。进一步,采用本发明所述的其他方法和装置,可以基于该聚类模型将当前会话中的多个当前消息聚类至至少一个主题分组,可以基于各个用户的定制信息来显示各个分组中的消息,还可以突出显示分组中的无响应消息。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410373109.X/2.html,转载请声明来源钻瓜专利网。