[发明专利]消息切分方法以及装置有效
申请号: | 201810734388.6 | 申请日: | 2018-07-06 |
公开(公告)号: | CN110691025B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 李兆伟;孔智慧 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L51/04 | 分类号: | H04L51/04;H04L67/565;H04L67/568;G06F9/54 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;窦晓慧 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 消息 切分 方法 以及 装置 | ||
1.一种消息切分方法,包括:
获取待切分的消息序列,所述消息序列为即时通信服务群中由客户与客服交互产生的消息序列,所述消息序列包括多条消息,每一条消息具有对应的消息发送时刻,所述消息序列中的多条消息按照所述发送时刻排序;
根据发送时刻来确定消息序列中各条消息之间的关联性;
根据所述关联性来从所述消息序列中切分出一个或多个消息片段,每个消息片段包括具有关联性的一条或多条消息;
其中,一个消息片段对应一个交互话题;
其中,将所述消息序列中的第1条消息加入当前消息集合;在将所述消息序列中的第2条消息加入所述当前消息集合之前,如果所述当前消息集合中仅有所述第1条消息,则判断所述第1条消息的对话角色是否为客服;如果所述第1条消息的对话角色是客服,则将所述第1条消息组成的当前消息集合切分为一个消息片段,并在完成消息片段的切分之后,将当前消息集合清空,对所述消息序列中的其他消息进行处理;如果所述第1条消息的对话角色是用户,则丢弃所述第1条消息,将当前消息集合清空,并对所述消息序列中的其他消息进行处理。
2.根据权利要求1所述的消息切分方法,其中,所述关联性包括时间关联性,所述根据发送时刻来确定消息序列中各条消息之间的关联性的步骤,包括:
根据发送时刻来确定所述消息序列中每一对相邻消息之间的时间关联性;
相应的,所述根据所述关联性来从所述消息序列中切分出一个或多个消息片段的步骤,包括:
将所述消息序列中连续具有时间关联性的消息作为一个消息片段。
3.根据权利要求2所述的消息切分方法,其中,所述相邻消息之间的时间关联性的判断方法包括:
判断所述相邻消息之间的发送时刻之差的绝对值是否小于或者等于时间阈值,若是,则判定所述相邻消息之间具有所述时间关联性。
4.根据权利要求2或3所述的消息切分方法,其中,所述消息序列中每一条消息具有对话角色的属性,所述对话角色包括:发起方和应答方;
在所述根据所述关联性来从所述消息序列中切分出一个或多个消息片段的步骤之后,还包括:若一个消息片段仅包含一条消息,且该消息的对话角色为发起方,则丢弃该消息片段。
5.根据权利要求1所述的消息切分方法,其中,所述消息序列中的至少一条消息具有内容标签,所述内容标签包括:话题开始标签和话题结束标签。
6.根据权利要求5所述的消息切分方法,其中,所述关联性包括内容关联性,所述根据发送时刻来确定消息序列中各条消息之间的关联性的步骤,包括:
确定所述消息序列中具有话题开始标签或者话题结束标签的标签消息;
确定所述标签消息的至少一条近邻消息,其中,当所述标签消息具有话题开始标签时,所述近邻消息为所述消息序列中发送时刻在所述标签消息之后、且与标签消息的发送时刻之差小于等于第一阈值的消息;当所述标签消息具有话题结束标签时,所述近邻消息为所述消息序列中发送时刻在所述标签消息之前、且与标签消息的发送时刻之差的绝对值小于等于第一阈值的消息;
按照距离所述标签消息的发送时刻由近到远的顺序,分别将近邻消息与所述标签消息进行内容匹配,判定匹配成功的近邻消息与所述标签消息具有内容关联性;
相应的,所述根据所述关联性来从所述消息序列中切分出一个或多个消息片段的步骤,包括:
将所述标签消息和与所述标签消息具有内容关联性的近邻消息之间的消息作为一个消息片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810734388.6/1.html,转载请声明来源钻瓜专利网。