[发明专利]一种根据会话内容提取会话对的方法在审
申请号: | 201710076411.2 | 申请日: | 2017-02-13 |
公开(公告)号: | CN106844347A | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 陈包容 | 申请(专利权)人: | 长沙军鸽软件有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410000 湖南省长沙市高新开发*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 根据 会话 内容 提取 方法 | ||
技术领域
本发明涉及通信技术领域,具体涉及一种根据会话内容提取会话对的方法。
背景技术
目前,从会话内容中提取的会话对或问答对,往往是一问一答的会话对形式,而在实际的会话过程中,通讯双方进行会话并非完全符合一问一答的会话模式,例如针对通讯对方发送的会话句,通讯方可能回复了几条会话句,或针对通讯对方发送的多条会话句,通讯方可能只回复了一条会话句。
故如果仅仅采取一问一答的形式提取对话对,可能存在以下问题:对于一些没有以一问一答形式展现的会话内容,从会话内容中提取会话对的难度较大,且精度较低。例如对于多个发起句+多个回复句形式的会话内容,从中提取会话对时,需要分析与每一个发起句匹配的回复句,过程复杂,难度大,且精度较低。此外,由于以一问一答形式提取的会话对的完整性容易被破坏,从而导致提取的会话对不能准确模拟真实会话。
发明内容
本发明提供了一种根据会话内容提取会话对的方法,以解决现有从会话内容中提取会话对的难度较大,且精度较低的技术问题。
本发明提供的根据会话内容提取会话对的方法,包括:
采集通讯方的会话内容;
逐一判断发起句后是否还包含发起句,若否,则将发起句以及发起句后与其关联的回复句作为会话对提取,若是,则根据发起句,以及发起句与下一条发起句之间的回复句提取会话对,其中发起句为通讯对方发送的会话句,回复句为通讯方发送的会话句,或发起句为通讯方发送的会话句,回复句为通讯对方发送的会话句。
进一步地,根据发起句,以及发起句与下一条发起句之间的回复句提取会话对包括:
判断发起句与下一条发起句之间是否包含回复句,若是,则将发起句,以及发起句与下一条发起句之间的与发起句关联的回复句作为会话对提取;
若否,则采集连续的发起句,直至出现回复句,获得发起句组,并判断发起句组后是否还包括发起句,若否,则将发起句组以及发起句组后与其关联的回复句作为会话对提取,若是,则将发起句组,以及发起句组与下一条发起句之间的与发起句组关联的回复句作为会话对提取。
进一步地,逐一判断发起句后是否还包含发起句包括:
逐一判断发起句是否为最后一条会话句,若是,则停止会话对提取操作,若否,则判断发起句后是否还包含发起句。
进一步地,将发起句组以及发起句组后与其关联的回复句作为会话对提取包括:
获取发起句组后的所有回复句;
分别计算每一条回复句与发起句组中的每一条发起句之间的关联度;
根据关联度和预设的关联度阈值,获得发起句组后与其关联的回复句;
将发起句组,以及发起句组后与其关联的回复句作为会话对进行提取。
进一步地,采集通讯方的会话内容包括:
采集通讯方的即时通讯账号、邮箱账号、微博号、手机号与其他通讯对方进行会话的会话语料;
将会话语料拆分为由会话句组成的会话内容,其中会话句包括会话句内容和发送会话句内容的发送方。
进一步地:会话内容包括文本、图片、语音、视频或动漫格式的会话内容。
本发明具有以下有益效果:
本发明提供的根据会话内容提取会话对的方法,通过采集通讯方的会话内容,逐一判断发起句后是否还包含发起句,若否,则将发起句以及发起句后与其关联的回复句作为会话对提取;若是,则根据发起句,以及发起句与下一条发起句之间的回复句提取会话对,其中发起句为通讯对方发送的会话句,回复句为通讯方发送的会话句,或发起句为通讯方发送的会话句,回复句为通讯对方发送的会话句,解决了现有技术提取会话对的难度较大,精度较低的技术问题,不仅打破了传统的一问一答的会话对形式,而且能提取出不同类型的会话对,实现了自动并快速对会话内容中的会话对进行提取,且通过根据发起句和回复句之间的关联度提取会话对,提升了会话对的提取精度。此外,通过本发明实施例提取的会话对形式多样,有利于基于会话对精准匹配智能回复,以及匹配获得形式多样的智能回复内容,实用性较高。
除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。
附图说明
构建本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构建对本发明的不当限定。在附图中:
图1是本发明优选实施例根据会话内容提取会话对的方法流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙军鸽软件有限公司,未经长沙军鸽软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710076411.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:包装盒
- 下一篇:一种便用式组合礼品盒
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法