[发明专利]实时事件摘要的生成方法、装置、设备及存储介质有效
申请号: | 201910446730.7 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110297885B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 杨敏;曲强 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/34 |
代理公司: | 深圳智趣知识产权代理事务所(普通合伙) 44486 | 代理人: | 李兴生 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实时 事件 摘要 生成 方法 装置 设备 存储 介质 | ||
本发明适用计算机技术领域,提供了一种实时事件摘要的生成方法、装置、设备及存储介质,该方法包括:接收文本流和用户查询文本,依据知识库生成文本流中事件文本的和用户查询文本的知识感知文本表示,依据生成的知识感知文本表示和交互式多头注意力网络,生成事件文本的和用户查询文本的交互式学习文本表示,依据生成的交互式学习文本表示和动态记忆网络,生成事件文本的特定文本表示,将特定文本表示输入多任务联合训练模型,生成文本流的实时事件摘要,从而有效地提高了实时事件摘要的内容丰富度,降低了实时事件摘要的冗余度,提高了实时事件摘要的生成效果。
技术领域
本发明属于计算机技术领域,尤其涉及一种实时事件摘要的生成方法、装置、设备及存储介质。
背景技术
随着流媒体应用的快速发展,互联网中的信息量呈现爆炸式增长,人们利用流媒体应用获取信息的同时,也往往因为信息量的庞大和繁杂,无法获取自己最感兴趣的信息,收到许多困扰以及造成不必要的事件浪费。事件摘要(Event Summarization)是自然语言处理(Natural Language Processing,简称NLP)领域中十分具有挑战性的任务,任务目的是为给定的文本流生成信息量丰富的文本摘要,并在事件动态变化过程中实时更新文本摘要,提供给人们感兴趣的事件的文本摘要。然而,关于事件摘要的工作主要侧重于新闻文章,通过采用静态摘要方法对文本进行解析后生成文本摘要,并且只对文本摘要进行简单的更新。静态摘要方法每次只能生成一条摘要,无法随时间去推断事件的演化过程并在出现新信息时实时更新摘要,更不适合大规模的动态流媒体应用。
实时事件摘要(Real-time Event Summarization)旨在从大量实时的文本流中生成一系列文本摘要,这些文本摘要能够准确地描述用户所感兴趣的事件。实时事件摘要一般用于新闻及社交媒体场景,应用前景十分广阔,例如,包括Twitter在内的一些流媒体应用能够向用户提供当前热门或用户感兴趣的推文的摘要推送服务。同时,这也是一项十分具有挑战性的任务。首先,新闻文本通常由专业记者或作家撰写,句子和语法结构完整,提取的摘要质量良好。但是社交媒体文本通常较短,存在不少拼写错误及语法病句,还有许多网络热门词句,为社交媒体文本的摘要工作造成较大阻碍。其次,与静态新闻摘要相比,社交媒体文本的摘要生成必须沿着时间轴的动态的文本流进行。另外,由于在线文本流的信息量不断增加,采用静态方法生成事件摘要的成本骤增且不可能保持实时更新状态。
在已知的一项研究成果中,提出了通过建立和维持适当的推送更新阈值来实现最佳的推送结果的方式、采用局部最优学习来选择或跳过文本流中的文本分方式、以及将文本流的实时推送定义为一个顺序决策问题并基于神经网络的强化学习(NNRL)算法用于实时决策的方式等等.尽管这些研究已经小有成效,实时事件摘要的生成方法还有待改进。首先,实时事件摘要系统的信息丰富度有待提升;其次,现有的研究往往侧重于只生成具有高度相关性的实时事件摘要,却忽略了实时事件摘要的非冗余性,这将严重降低其性能,可能向用户推送重复冗余的多个文本;第三,大多数方法将相关性预测和实时事件摘要视为顺序步骤或仅将相关性预测分数视为实时事件摘要模型的特征,导致实时事件摘要的性能不佳。
发明内容
本发明的目的在于提供一种实时事件摘要的生成控制方法、装置、设备及存储介质,旨在解决现有技术中实时事件摘要信息不够丰富、冗余度较高、实时事件摘要性能不佳的问题。
一方面,本发明提供了一种实时事件摘要的生成方法,所述方法包括下述步骤:
接收文本流和用户查询文本,所述文本流包括按时间排序的事件文本;
依据所述事件文本、所述用户查询文本和预设的知识库,生成所述事件文本的知识感知文本表示和所述用户查询文本的知识感知文本表示;
依据所述事件文本的知识感知文本表示、所述用户查询文本的知识感知文本表示和训练好的交互式多头注意力网络,生成所述事件文本的交互式学习文本表示和所述用户查询文本的交互式学习文本表示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910446730.7/2.html,转载请声明来源钻瓜专利网。