[发明专利]图文摘要的评价方法在审

专利信息
申请号: 201811173277.9 申请日: 2018-10-09
公开(公告)号: CN109543512A 公开(公告)日: 2019-03-29
发明(设计)人: 周玉;朱军楠;张家俊;宗成庆 申请(专利权)人: 中国科学院自动化研究所
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 北京瀚仁知识产权代理事务所(普通合伙) 11482 代理人: 宋宝库;屠晓旭
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图文 准确度 文本 构建 自然语言 相似度获取 相似度计算 处理效率 多个方面 模拟人工 模型获取 评价模型 形式输出 预先获取 综合考虑 参考 单模态 相似度 图片
【说明书】:

发明属于自然语言技术领域,具体提供一种图文摘要的评价方法及装置,旨在解决现有技术缺少对图文摘要进行评价从而导致摘要以单模态形式输出的问题。为此目的,本发明提供了一种图文摘要的评价方法,包括计算预先获取的待测摘要的文本和参考摘要的文本之间的ROUGE值;获取待测摘要的图片和参考摘要的图片之间的准确度;基于预先构建的图文相似度计算模型获取待测摘要中图片和文本的相似度;基于预先构建的图文摘要评价模型并根据ROUGE值、准确度以及相似度获取对待测摘要的评价值。基于上述步骤,本发明提供的方法可以从多个方面综合考虑影响摘要评价的因素,可以很好地模拟人工评价的过程,进而提高摘要评价的准确度和处理效率。

技术领域

本发明属于自然语言技术领域具体涉及一种图文摘要的评价方法。

背景技术

自动摘要是利用计算机系统自动实现文本分析、内容归纳和摘要自动生成的技术,可以按读者(或用户)的要求以简洁的形式表达原文的主要内容。自动摘要技术能够有效地帮助读者(或用户)从检索到的文章中寻找感兴趣的内容,提高阅读速度和质量。该技术可以将文档压缩为更为简洁的表达,并且保证涵盖原始文档有价值的主题。

传统的自动摘要技术一般是单模态摘要,即输入全部为文本。随着技术的发展,多模态自动摘要技术出现。多模态自动摘要的输入为多个模态,包括文本、音频、视频和图像等,随着信息的载体越来越丰富多样,当用户通过搜索引擎对某一特定事件进行检索时,返回的内容往往不局限于文本,还可能来源于视频和图像模态。多模态自动摘要技术可以对来自于多模态的信息进行提炼,从而帮助用户在短时间获取多媒体信息。

现有的多模态自动摘要技术输出都局限于单模态形式,如只是文本或者图片等,很大程度上是因为对多模态形式摘要的评价方式的缺失,如何对摘要进行合理地评价很大程度上会影响摘要的准确度。

因此,如何提出一种合理地对图文摘要进行评价从而提高图文摘要的准确度的方案是本领域技术人员目前需要解决的问题。

发明内容

为了解决现有技术中的上述问题,即为了解决现有技术缺少对图文摘要进行评价从而导致摘要以单模态形式输出的问题,本发明的第一方面提供了一种图文摘要的评价方法,包括:

计算预先获取的待测摘要的文本和参考摘要的文本之间的 ROUGE值;

获取所述待测摘要的图片和所述参考摘要的图片之间的准确度;

基于预先构建的图文相似度计算模型获取所述待测摘要中图片和文本的相似度;

基于预先构建的图文摘要评价模型并根据所述ROUGE值、准确度以及相似度获取对所述待测摘要的评价值;

其中,所述图文相似度计算模型和图文摘要评价模型是分别基于预设的图片描述数据集和评价得分数据集并利用机器学习算法所构建的神经网络模型及线性回归模型。

在上述方案的优选技术方案中,“计算预先获取的待测摘要的文本和参考摘要的文本之间的ROUGE值”的步骤包括:

获取所述待测摘要的文本和参考摘要的文本之间多个初始 ROUGE值;

分别计算多个所述初始ROUGE值与预先获取的人工评价的相关性,将相关性最高的初始ROUGE值作为所述待测摘要的文本和参考摘要的文本之间的ROUGE值。

在上述方案的优选技术方案中,“获取所述待测摘要的图片和所述参考摘要的图片之间的准确度”的步骤包括:

判断所述待测摘要的图片是否与所述参考摘要的图片相同,

若相同,则所述待测摘要的图片和所述参考摘要的图片之间的准确度为1;

若不相同,则所述待测摘要的图片和所述参考摘要的图片之间的准确度为0。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811173277.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top