[发明专利]一种文章配图系统在审
申请号: | 201811644858.6 | 申请日: | 2018-12-29 |
公开(公告)号: | CN110866086A | 公开(公告)日: | 2020-03-06 |
发明(设计)人: | 郝汉;赵晓晨;杨胜 | 申请(专利权)人: | 北京安妮全版权科技发展有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/31;G06F16/58;G06F16/51 |
代理公司: | 北京思创大成知识产权代理有限公司 11614 | 代理人: | 董晓盈 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文章 系统 | ||
本发明公开了一种文章配图系统。包括:标签提取模块用于对图像资源库中的图像文件进行图像标签提取并与图像文件关联存储;标签标注模块用于对每个图像文件的多个图像标签进行适配筛选和图像标签的权重值分配;标签索引模块用于建立图像标签与图像文件之间的映射关系并根据图像标签查找与之关联的图像文件;文本摘要提取模块用于导入文本文件并提取文本文件中的文本摘要;摘要与标签匹配模块用于将文本摘要与图像标签进行近义词或等义词匹配。本发明通过集成多种先进的人工智能处理算法并结合大数据技术,实现了高效的文学插图推荐,帮助创作者找到合适的插图资源。
技术领域
本发明涉及信息技术应用领域,更具体地,涉及一种文章配图的系统。
背景技术
大数据是伴随着信息数据爆炸式增长和网络计算技术迅速发展而兴起的一个新型概念。大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据能够帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求,使数据能够从量变到质变,真正产生价值。随着大数据的发展,其应用已经渗透到农业、工业、商业、服务业、医疗领域等各个方面,成为影响产业发展的一个重要因素。
自然语言处理技术在生活中应用广泛,例如机器翻译、手写体和印刷体字符识别、语音识别后实现文字转换、信息检索、抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等。它们分别应用了自然语言处理当中的语法分析、语义分析、篇章理解等技术,是人工智能界的前沿研究领域。
目前很多自媒体人写文章或者编辑人员在写文章时经常会遇到配图难的困扰,一方面部分有版权的图片非常昂贵(如:视觉中国、东方IC),另一方面不明来源的图片又不敢用,那么使用一种人工智能和大数据结合的方式来配图会成为一种未来的趋势,使用人工智能来通过文章的文本语句智能选择合适场景的图片,使用大数据来把有版权、价格便宜的图片推荐给编辑人员进行选择。
发明内容
本发明的目的是提出一种文章配图的系统,通过集成多种先进的人工智能处理算法,高效的聚合相关图片资源,并且对文章的文意及主题进行相关提取,实现了高效的文学插图推荐,有效的帮助创作者寻找到合适的插图资源。
为实现上述目的,本发明提出了一种文章配图系统,包括:
标签提取模块、标签标注模块、标签索引模块、文本摘要提取模块、摘要与标签匹配模块;
所述标签提取模块用于对图像资源库中的每个图像文件进行图像标签提取并将所述图像标签与所述图像文件关联存储,其中一个所述图像标签至少关联一个图像文件;
所述标签标注模块用于对每个所述图像文件的多个所述图像标签进行适配筛选和图像标签的权重值分配;
所述标签索引模块用于建立所述图像标签与所述图像文件之间的映射关系并根据图像标签查找与之关联的图像文件;
所述文本摘要提取模块,用于导入文本文件并提取所述文本文件中的文本摘要;
所述摘要与标签匹配模块用于将所述文本摘要与所述图像标签进行近义词或等义词匹配。
优选地,所述标签提取模块对图片资源库中的图像文件进行图像标签提取,通过图像分类器或人工将每个图像文件提取出多个关键词作为图像标签并与所述图像文件关联存储。
优选地,所述图像分类器为包括基于opencv视觉库、随机森林算法和逻辑回归算法开发的图像分类工具。
优选地,所述标签标注模块对所述图像标签进行与图像文件的适配筛选并根据所述图像标签与所述图像文件的匹配度为每个标签分配不同的权重值。
优选地,所述标签索引模块根据所述图像标签在所述图像资源库中查找与其关联存储的图像文件,并根据所述标签的权重值将索引出的图像文件进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京安妮全版权科技发展有限公司,未经北京安妮全版权科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811644858.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种代码考核系统及方法
- 下一篇:一种随机接入前导序列的发送方法、设备及系统