[发明专利]生成人物词云画像的方法及装置有效
申请号: | 201710934962.8 | 申请日: | 2017-10-10 |
公开(公告)号: | CN107742315B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 周松文;何金虎 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06T11/60 | 分类号: | G06T11/60;G06F16/34 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 李昕巍;章侃铱 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 人物 画像 方法 装置 | ||
本发明实施例提供一种生成人物词云画像的方法、装置、电子设备及计算机可读介质,涉及文本处理技术领域。该生成人物词云画像的方法包括:采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。该方法可以根据输入的图片以及文本快速生成人像词云画像,既可以快速、实时的反应数据的变化,而且能够保证画像的准确性,因此可以得到美观、色彩丰富的画像。
技术领域
本发明实施例总体涉及文本处理技术领域,具体而言,涉及一种生成人物词云画像的方法及装置。
背景技术
“词云”是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页的人只要一眼扫过文本就可以领略文本的主旨。
在数据分析过程中,人物词云画像是一种对人物特征信息友好、易懂的描述形式。现有技术方案在生成人物词云画像过程中,主要采用以下两种方式:
(1)使用前期数据加工,再加上后期对图片进行美化留白后,把加工好的数据逐个填入,优点是生成的画像准确无误,美观程度较高,缺点是生成画像的周期太长,无法实时、快速地响应数据变化。
(2)直接使用图片和词汇生成人像词云画像,图1示出直接生成人物词云画像前的原始图片效果图,图2示出直接生成人物词云画像的效果图,这种方式的优点是生成画像的周期短,但是参见图2可以看出,缺点是生成的画像失真比较严重,色彩杂乱,不能正确的展示人物形象,效果不佳,无法正常使用。
因此,现有技术方案的两种处理方式均不能在缩短生成画像周期的同时保证画像的准确性,还存在有待改进之处。
在所述背景技术部分公开的上述信息仅用于加强对本发明实施例的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例提供一种生成人物词云画像的方法、装置、电子设备及计算机可读介质,解决现有技术方案不能快速准确的生成人物词云画像的技术问题。
本发明实施例的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明实施例的实践而习得。
根据本发明实施例的第一方面,提供一种生成人物词云画像的方法,包括:
采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;
利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;
按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。
在本发明的一些实施例中,对输入的图片进行处理之前还包括:
判断所述输入的图片的格式是否符合预设的格式要求,如果所述输入的图片的格式符合预设的格式要求,则继续对所述输入的图片采用彩铅方式进行处理;如果所述输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中所述预设的格式要求包括PNG、JPG。
在本发明的一些实施例中,采用彩铅方式对输入的图片进行处理包括:
将所述输入的图片转换成黑白图片;
对所述黑白图片进行彩铅化处理,得到所述彩铅效果图片。
在本发明的一些实施例中,利用预设词库对输入的文本进行处理,生成词汇的排序文档包括:
对所述输入的文本去除停用词;
利用所述预设词库计算所述预设词库中各个词汇的词频以及权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710934962.8/2.html,转载请声明来源钻瓜专利网。