[发明专利]生成人物词云画像的方法及装置有效
申请号: | 201710934962.8 | 申请日: | 2017-10-10 |
公开(公告)号: | CN107742315B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 周松文;何金虎 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06T11/60 | 分类号: | G06T11/60;G06F16/34 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 李昕巍;章侃铱 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 人物 画像 方法 装置 | ||
1.一种生成人物词云画像的方法,其特征在于,包括:
采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;
利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;
按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像;具体包括:按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片的非白色区域中,得到人物词云画像;
其中,采用彩铅方式对输入的图片进行处理包括:
将所述输入的图片转换成黑白图片;
对所述黑白图片进行彩铅化处理,得到所述彩铅效果图片;具体包括:对所述黑白图片中白色以外的区域进行彩铅化处理,得到所述彩铅效果图片。
2.根据权利要求1所述的方法,其特征在于,对输入的图片进行处理之前还包括:
判断所述输入的图片的格式是否符合预设的格式要求,如果所述输入的图片的格式符合预设的格式要求,则继续对所述输入的图片采用彩铅方式进行处理;如果所述输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中所述预设的格式要求包括PNG、JPG。
3.根据权利要求1所述的方法,其特征在于,利用预设词库对输入的文本进行处理,生成词汇的排序文档包括:
对所述输入的文本去除停用词;
利用所述预设词库计算所述预设词库中各个词汇的词频以及权重;
根据所述词汇的词频和权重计算得到所述词汇的排序参考值;
按照所述词汇的排序参考值对所述词汇进行排序得到所述词汇的排序文档。
4.根据权利要求3所述的方法,其特征在于,所述输入的文本来源于包含有所述预设词库中词汇的文件,计算所述词汇的权重包括:
统计包含所述词汇的文件的数目;
根据所述包含所述词汇的文件的数目与总文件的数目计算得到所述词汇的权重。
5.根据权利要求3或4所述的方法,其特征在于,所述词汇的排序参考值为所述词汇的词频与所述词汇的权重的乘积。
6.根据权利要求5所述的方法,其特征在于,按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中还包括:
根据所述词汇的排序参考值的大小确定填入所述词汇的字体大小。
7.一种生成人物词云画像的装置,其特征在于,包括:
图片处理模块,配置为采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;
文本处理模块,配置为利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;
填入模块,配置为按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像;具体包括:按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片的非白色区域中,得到人物词云画像;
其中,所述图片处理模块包括:
黑白转换子模块,配置为将所述输入的图片转换成黑白图片;
彩铅化子模块,配置为对所述黑白图片进行彩铅化处理,得到所述彩铅效果图片;具体包括:对所述黑白图片中白色以外的区域进行彩铅化处理,得到所述彩铅效果图片。
8.根据权利要求7所述的装置,其特征在于,还包括:
格式判断模块,配置为对输入的图片进行处理之前,判断所述输入的图片的格式是否符合预设的格式要求,如果所述输入的图片的格式符合预设的格式要求,则继续对所述输入的图片采用彩铅方式进行处理;如果所述输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中所述预设的格式要求包括PNG、JPG。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710934962.8/1.html,转载请声明来源钻瓜专利网。