[发明专利]一种基于占用矩阵的词云图可视化方法有效
申请号: | 201410020352.3 | 申请日: | 2014-01-16 |
公开(公告)号: | CN103778213B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 刘连忠;李春芳;徐同阁;陈梦东;唐文忠 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100091*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 占用 矩阵 云图 可视化 方法 | ||
1.一种词云图可视化方法,其特征在于,包括如下步骤:
步骤一:对于已排序的词组和词频,计算可视区域面积,对词频做规格化处理,词频表示字号,使所有词组、词频和词组字数表示的总面积小于可视区域面积;
步骤二:设置一个以可视区域的宽W和高H为尺寸的矩阵M,称为占用矩阵,M=[H*W],将其所有元素置为0,表示未被占用;
步骤三:将最大词频的词组布局在可视区中间,其所占用的M矩阵中的子矩阵元素(或仅字模像素区)置为1,表示该区域已占用;
步骤四:为下一个词组按照极坐标分配布局位置,如果词组不在可视区内先移动到可视区,通过矩形边线检测是否该区域被占用,即不重叠,如果重叠则为该词组随机分配布局位置,继续检测是否重叠,直至不重叠;
步骤五:检测是否可以旋转。将该词组垂直90度旋转后,检测是否与已布局词组重叠,不重叠则可以旋转,随机选择部分旋转,不能旋转或未选中保持原位置;
步骤六:检测是否可以向中心靠近,垂直和水平方向同时向可视区中心移动一定步长,不重叠则继续移动,重叠后停止,撤回最后一次移动;逐像素检测垂直和水平单方向是否能靠近中心,能则移动直到重叠为止;
步骤七:在可视区域打印该词组,并将其所占用的矩形区域的子矩阵(或仅字模像素区)置为1,表示已占用,转步骤四,所有词组布局完成后本方法结束。调整占用子矩阵的边界参数控制行间距。
步骤八:(此步骤为可选项)对于词组内部造成的空隙,采用字模提取技术,字模像素与占用矩形区像素重叠才将占用矩阵对应元素置为1。
步骤九:(此步骤为可选项)对于词组字数差异造成内部缝隙时,布局一定比例词组后,采用极坐标检测占用矩阵内剩余空白圆形区并存储其位置、半径和与中心的距离,按照与中心距离升序排序。对后续的词组布局时,从距离中心最近的空白区开始尝试,再检测是否重叠和是否可以旋转,如果所有空白区都重叠,则随机生成该词组坐标。
步骤十:如果提前用已知的二值图形初始化占用矩阵M,可以填充生成任意图形的词云图。
步骤十一:(此步骤为独立算法)在以上步骤基础上设计了任意角度旋转词云图。随机生成词组左下角基线坐标和随机旋转角度α,检测词组旋转后四角坐标是否超出可视区,超出可视区再次随机生成基线坐标和旋转角度,检测旋转后四边是否与已布局词组重叠,重叠则重新生成基线坐标和旋转角度,如果不是第一个词组,则检测是否可以向第一个词组中心移动,不重叠则移动,同样采用纵横双向快速移动和纵横单向逐像素移动,重叠后停止。按照旋转角度α旋转画布,打印词组后旋转画布-α角度。
步骤十二:如果预先对词组添加分类标签,可以用色彩、字体和旋转角度标注不同分类的词组,生成多重语义词云图。
步骤十三:(此步骤为独立算法)一种基于迭代计算占用矩形的词云布局算法,通过将第一个词组布局在可视区中央,迭代计算其左上、左下、右下和右上剩余的矩形区域坐标和面积,按面积排序,对后续词组布局时,从面积最小的区域开始尝试,布局后计算新增加的2个矩形区域,将其中1个存储在所占用的矩形存储单元,只需新增1个存储单元,再次按照面积排序,迭代布局后续词组。
2.根据权利要求1所述一种词云图可视化方法,其特征在于:所述步骤二中采用与可视区域同尺寸的二值矩阵表示已被占用区域,以解决词云图的关键难点之一,即去重叠。调整占用矩阵的边界参数控制行间距。词组布局完成后将其占用的子矩阵像素置为1表示已占用。
3.根据权利要求1所述一种词云图可视化方法,其特征在于:所述步骤四中采用矩形边线检测是否与已布局词组重叠,检测代价最小。
4.根据权利要求1所述一种词云图可视化方法,其特征在于:所述步骤五中检测是否可以旋转,由于直接旋转的是画布,而不是词组,需要以词组中心旋转,并计算旋转后拟占用矩形区域是否与已布局词组重叠。
5.根据权利要求1所述一种词云图可视化方法,其特征在于:所述步骤六中为产生近大远小的视觉效果,将高频词组尽可能布局在中央,将词组按照快速垂直水平同时在不重叠情况下向中心靠近,再逐像素垂直、水平单方向在不重叠情况下向中心靠近。
6.根据权利要求1所述一种词云图可视化方法,其特征在于:所述步骤八中字模提取,词组布局完成后将其占用的子矩阵和字模重叠像素区置为1,表示已占用,实现词组内部空隙的利用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410020352.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自动变速器的滑行降档控制装置
- 下一篇:燃油控制方法和装置、以及工程机械