[发明专利]一种基于多模态数据的面向手写中文的性格识别方法有效
申请号: | 202110427932.4 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113469184B | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 吴雯;纪雨;胡谊;贺樑;夏聪;康亮 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/166;G06V10/82;G06N3/04 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多模态 数据 面向 手写 中文 性格 识别 方法 | ||
本发明公开了一种基于多模态数据的面向手写中文的性格识别方法,其特点是根据手写中文的结构分析写作者的性格。该方法包括:抽取手写中文的字符信息(四方轮廓类别、字体大小程度、字体倾斜程度、字间距);从完整的手写中文图片以及按长度三等份裁剪的手写中文图片中抽取章法信息;将手写中文转换为纯文本,抽取CLIWC特征作为文本信息;融合手写中文的字符信息、章法信息和文本信息,进行写作者的性格预测。本发明与现有技术相比,性格预测的准确率更高,预测结果的可解释性更强。并且本发明适用于任何手写中文的场景。
技术领域
本发明涉及图像处理和自然语言处理领域,具体来说,涉及一种基于多模态数据的面向手写中文的性格识别方法。
背景技术
性格被定义为个体对现实的态度以及其相应行为方式的综合表现,是个体最重要的属性之一。在教育领域,由于学生的学习动机、对教学风格的偏好等会受到他们性格的影响,因此性格识别能够帮助老师了解学生对学习的潜在个性需求,从而因材施教、为学生提供更合适的学习方法,提高学生的学习表现和学习满意度;在电商领域,由于性格会影响用户的决策行为,并且性格揭露了用户的偏好信息,因此性格识别能够帮助商家为用户提供合适的商品,从而提高用户的购买率、增加商家的收益;在职场领域,性格识别能够帮助公司分析求职者的抗压能力等,从而筛选出优秀的求职者;在借贷领域,性格识别能够帮助公司分析借贷者是否说谎,从而过滤掉不合格的借贷者。
笔迹心理学家表示,笔迹(即,手写文字)是对个体心理无意识的暴露,可以全面反映个体的心理特征。例如,偏向于写正方形字体的人,通常是遵守规则、原则性强的,而偏向于写长方形字体的人,则做事灵活,喜欢追求新奇。偏向于写大字的人,一般富有冒险精神、善于表现自我。而偏向于写小字的人,更加周密严谨、有钻研精神。
目前的研究中,研究者们通常基于手写英文进行个体的自动性格识别。例如,分析个体手写的大写字母和小写字母、分析个体手写的特殊字母(“d”、“i”、“t”、“y”)。但是研究者们忽视了对手写中文的使用。有别于英文,中文作为中国人的母语,是特殊的方块字,字体结构对于反应中国人性格具有天然优势。
发明内容
本发明的目的在于利用手写中文的结构特点,提供了一种基于多模态数据的面向手写中文的性格识别方法,从手写中文中抽取字符信息、章法信息和文本信息,并将这些多模态数据融合用于分析写作者的性格。
实现本发明目的的具体技术方案是:
一种基于多模态数据的面向手写中文的性格识别方法,特点是根据手写中文的结构特点识别写作者的性格。该方法包括以下具体步骤:
步骤1:预处理
将手写中文图片进行缩放、裁剪,达至规定尺寸(长不小于640,宽不小于480);再将手写中文图片转换成二值化图像,记为Img-0;
步骤2:获取字符信息
将Img-0进行字符切割,获取字符集h={h1,h2,......,hk};k表示字符总数;
对于每个字符hi(1≤i≤k):
(1)判断hi的四方轮廓类别oi,是正方形即高度等于宽度、长方形即高度大于宽度、还是扁方形即高度小于宽度;
(2)计算hi的字体大小si;
(3)计算hi的字体倾斜角度ai;
对o={o1,o2,......,ok},计算其中正方形字体的占比、长方形字体的占比以及扁方形字体的占比,作为字符集的四方轮廓信息O;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110427932.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置