[发明专利]人格分类方法及装置有效
申请号: | 201910540702.1 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110275953B | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 林涛;吴芝明;冯豆豆 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06F40/30 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘亚飞 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人格 分类 方法 装置 | ||
本申请提供的人格分类方法及装置,获取待分析的测试文本,并对给测试文本进行预处理使得该测试文本转化成神经网络模型能够处理的词向量,并将该词向量输入循环神经网络。其中,将循环神经网络中预设网络层输出的数据与人格相关系数表中的数据进行拼接后,输入分类层获得该测试文本对应作者的人格分类结果,该人格相关系数表记录有不同人格特质之间的预设相关度。如此,通过该循环神经网络在分析测试文本的过程中,结合不同人格特质之间的预设相关度,使得预测的人格分类结果更加准确。
技术领域
本申请涉及数据处理领域,具体而言,涉及一种人格分类方法及装置。
背景技术
人格是个体内在心理生理系统的动力组织,它决定一个人对其环境独特的适应。在人格心理学中有多种人格结构模型,在诸多人格结构模型中,人格流派的大五人格模型因其稳定、可测量、高可信度和适用范围广等优点被广泛使用。大五人格模型共包含五个人格特质,分别是开放性、尽责性、外向性、宜人性和神经质,每个人的人格类型均可通过该五个人格特质决定。
针对文本数据的人格分类是通过分析文本内容,比如博客或者散文等,得出被试文本内容对应作者的人格类型。人格分类中通常根据某个阈值将每个人格划分成高人格和低人格两类,其中,该阈值可以是该人格的平均分、中数等。目前,比较常见的做法是分别为每个人格建立二分类模型,但这种做法忽略了人格特质间的相关性,导致分类准确率低。
发明内容
为了克服现有技术中的至少一个不足,本申请的目的之一在于提供一种人格分类方法,应用于数据处理设备,所述数据处理设备预设有训练好的循环神经网络,所述训练好的循环神经网络包括特征提取层、分类层及记录有不同人格特质之间的预设相关程度的人格相关系数表,所述方法包括:
获取测试文本的词向量;
将所述词向量输入所述循环神经网络;
将所述循环神经网络中预设网络层输出的数据与所述人格相关系数表中的数据进行拼接,并输入所述分类层获得所述测试文本对应作者的人格类型。
可选地,所述循环神经网络为双向循环神经网络。
可选地,所述方法还包括:
针对当前输入的词向量,通过所述双向循环神经网络获得所述当前输入的词向量的上文特征向量和下文特征向量;
将所述当前输入的词向量、上文特征向量以及下文特征向量拼接成新的特征向量。
可选地,所述预设网络层为最大池化层。
可选地,所述不同人格特质之间的预设相关程度通过计算人格之间的皮尔逊相关获得。
可选地,所述获取测试文本的词向量之前还包括步骤:
对所述测试文本进行分词处理,获得对应的分词结果;
通过词向量转化工具对所述分词结果进行处理,获得所述词向量。
可选地,所述方法还包括对所述循环神经网络的训练步骤:
获取训练文本对应的词向量,该训练文本的词向量标记有多个人格特质标签;
基于预设损失函数,将所述训练文本的词向量输入所述循环神经网络,通过反向传播算法对所述循环神经网络的权值进行迭代调整,直到所述损失函数的输出值小于预设阈值。
本申请实施例的另一目的在于提供一种人格分类装置,应用于数据处理设备,所述数据处理设备预设有训练好的循环神经网络,所述训练好的循环神经网络包括特征提取层、分类层及记录有不同人格特质之间的预设相关程度的人格相关系数表,所述人格分类装置包括获取模块、输入模块和分类模块;
所述获取模块用于获取测试文本的词向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910540702.1/2.html,转载请声明来源钻瓜专利网。