[发明专利]一种基于中文文本分析的社交网络用户人格预测方法在审
申请号: | 201811553414.1 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109635207A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 李岩锋;高俊波;孙伟;李铁锋;白静静 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00;G06F17/27 |
代理公司: | 上海元好知识产权代理有限公司 31323 | 代理人: | 徐雯琼;张妍 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于中文文本分析的社交网络用户人格预测方法,通过对用户在社交网络上近一段时间所发布的中文文本数据进行处理,将文本分为用户基本状态信息、用户互动信息、用户文本信息三类。对文本数据进行预处理,得到由各类词构成的数据集;基于情感词典对文本数据进行词性标注,计算各类词性在文本中的出现频率,组合优化用户的以上三类信息,并基于专家量表对用户进行测验的结果作为事实数据,构造数值化的数据集;对得到的数据集进行特征工程,将得到用于人格预测的特征要素集,基于BP神经网络训练得到人格预测模型,通过该模型实现社交网络用户的人格预测。本发明具有数据采集方便、不依赖心理学专家经验、无须耗费人力物力,精确度高的优点。 | ||
搜索关键词: | 社交网络用户 中文文本 数据集 预测 文本数据 文本 预处理 基本状态信息 用户文本信息 词性标注 模型实现 情感词典 人力物力 社交网络 事实数据 数据采集 特征要素 用户互动 预测模型 专家经验 组合优化 数值化 词性 量表 测验 心理学 分析 发布 | ||
【主权项】:
1.一种基于中文文本分析的社交网络用户人格预测方法,其特征在于,包含以下步骤:S1、对中文社交网络文本进行初步处理,将文本分为用户基本状态信息、用户互动信息以及用户文本信息三类;S2、对用户文本信息进行预处理,得到由各类词构成的数据集Dword;S3、对用户文本信息的文本特征进行抽取,基于情感词典对数据集Dword进行词性标注,计算各类词性在文本中的出现频率,组合优化以上三类文本信息,以基于专家量表对用户进行测验的结果作为事实数据,构造数值化的数据集Dcomp;S4、对数值化的数据集Dcomp进行特征工程,即对特征进行筛选,得到用于人格预测的特征要素集Dpre;S5、基于BP神经网络训练模型进行人格预测,以步骤S4得到的特征要素集Dpre中的特征向量作为模型输入,以神经质、外向性、开放性、顺从性、严谨性这5项人格的比重值作为模型输出,构建神经网络,训练预测模型,进行人格预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811553414.1/,转载请声明来源钻瓜专利网。