[发明专利]一种基于中文文本分析的社交网络用户人格预测方法在审

申请号：	201811553414.1	申请日：	2018-12-18
公开（公告）号：	CN109635207A	公开（公告）日：	2019-04-16
发明（设计）人：	李岩锋;高俊波;孙伟;李铁锋;白静静	申请（专利权）人：	上海海事大学
主分类号：	G06F16/9536	分类号：	G06F16/9536;G06Q50/00;G06F17/27
代理公司：	上海元好知识产权代理有限公司 31323	代理人：	徐雯琼;张妍
地址：	201306 上海市***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于中文文本分析的社交网络用户人格预测方法，通过对用户在社交网络上近一段时间所发布的中文文本数据进行处理，将文本分为用户基本状态信息、用户互动信息、用户文本信息三类。对文本数据进行预处理，得到由各类词构成的数据集；基于情感词典对文本数据进行词性标注，计算各类词性在文本中的出现频率，组合优化用户的以上三类信息，并基于专家量表对用户进行测验的结果作为事实数据，构造数值化的数据集；对得到的数据集进行特征工程，将得到用于人格预测的特征要素集，基于BP神经网络训练得到人格预测模型，通过该模型实现社交网络用户的人格预测。本发明具有数据采集方便、不依赖心理学专家经验、无须耗费人力物力，精确度高的优点。
搜索关键词：	社交网络用户中文文本数据集预测文本数据文本预处理基本状态信息用户文本信息词性标注模型实现情感词典人力物力社交网络事实数据数据采集特征要素用户互动预测模型专家经验组合优化数值化词性量表测验心理学分析发布
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于中文文本分析的社交网络用户人格预测方法，其特征在于，包含以下步骤：S1、对中文社交网络文本进行初步处理，将文本分为用户基本状态信息、用户互动信息以及用户文本信息三类；S2、对用户文本信息进行预处理，得到由各类词构成的数据集D_word；S3、对用户文本信息的文本特征进行抽取，基于情感词典对数据集D_word进行词性标注，计算各类词性在文本中的出现频率，组合优化以上三类文本信息，以基于专家量表对用户进行测验的结果作为事实数据，构造数值化的数据集D_comp；S4、对数值化的数据集D_comp进行特征工程，即对特征进行筛选，得到用于人格预测的特征要素集D_pre；S5、基于BP神经网络训练模型进行人格预测，以步骤S4得到的特征要素集D_pre中的特征向量作为模型输入，以神经质、外向性、开放性、顺从性、严谨性这5项人格的比重值作为模型输出，构建神经网络，训练预测模型，进行人格预测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海海事大学，未经上海海事大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811553414.1/，转载请声明来源钻瓜专利网。

上一篇：融合隐式反馈和用户社会地位的个性化推荐方法及系统
下一篇：用户到访推断模型建立方法、装置及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于中文文本分析的社交网络用户人格预测方法在审

专利文献下载