[发明专利]一种基于社交数据的人物性格分析方法在审

专利信息
申请号: 201910046869.2 申请日: 2019-01-18
公开(公告)号: CN109766452A 公开(公告)日: 2019-05-17
发明(设计)人: 刘磊;郑瑶;陈浩;吴爽;孙应红;李静 申请(专利权)人: 北京工业大学
主分类号: G06F16/36 分类号: G06F16/36;G06F17/27;G06Q50/00
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 吴荫芳
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 人物性格 分析 社交数据 雷达图 预处理 表情 表达方式 表情分析 表情符号 情感倾向 数据分析 文本分析 文本情感 性格特点 政府部门 图结构 有效地 归类 微博 语料 情绪 帮助
【说明书】:

本发明针对人物性格分析问题,提出了一种基于社交数据的人物性格分析方法。主要内容包括:对微博语料进行预处理;建立性格‑表情符号词典、性格‑表情数量词典、性格‑词类别词典、性格‑文本情感词典、性格‑配图数量词典、性格‑配图结构词典;进行表情分析、文本分析、配图分析以及博文情感倾向概括分析,最后通过给出人物性格的大五人格雷达图,来表示人物性格。本专利按照大五人格将社交用户的性格进行归类,对社交中用户的不同表情、表达方式、配图以及情绪进行数据分析,给出人物性格对应的大五人格雷达图。本发明可以帮助相关公司、企业及政府部门有效地分析社交用户的性格特点。

技术领域

本发明属于文本信息处理领域,具体是涉及一种基于社交数据的人物性格分析方法。

背景技术

随着互联网的高速发展,网络社交平台逐渐成为全球用户信息分享的主要平台。用户通过发布文本或图片的形式实现信息的分享和传播。中文社交平台以新浪微博、微信、QQ为代表,英文社交平台以Twitter和Facebook为代表。用户在网络社交平台上的互动逐渐替代了传统的面对面交流。

社交平台产生的用户规模巨大,具有很高的应用价值。人们可以通过社交数据分析工具,提取个性化的用户画像,包括用户的兴趣、消费、社会和性格等特征。

人物的性格分析研究属于心理学范畴,一般通过性格调查问卷形式,通过性格分析模型得出结论。而基于社交数据的人物性格分析,是假设人的社交信息能够体现出人的性格特征,可以通过数据挖掘方法,构建基于社交数据的人物性格分析模型。

采用大五人格分类标准,人物性格可以分为5类,分别为外倾型、宜人型、尽职型、神经质和开放型。其中五种人格的性格特征如下:

外倾性(Extraversion):高外向的人喜欢与人接触,充满活力,经常感受到积极的情绪。低外向的人比较安静,谨慎,不喜欢与外界过多接触。

宜人性(Agreeableness):宜人性高的人是善解人意的、友好的、慷慨大方的、乐于助人的,愿意为了别人放弃自己的利益。宜人性低的人则把自己的利益放在别人的利益之上。

尽责性(Conscientiousness):高尽责的人更加聪明和可靠,但可能是一个完美主义者或者是一个工作狂。低尽责性的个体常被认为是快乐的、有趣的、很好的玩伴。低尽责性的个体一般不会获得很大的成就。

神经质或情绪稳定性(Neuroticism):神经质得分高的人更容易体验到诸如愤怒、焦虑、抑郁等消极的情绪。神经质维度得分低的人较少烦恼,较少情绪化,比较平静。

开放性(Openness):开放性得分高的人富有想象力和创造力,好奇,欣赏艺术,对美的事物比较敏感。开放性得分低(即封闭性)的人讲求实际,偏爱常规,比较传统和保守。

大五人格分类标准只给出了人物的定性描述,没有给出量化标准。因此需要建立社交数据到大五性格分类的判定模型。

发明内容

本发明针对人物性格分析问题,提出了一种基于社交数据的人物性格分析方法。主要内容包括:对微博语料进行预处理;建立性格-表情符号词典、性格-表情数量词典、性格-词类别词典、性格-文本情感词典、性格-配图数量词典、性格-配图结构词典;进行表情分析、文本分析、配图分析以及博文情感倾向概括分析,最后给出人物性格的大五人格雷达图,来表示人物性格。通过实施步骤的实验分析,证明了方法的有效性。

为实现上述目的,本发明采用如下的技术方案

一种基于社交数据的人物性格分析方法,包括以下步骤:

步骤(1)微博语料获取和预处理

首先利用爬虫获取中文微博语料,然后对微博博文进行必要的预处理。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910046869.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top