[发明专利]一种基于社交数据的人物性格分析方法在审
申请号: | 201910046869.2 | 申请日: | 2019-01-18 |
公开(公告)号: | CN109766452A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 刘磊;郑瑶;陈浩;吴爽;孙应红;李静 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F17/27;G06Q50/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人物性格 分析 社交数据 雷达图 预处理 表情 表达方式 表情分析 表情符号 情感倾向 数据分析 文本分析 文本情感 性格特点 政府部门 图结构 有效地 归类 微博 语料 情绪 帮助 | ||
本发明针对人物性格分析问题,提出了一种基于社交数据的人物性格分析方法。主要内容包括:对微博语料进行预处理;建立性格‑表情符号词典、性格‑表情数量词典、性格‑词类别词典、性格‑文本情感词典、性格‑配图数量词典、性格‑配图结构词典;进行表情分析、文本分析、配图分析以及博文情感倾向概括分析,最后通过给出人物性格的大五人格雷达图,来表示人物性格。本专利按照大五人格将社交用户的性格进行归类,对社交中用户的不同表情、表达方式、配图以及情绪进行数据分析,给出人物性格对应的大五人格雷达图。本发明可以帮助相关公司、企业及政府部门有效地分析社交用户的性格特点。
技术领域
本发明属于文本信息处理领域,具体是涉及一种基于社交数据的人物性格分析方法。
背景技术
随着互联网的高速发展,网络社交平台逐渐成为全球用户信息分享的主要平台。用户通过发布文本或图片的形式实现信息的分享和传播。中文社交平台以新浪微博、微信、QQ为代表,英文社交平台以Twitter和Facebook为代表。用户在网络社交平台上的互动逐渐替代了传统的面对面交流。
社交平台产生的用户规模巨大,具有很高的应用价值。人们可以通过社交数据分析工具,提取个性化的用户画像,包括用户的兴趣、消费、社会和性格等特征。
人物的性格分析研究属于心理学范畴,一般通过性格调查问卷形式,通过性格分析模型得出结论。而基于社交数据的人物性格分析,是假设人的社交信息能够体现出人的性格特征,可以通过数据挖掘方法,构建基于社交数据的人物性格分析模型。
采用大五人格分类标准,人物性格可以分为5类,分别为外倾型、宜人型、尽职型、神经质和开放型。其中五种人格的性格特征如下:
外倾性(Extraversion):高外向的人喜欢与人接触,充满活力,经常感受到积极的情绪。低外向的人比较安静,谨慎,不喜欢与外界过多接触。
宜人性(Agreeableness):宜人性高的人是善解人意的、友好的、慷慨大方的、乐于助人的,愿意为了别人放弃自己的利益。宜人性低的人则把自己的利益放在别人的利益之上。
尽责性(Conscientiousness):高尽责的人更加聪明和可靠,但可能是一个完美主义者或者是一个工作狂。低尽责性的个体常被认为是快乐的、有趣的、很好的玩伴。低尽责性的个体一般不会获得很大的成就。
神经质或情绪稳定性(Neuroticism):神经质得分高的人更容易体验到诸如愤怒、焦虑、抑郁等消极的情绪。神经质维度得分低的人较少烦恼,较少情绪化,比较平静。
开放性(Openness):开放性得分高的人富有想象力和创造力,好奇,欣赏艺术,对美的事物比较敏感。开放性得分低(即封闭性)的人讲求实际,偏爱常规,比较传统和保守。
大五人格分类标准只给出了人物的定性描述,没有给出量化标准。因此需要建立社交数据到大五性格分类的判定模型。
发明内容
本发明针对人物性格分析问题,提出了一种基于社交数据的人物性格分析方法。主要内容包括:对微博语料进行预处理;建立性格-表情符号词典、性格-表情数量词典、性格-词类别词典、性格-文本情感词典、性格-配图数量词典、性格-配图结构词典;进行表情分析、文本分析、配图分析以及博文情感倾向概括分析,最后给出人物性格的大五人格雷达图,来表示人物性格。通过实施步骤的实验分析,证明了方法的有效性。
为实现上述目的,本发明采用如下的技术方案
一种基于社交数据的人物性格分析方法,包括以下步骤:
步骤(1)微博语料获取和预处理
首先利用爬虫获取中文微博语料,然后对微博博文进行必要的预处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910046869.2/2.html,转载请声明来源钻瓜专利网。