[发明专利]一种基于微博文本的人物性格刻画方法在审
申请号: | 201610559542.1 | 申请日: | 2016-07-15 |
公开(公告)号: | CN106202047A | 公开(公告)日: | 2016-12-07 |
发明(设计)人: | 刘春阳;吴俊杰;王卿;苗琳;袁石;王萌;张旭 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 赵文利 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于微博文本的人物性格刻画方法,属于数据挖掘领域;具体包括:首先,针对某个用户,对该用户某段时间内发的每条微博文本标注情绪标签,统计该用户每天冲动类以及抑郁类情绪的主导天数,从情绪特征角度对用户进行标记;然后,对该用户的所有微博文本进行关注话题分类,并选择该用户的关注话题;判断该用户的关注话题是否包括政治类和民生类,如果有,利用批判性词典对该用户进行语言特征刻画;否则,不做任何处理;最后、融合该用户的情绪特征和语言特征刻画该用户的性格,得到性格标签。优点在于:适用于对微博中人物性格特征刻画和分析,在舆情监控、人物属性刻画和信息传播扩散等领域有重要的应用价值。 | ||
搜索关键词: | 一种 基于 文本 人物性格 刻画 方法 | ||
【主权项】:
一种基于微博文本的人物性格刻画方法,其特征在于,考虑微博文本的口语化和实时性,从微博用户的情绪特征和语言特征两个维度对人物性格进行刻画;具体步骤如下:步骤一、针对某个用户,利用情绪词典对该用户在某段时间内发的每一条微博文本标注情绪标签;情绪词典包括高兴、生气、悲伤、厌恶和焦虑五种情绪;步骤二、根据情绪标签,统计该用户每天冲动类和抑郁类情绪的数量;冲动类包括生气和厌恶两种情绪,抑郁类包括悲伤和焦虑两种情绪;步骤三、根据该用户冲动类和抑郁类情绪的数量,计算该用户冲动类情绪的主导天数以及抑郁类情绪的主导天数;步骤四、根据该用户冲动类情绪的主导天数以及抑郁类情绪的主导天数,从情绪特征角度对用户进行标记;步骤五、利用话题词典对该用户的所有微博文本进行关注话题分类,并选择该用户的关注话题;话题词典有政治类、民生类、军事类、娱乐类和体育类;步骤六、判断该用户选取的关注话题中,是否包括政治类和民生类,如果有,利用批判性词典对该用户进行语言特征刻画;否则,不做任何处理;批判性词典包括的词语为表达讽刺、批评语气的词语;步骤七、融合该用户的情绪特征和语言特征刻画该用户的性格,得到该用户的人物性格标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610559542.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种文字输入方法及装置
- 下一篇:一种地址信息识别方法及装置