[发明专利]一种社交网络抑郁情感的账户相似性度量方法在审
申请号: | 201510653912.3 | 申请日: | 2015-10-13 |
公开(公告)号: | CN105243595A | 公开(公告)日: | 2016-01-13 |
发明(设计)人: | 于霄 | 申请(专利权)人: | 宁波知微瑞驰信息科技有限公司;于霄 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 315100 浙江省宁波市鄞*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种社交网络账户的抑郁情感相似性的度量方法,属于社交网络数据挖掘的技术应用领域。本发明的优点是:本发明基于社交网络和抑郁情感表述的内在特性,提出了基于情感时间段的账户抑郁情感相似评定的方法,处理中基于用户信息建立了分段时间标准的二次特征,并经相似规则评判。计算时都采用线性复杂度的算法进行分析,计算资源需求小,具有较低的时间和空间代价;相似过程采用比对处理,最终输出真正高相似的账号信息。此信息在现实提取中更具实用价值。本发明有效实现了对社交网络的抑郁情感信息的时间影响的分析,能够将相似情感的账户自动识别,在指定影响级别情况下,可供后续人工分析及影响干预。 | ||
搜索关键词: | 一种 社交 网络 抑郁 情感 账户 相似性 度量 方法 | ||
【主权项】:
一种社交网络抑郁情感的账户相似性度量方法,其特征在于:它包括以下步骤:步骤一:获取欲分析的社交网络的账号在指定的网络社区d天(7≤d≤100)内的所有的自己发布的帖子的完整文字内容、自己发布的帖子的发布时间、回复评论别人的帖子的完整文字内容、回复评论别人的帖子的时间;并人工给定一份抑郁情感词列表,里面包括100个以上的抑郁倾向的情感词;人工给定一个情感相似阈值θ(θ>0)。步骤二:对每个账号信息的完整记录,将各账号的信息进行标准化,得到标准化后的结果NT,其中包括以下16个度量量:n1,n2,n3,n4,m1,m2,m3,m4,p1,p2,p3,p4,q1,q2,q3,q4其中各标准化量的计算方法为:n1=N1d‑1,N1为发布时间在5点起至11点止的帖子总数目n2=N2d‑1,N2为发布时间在11点起至14点止的帖子总数目n3=N3d‑1,N3为发布时间在14点起至20点止的帖子总数目n4=N4d‑1,N4为发布时间在0点起至5点止和20点起至24点止的帖子总数目m1=M1d‑1,M1为回复评论时间在5点起至11点止的帖子总数目m2=M2d‑1,M2为回复评论时间在11点起至14点止的帖子总数目m3=M3d‑1,M3为回复评论时间在14点起至20点止的帖子总数目m4=M4d‑1,M4为回复评论时间在0点起至5点止和20点起至24点止的帖子总数目p1=P1d‑1,P1为发布时间在5点起至11点止的帖子文字中包含的抑郁情感词总数p2=P2d‑1,P2为发布时间在11点起至14点止的帖子文字中包含的抑郁情感词总数p3=P3d‑1,P3为发布时间在14点起至20点止的帖子文字中包含的抑郁情感词总数p4=P4d‑1,P4为发布时间在0点起至5点止和20点起至24点止的帖子文字中包含的抑郁情感词总数q1=Q1d‑1,Q1为回复评论时间在5点起至11点止的帖子文字中包含的抑郁情感词总数q2=Q2d‑1,Q2为回复评论时间在11点起至14点止的帖子文字中包含的抑郁情感词总数q3=Q3d‑1,Q3为回复评论时间在14点起至20点止的帖子文字中包含的抑郁情感词总数q4=Q4d‑1,Q4为回复评论时间在0点起至5点止和20点起至24点止的帖子文字中包含的抑郁情感词总数其中抑郁情感词总数为发布或回复评论的帖子中,出现抑郁情感词列表中的词的频次。由此,而第i个账号的特征结果NT(i)为:NT(i)=(n1i,n2i,n3i,n4i,m1i,m2i,m3i,m4i,p1i,p2i,p3i,p4i,q1i,q2i,q3i,q4i)步骤三:对每个账号信息,根据标准化后的信息NT,计算此账号的特征化结果,得到的特征计算结果表示为ZT,包括以下16个特征量:PNY,PNG,PNL,PNF,RNY,RNG,RNL,RNF,PYY,PYG,PYL,PYF,RYY,RYG,RYL,RYF各特征量计算的具体方法为:PNY,PNG,PNL,PNF的计算方法为: 其中n1,n2,n3,n4分别为步骤二所得到的结果RNY,RNG,RNL,RNF的计算方法为: 其中m1,m2,m3,m4为步骤二所得到的结果PYY,PYG,PYL,PYF的计算方式为:PYY=0.3934*arctan(p1)PYG=0.3934*arctan(p2)PYL=0.3934*arctan(p3)PYF=0.3934*arctan(p4)其中p1,p2,p3,p4为步骤二所得到的结果RYY,RYG,RYL,RYF的计算方式为:RYY=0.6366*arctan(q1)RYG=0.6366*arctan(q2)RYL=0.6366*arctan(q3)RYF=0.6366*arctan(q4)其中q1,q2,q3,q4为步骤二所得到的结果由此,而第i个账号的特征结果ZT(i)为ZT(i)=(PNYi,PNGi,PNLi,PNFi,RNYi,RNGi,RNLi,RNFi,PYYi,PYGi,PYLi,PYFi,RYYi,RYGi,RYLi,RYFi)步骤四:根据每个账号的特征化结果ZT,计算两两账号之间的情感相似程度值Dis,用Dis(i,j)表示i,j两个账号之间的情感相似程度值,ZT(i)和ZT(j)分别为i,j两个账号在步骤四的特征化结果,即是ZT(i)=(PNYi,PNGi,PNLi,PNFi,RNYi,RNGi,RNLi,RNFi,PYYi,PYGi,PYLi,PYFi,RYYi,RYGi,RYLi,RYFi)ZT(j)=(PNYj,PNGj,PNLj,PNFj,RNYj,RNGj,RNLj,RNFj,PYYj,PYGj,PYLj,PYFj,RYYj,RYGj,RYLj,RYFj)而Dis(i,j)的计算方式如下:Dis(i,j)=(PNYi*PNYj+PNGi*PNGj+PNLi*PNLj+PNFi*PNFj+RNYi*RNYj+RNGi*RNGj+RNLi*RNLj+RNFi*PNFj+PYYi*PYYj+PYGi*PYGj+PYLi*PYLj+PYFi*PYFj+RYYi*RYYj+RYGi*RYGj+RYLi*RYLj+RYFi*RYFj)*(PNYi2+PNGi2+PNLi2+PNFi2+RNYi2+RNGi2+RNLi2+RNFi2+PYYi2+PYGi2+PYLi2+PYFi2+RYYi2+RYGi2+RYLi2+RYFi2)‑0.5*(PNYj2+PNGj2+PNLj2+PNFj2+RNYj2+RNGj2+RNLj2+RNFj2+PYYj2+PYGj2+PYLj2+PYFj2+RYYj2+RYGj2+RYLj2+RYFj2)‑0.5步骤五:根据步骤四得到的两两账号之间的情感相似值Dis,将Dis与设定的情感相似阈值θ比较,Dis小于θ时,判定此两个账号的情感值相似。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波知微瑞驰信息科技有限公司;于霄,未经宁波知微瑞驰信息科技有限公司;于霄许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510653912.3/,转载请声明来源钻瓜专利网。
- 上一篇:煤矿巷道矸石转载、支护一体机
- 下一篇:一种无实物票据的验票方法