[发明专利]一种关键通讯节点识别方法、装置及介质有效
申请号: | 201911285935.8 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111080463B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 林文楷;吴文;王国威;王海滨;鄢小征;王兵 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F40/30;G06F16/906 |
代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 陈远洋 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关键 通讯 节点 识别 方法 装置 介质 | ||
1.一种关键通讯节点识别方法,其特征在于,该方法包括:
重点通讯节点确定步骤,基于通讯的内容从群通讯人员中确定需要重点关注的人员作为重点通讯节点,所述重点通讯节点确定步骤包括:提取每个群体的群成员分布和发言内容,使用语义分析模型基于发言内容确定交流场景;
对每个群体的成员的发言内容涉及的活动类型进行分析,当某一群中同一活动类型的成员≥n个时,则将该成员之间的通讯关系加到该活动类型的聚类;
对活动类型的聚类中的通讯关系涉及的人员标记重点通讯节点的标签;
共同通讯节点确定步骤,对群通讯人员中除重点通讯人员之外的人员进行共同通讯判断,如果具有共同通讯特征,则将具有共同通讯特征的节点作为共同通讯节点,所述共同通讯节点确定步骤包括:统计每个群中的成员数、参与同一话题的人员数、活跃成员数、同一话题的分布地域数及最后发言时间距离系统日期的天数;
利用加权计算法计算群体的重要性,如果计算群体的重要性超过第一阈值,则群中的参与同一话题的人员为共同通讯节点,其中:群体的重要性=(k1*a1+k2*a2+k3*a*3+k4*a4)/(k1+k2+k3+k4),k1为参与同一话题的人员数,a1为k1的权重,k2为活跃成员数,a2为k2的权重,k3为群成员的分部地域数,a3为k3的权重,k4为最后发言时间距离系统日期的天数,a4为k4的权重;
核心集合生成步骤,将重点通讯节点和共同通讯节点进行合并组成核心人员集合;
关键通讯节点确定步骤,基于人员在群中的身份类型、活跃度、发言内容及加入群数确定核心人员集合中的人是否为关键通讯节点,如果是,则将该人标记关键通讯节点的标签。
2.根据权利要求1所述的方法,其特征在于,所述语义分析模型的构建步骤包括:
导入某一类型人员的通联内容,搭建语义分析模型;
提取所述通联内容中各关键词出现的次数和比重,得到关键词的权重及分布概率,结合人工标注方式得到语义分析模型的正反样本;
将新的样本再加入语义分析模型,调整关键词的权重和分布概率的阈值,对语义分析模型进行循环训练,得到训练好的语义分析模型。
3.根据权利要求1所述的方法,其特征在于,所述关键通讯节点确定步骤包括:
计算核心人员集合中的人员重要性,判断重要性是否低于第二阈值,如果是,则该人员的通讯节点不是关键通讯节点,如果否,则该人员为核心人员;
其中:X代表身份类型,Y代表活跃度,L代表发言内容次数,Z代表加入群数,i、m为整数;
利用加权计算法计算核心人员的可信度,如果可信度超过第三阈值,则将该核心人员标记关键通讯节点的标签;
其中,核心人员的可信度=(X*w1+Y*w2+L*w3+Z*w4)/(X+Y+L+Z),w1、w2、w3、w4为权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911285935.8/1.html,转载请声明来源钻瓜专利网。