[发明专利]一种关键通讯节点识别方法、装置及介质有效
申请号: | 201911285935.8 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111080463B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 林文楷;吴文;王国威;王海滨;鄢小征;王兵 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F40/30;G06F16/906 |
代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 陈远洋 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关键 通讯 节点 识别 方法 装置 介质 | ||
本发明提供了一种关键通讯节点识别方法、装置及存储介质,该方法包括:基于通讯的内容从群通讯人员中确定需要重点关注的人员作为重点通讯节点;对群通讯人员中除重点通讯人员之外的人员进行共同通讯判断,如果具有共同通讯特征,则将具有共同通讯特征的节点作为共同通讯节点;将重点通讯节点和共同通讯节点进行合并组成核心人员集合;基于人员在群中的身份类型、活跃度、发言内容及加入群数确定核心人员集合中的人是否为关键通讯节点,如果是,则将该人标记关键通讯节点的标签。本发明对所有通讯节点进行逐级递进式的分析,进而自动发现处于塔尖的关键通讯节点,其发现关键通讯节点的效率高。
技术领域
本发明涉及人工智能技术领域,特别是一种关键通讯节点识别方法、装置及介质。
背景技术
目前社交软件成为各种网络活动的重要工具和阵地,各类社交软件和即时通信工具,与移动互联网相结合,已经成为当今互联网的主旋律,其传播快、影响大、覆盖广、社会动员能力强等特点,使社交软件成为网络违法行为的常用工具,许多专业化的违法团伙利用社交软件组织和实施违法活动,而且上下线关系庞大复杂,严重影响社会的稳定,威胁着国家安全。
在当前的手机取证产品中,缺乏有效的手段提取关键通讯节点等线索信息,导致在调查组织架构复杂的违法行为过程中,无法快速定位到关键线索,经常面临追踪难、调查难的困境。
此外,为了提高用户体验,需要将参与同一话题的通讯人员提取出来,比如参与购买同一商品的人员,这样可以方便商家向这些用户推荐商品,并提供团购优惠等等,也可以是一起讨论某项违法活动的人员等等,方便国家机关将这些人员控制。
由于社交软件覆盖着工作、生活等方方面面的应用,各种应用层出不穷,每把手机都会存储大量的社交群体信息,通过人工方式去发现和识别实施违法行为的关键通讯节点的信息,费时费力,难以满足实际需要。
发明内容
本发明针对上述现有技术中的缺陷,提出了如下技术方案。
一种关键通讯节点识别方法,该方法包括:
重点通讯节点确定步骤,基于通讯的内容从群通讯人员中确定需要重点关注的人员作为重点通讯节点;
共同通讯节点确定步骤,对群通讯人员中除重点通讯人员之外的人员进行共同通讯判断,如果具有共同通讯特征,则将具有共同通讯特征的节点作为共同通讯节点;
核心集合生成步骤,将重点通讯节点和共同通讯节点进行合并组成核心人员集合;
关键通讯节点确定步骤,基于人员在群中的身份类型、活跃度、发言内容及加入群数确定核心人员集合中的人是否为关键通讯节点,如果是,则将该人标记关键通讯节点的标签。
更进一步地,所述重点通讯节点确定步骤包括:
提取每个群体的群成员分布和发言内容,使用语义分析模型基于发言内容确定交流场景;
对每个群体的成员的发言内容涉及的活动类型进行分析,当某一群中同一活动类型的成员≧n个时,则将该成员之间的通讯关系加到该活动类型的聚类;
对活动类型的聚类中的通讯关系涉及的人员标记重点通讯节点的标签。
更进一步地,所述语义分析模型的构建步骤包括:
导入某一类型人员的通联内容,搭建训练语义分析模型;
提取所述通联内容中各关键词出现的次数和比重,得到关键词的权重及分布概率,结合人工标注方式得到训练语义分析模型的正反样本;
将新的样本再加入训练语义分析模型,调整关键词的权重和分布概率的阀值,对训练语义分析模型进行循环训练,得到训练好的训练语义分析模型。
更进一步地,所述共同通讯节点确定步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911285935.8/2.html,转载请声明来源钻瓜专利网。