[发明专利]一种基于多元化关系画像技术的在线社会关系搜索方法有效
申请号: | 202010153660.9 | 申请日: | 2020-03-06 |
公开(公告)号: | CN111488401B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 王博;杨毅 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/26;G06F16/245 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李丽萍 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多元化 关系 画像 技术 在线 社会关系 搜索 方法 | ||
本发明公开了一种基于多元化关系画像技术的在线社会关系搜索方法,首先,针对指定的语料数据基于非直观和直观画像方法进行人际关系画像;然后,通过人际关系在线画像系统将人际关系画像进行可视化,即得到与该人际关系画像结果对应的社会关系网络拓扑图,并通过网络拓扑图中边的颜色和粗细反映关系的类型和强度。然后可在该网络拓扑图中根据设定的好友关系数量和好友关系类型进行人物搜索,根据与设定的关系个例最相似的关系进行人物关系搜索,并实时显示搜索结果。本发明以统一的方式表示直观画像和非直观画像结果,并提供了搜索方法,为研究两种画像方式之间的内在联系提供了一个重要的可视化工具以及理论基础。
技术领域
本发明涉及数据挖掘,用户画像,社会关系网络拓扑结构分析方法。
背景技术
社会关系画像是社会计算领域中一个重要也是热门的研究话题。当前,社会关系画像有两种主要形式:非直观画像和直观画像。非直观画像即用网络拓扑结构来对社会关系进行描述,而非直观画像网络拓扑结构的生成又有很多不同的方法。其中,三元闭包理论和平衡论以及其扩展理论是较早的社会关系画像理论,其可以直接用在社会关系网络拓扑图中对社会关系进行建模。此外,利用关系嵌入方法将关系字符等距离嵌入到提及关系双方的上下文语料中然后利用word2vec方法来获得关系字符向量,用关系字符向量来描述非直观画像网络拓扑结构图中的边是另外一种常用的方法。利用wrod2vec方法进行用户画像获得用户向量,通过用户向量差来表示用户之间的关系也是一种非直观画像的方法。对于直观画像而言,使用几个词语或者句子来直观地反映关系是最常用的方法,比如,针对小说《三国演义》,用“父子”来描述关系“刘备-阿斗”,用“兄弟”来描述关系“刘备-关羽”。
然而,非直观画像与直观画像结果是否一致,两者之间是否有一定的联系目前尚未形成定论。同时也没有非直观画像和直观画像自动生成工具,因此导致探索这两种画像方式的内在联系有极大不便。此外,社会关系的两大属性关系强度和关系类型的研究也往往各执一派,尚没有研究去探索不同画像方式关系强度和关系类型之间蕴含的一些联系。
发明内容
针对上述现有技术,本发明旨在设计并开发一个基于多元化关系画像的社会关系搜索方法。允许用户上传两种不同类型的语料数据,分别是第三方描述数据(新闻,电影剧本等)和人物语言数据(微博等社会媒体言论)。本发明中根据数据文件,自动生成其对应的非直观画像或者直观画像,并通过设计和改进算法,利用统一的网络拓扑结构图来直观反映不同画像方法的画像结果。同时,通过为网络拓扑结构图中的边设置不同的颜色,粗细来反映社会关系的类型和强度属性。可以直观地看到不同画像方法生成的社会关系网络拓扑结构图,来进行对比和研究。生成网络拓扑结构图后,本发明提供了基于好友关系数量和好友关系类型的人物搜索方法以及基于关系相似度的关系搜索方法。此外,作为本发明的延伸,还设计有结点关系分类,结点合并,核心人物定位等功能来方便在生成网络拓扑结构图后做进一步研究分析。
为了解决上述技术问题,本发明提出了一种基于多元化关系画像技术的在线社会关系搜索方法,首先,针对指定的语料数据基于非直观画像方法和直观画像方法得到人际关系画像;然后,通过人际关系在线画像系统将人际关系画像进行可视化,即得到与该人际关系画像结果对应的社会关系网络拓扑图,根据设定的好友关系数量和好友关系类型在该社会关系网络拓扑图中进行人物搜索,根据与设定的关系个例最相似的关系在该社会关系网络拓扑图中进行人物关系搜索,并实时显示人物和人物关系的搜索结果。
进一步讲,本发明所述的基于多元化关系画像技术的在线社会关系搜索方法,其中,所述语料数据包括第三方描述数据和人物语言数据,第三方描述数据是指以第三人称的方式对人物进行描述的语料数据,人物语言数据是指人物在社交媒体上以第一人称的方式发表的一些互动语言或者观点看法。
所述非直观画像包括基于关系嵌入方法的非直观画像或是基于向量差方法的非直观画像;所述直观画像是基于主题词方法的直观画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010153660.9/2.html,转载请声明来源钻瓜专利网。