[发明专利]基于同义词和反义词的中文标签推荐修正方法有效

专利信息
申请号: 201711055214.9 申请日: 2017-10-31
公开(公告)号: CN107704632B 公开(公告)日: 2018-12-14
发明(设计)人: 刘元珍;韩立新;杨忆;勾智楠 申请(专利权)人: 河海大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 母秋松;董建林
地址: 210098 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 同义词 反义词 中文 标签 推荐 修正 方法
【说明书】:

发明公开了一种基于同义词和反义词的中文标签推荐修正方法,对基于张量分解方法得到的标签推荐列表中的标签在推荐给用户前进行同义词和反义词的判别检查,将同义词词对和反义词词对中排名靠后的标签排在候选标签列表的最后,并取前N个标签推荐给用户,从而消除推荐的标签组内标签语义冗余和语义冲突或者降低语义冗余和语义冲突标签的推荐排名。本发明提供的基于同义词和反义词的中文标签推荐修正方法,可以消除推荐的中文标签组内的标签语义冗余和语义冲突或者降低冗余标签及冲突标签在推荐标签组内的推荐排名。

技术领域

本发明涉及一种基于同义词和反义词的中文标签推荐修正方法,属于计算机网络推荐系统技术领域。

背景技术

随着社交网络的迅速发展,用户为自己感兴趣的内容包括网页、图片、视频、音乐等自由地添加标签变得越来越流行。标签具有一定的社会性,同时存在着诸如同义词、歧义词、错误的拼写等情况,导致标签系统中存在大量的重复、不规范、无效的标签,不利于标签系统的良性循环。标签推荐是指当用户标注一个资源时,系统结合用户的兴趣爱好或者资源本身的内容,自动推荐适当的标签供用户选择,从而节约用户的时间和精力,改善用户体验,促进资源分类及方便用户查找。

现有的标签推荐方法主要可以分为两类:(1)基于内容的方法:首先对待标注资源进行内容特征提取,建立资源的模型,计算已有标签的资源与待标注资源的内容特征之间的相似度,得出推荐标签候选集,从候选集中选出相似度最大的Top-N个标签推荐给用户。(2)基于用户行为数据的方法:根据用户对过去某些资源的标注行为,充分挖掘用户、资源与标签之间的关系,推断用户对一个新资源可能打的标签,并将这些可能的标签推荐给用户供其选择。根据具体算法的不同,主要包括两种:①张量分解:将标注数据看成由用户、资源、标签组成的立方体,其中有值的地方表示用户对资源标注了某个标签,然后使用张量分解方法高阶奇异值分解HOSVD挖掘用户、资源、标签之间潜在的语义关联,为用户-资源对推荐关联权重最高的Top-N个标签。②图方法:将标签系统映射成一张由用户、资源、标签组成的三分图,三分图的三个节点分别是用户、资源和标签,算法通过预测三分图的边权,最后根据路径权重来决定用户-资源对的个性化标签推荐排名,推荐出Top-N个标签。

无论是基于内容还是基于用户行为数据,现有的中文及外文标签推荐方法都是推荐一组标签,但对推荐给用户的标签组中标签之间的关系并未研究处理,致使有些推荐的标签之间语义冗余重复或者存在完全的语义冲突,推荐的同组标签之间的关系成为标签推荐算法的盲点。本发明拟解决中文标签推荐中同组标签之间的语义冗余及语义冲突问题,在呈现给用户之前对推荐的标签组内标签进行调整修正,从而完善中文标签推荐算法。

发明内容

目的:为了克服现有技术中存在的不足,解决目前中文标签推荐中标签语义冗余重复及语义冲突的问题,本发明提供一种基于同义词和反义词的中文标签推荐修正方法。

技术方案:为解决上述技术问题,本发明采用的技术方案为:

一种基于同义词和反义词的中文标签推荐修正方法,包括如下步骤:

步骤1:获得用户、资源、标签的中文数据集,用张量分解的方法计算得到用户给资源打的标签,将这些标签按概率由大到小排序,得到有序推荐标签列表;

步骤2:对上述由张量分解方法获得的有序推荐标签列表,选取前N+K个概率最大的标签作为候选标签队列,其中,N为计划向用户推荐的标签的数量,K为候补推荐标签的调整个数,若推荐标签列表中标签个数小于(N+K),则有序推荐标签列表中标签全部选取作为候选标签队列;

步骤3:将候选标签队列的N+K个标签两两配对,通过中文同义词和反义词判别方法得到语义冗余重复的同义词标签对和语义冲突的反义词标签对;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711055214.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top