[发明专利]标签情感倾向量化方法与系统无效
申请号: | 201210375356.4 | 申请日: | 2012-09-29 |
公开(公告)号: | CN103714071A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 张磊;张玄;尚磊 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京尚诚知识产权代理有限公司 11322 | 代理人: | 龙淳 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 情感 倾向 量化 方法 系统 | ||
技术领域
本专利涉及用户兴趣标签的量化处理。更具体的,本发明涉及一个对用户的标签进行情感倾向量化的方法与系统。
背景技术
随着Web2.0的发展和社交网络的风起云涌,越来越多的内容由用户自己产生,在这些个性化的信息中,蕴涵着大量用户的个人喜好和关注对象。比如在微博客(MicroBlog)上,人们讨论着他们感兴趣的事物、新闻以及人物,并通过一定的社交活动比如关注好友、消息转发等等来表达自己的观点。对这些信息进行分析可以得到一组可以描述用户的特征标签。标签可以被用在多个领域,最常见的是推荐系统。那么,怎样提高标签利用的效率便成为摆在我们面前的客观问题。
为了解答上面提到的问题。我们首先来看看现有技术获得的标签都有哪些方法,以及这些方法的不足。
现有技术1:标签传播算法。其通过对用户的过往言论的分析以及社交行为(比如关注、转发、等)并参考其好友的标签,可以得出该用户的标签。该标签可以描述用户的特征以及关注的对象。
现有技术2:(一种基于用户动机倾向性的标签推荐方法及系统[CN102262653A])。其提供一种基于用户动机倾向性的标签推荐方法,该方法可以识别用户标注网络信息资源的动机,推荐给用户一个符合用户意图的多个标签组成的列表。
发明内容
然而,第一种方法获得的标签只能说明用户对某类事物或话题关注度较高;而第二种方法虽然考虑了用户动机但并不含情感取向。
在利用以上技术获得的标签进行推荐的过程中,会发生将用户关注度高但其实反感的东西推荐给用户,造成错误推荐。因此,直接用现有技术获得的标签在推荐系统中不能进行精准推荐。
因此,在利用标签进行推荐时,需要考虑标签的情感取向。另外,标签具有一定的时效性,随着时间的变化,有些标签“不复存在”,并且不同时期人们对待同一个标签的情感态度也是不一样的,甚至可以由喜欢转憎恶。同时,不同性格的人情感表达方式与强度也不同,不同地域的人表达善恶美丑的词汇也不同。
为了提高兴趣标签的实用性,因此,在对标签对应文本内容进行情感分析的基础上,考虑用户地域、性格以及时效三个特征对标签进行量化处理,按数值大小进行排列,以此确立推荐信息的优先、轻重关系。
本发明的目的是克服现有技术的不足之处。为了提高兴趣标签的实用性,在对标签对应文本内容进行情感分析的基础上,考虑用户地域、性格以及时效三个特征对标签进行量化处理,按数值大小进行排列,以此确立标签的优先、轻重关系,从而最终得出用户的喜好。
本发明的一个方面的标签情感倾向量化方法的特征在于,包括:用户信息和标签收集步骤,收集用户的所属地域信息、性格类型以及标签集合;标签对应文本收集步骤,针对上述标签集合中的每一个标签进行反向文本收集,得到与上述标签对应的文本集合;专属情感词词典构建步骤,根据上述用户的所属地域信息,在预先存储的共通情感词词典的基础上,添加所属地域的地域情感词词典,构成专属情感词词典;标签情感表获得步骤,结合上述专属情感词词典依次对与上述标签对应的文本集合中的文本进行分析,得到上述标签的标签情感表,其中上述标签情感表包含情感词、该情感词的正负极性和权值;性格因子校正步骤,根据上述用户的性格类型,对上述标签情感表中权值大于规定的阈值的情感词进行性格因子校正;量化结果计算步骤,对校正后的上述标签情感表中的所有情感词,基于每个情感词的正负极性按照正极性为加负极性为减的方式将权值作代数和,由此求得上述标签的量化结果;和排序输出步骤,对所有标签按照每个标签的量化结果的值的大小进行排序并输出。
另外,在本发明的另一方面的标签情感倾向量化方法中,还具有时间因子校正步骤,根据上述文本发布的时间至现在的经过时间,对上述标签情感表中的权值进行时间因子校正。
另外,在本发明的标签情感倾向量化方法中,上述用户的所属地域信息是用户自己在个人资料中标注的地域,和/或根据用户经常上网的地址获得的地域。上述用户的性格类型通过事先进行的性格测试问卷获得,和/或通过分析用户一段时期的言论特征获得。上述标签的来源是用户自己标注的标签,和/或收集用户言论以及社交行为提取的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210375356.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:装配式环筋扣合锚接混凝土剪力墙结构体系
- 下一篇:二维码识别方法和装置