[发明专利]基于条件的多媒体影像评论数据挖掘与处理方法及系统有效
申请号: | 201710071572.2 | 申请日: | 2017-02-09 |
公开(公告)号: | CN106909634B | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 韩斌 | 申请(专利权)人: | 江苏睿泰数字传媒有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/78;G06F16/951;G06F16/9535;G06F16/9536;G06Q50/00 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 郭智 |
地址: | 214000 江苏省无锡*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 条件 多媒体 影像 评论 数据 挖掘 处理 方法 系统 | ||
一种基于条件的多媒体影像评论数据挖掘与处理方法及其系统,其工作原理在于,接收待观影用户输入的影评数据挖掘请求;基于该挖掘请求获取待观影用户的至少一社交网络账号,挖掘与该社交网络账号对应的待观影用户页面数据,对所述待观影用户页面数据进行兴趣属性分析并依次得出第一兴趣属性点;以所述第一兴趣属性点作为预设条件,挖掘并分析出与该预设条件相符量超过预设阈值的在社交网络上公开的针对该影片的影评数据;对所述用户页面数据进行兴趣属性分析并依次得出第二兴趣属性点,判断第二兴趣属性点与所述第一兴趣属性点的对应相符量是否超过预设阈值,若超过则将与所述用户页面数据对应的影评数据列为处理结果发送予请求用户。
技术领域
本发明涉及数据挖掘领域,特别涉及一种基于条件的多媒体影像评论数据挖掘与处理方法及系统。
背景技术
数据挖掘(Data Mining)是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。其特点在于:数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析。
在当前网络信息时代,网络上的信息量日渐增大,例如大数据的出现等等。正是由于数据量的庞大,导致人们在获取信息时,一方面无法获取到全部信息;另一方面获取的信息杂乱无章。
其中,针对观影人群的影像评论数据获取问题,同样出现上述问题。由于观影群体对影像的要求越来越高,观影用户寄于通过相关的影像评论可以大体的了解影像是否符合自己口味。然,如上述,由于影像评论数据信息量庞大以及内容杂乱,导致人们在获取相关信息时,往往耗费大量时间,且得不到满意的信息。
发明内容
发明目的:针对上述情况,为了克服背景技术中的缺点,本发明实施例提供了一种基于条件的多媒体影像评论数据挖掘与处理方法及系统,能够有效解决上述背景技术中涉及的问题。
技术方案: 一种基于条件的多媒体影像评论数据挖掘与处理方法,所述方法包括:
接收待观影用户输入的针对至少一影片的影评数据挖掘请求;
基于该挖掘请求获取待观影用户的至少一社交网络账号,挖掘与该社交网络账号对应的待观影用户页面数据,对所述待观影用户页面数据进行兴趣属性分析并依次得出第一兴趣属性点;
以所述第一兴趣属性点作为预设条件,挖掘并分析出与该预设条件相符量超过预设阈值的在社交网络上公开的针对该影片的影评数据,具体为:利用网络爬虫技术挖掘针对该影片的影评数据,在挖掘到针对该影片的影评数据的同时对发布该影评数据的用户页面数据进行预设量的二次挖掘,对所述用户页面数据进行兴趣属性分析并依次得出第二兴趣属性点,判断第二兴趣属性点与所述第一兴趣属性点的对应相符量是否超过预设阈值,若超过则将与所述用户页面数据对应的针对该影片的影评数据列为处理结果;
将针对该影片的影评数据处理结果推送给待观影用户。
作为本发明的一种优选方式,兴趣属性分析包括:
按照时间顺序依次分析数据,获取数据中易产生兴趣属性点的关键词以及基于该关键词的评价意向,将评价意向为喜爱的关键词列为兴趣属性点。
作为本发明的一种优选方式,兴趣属性分析包括:
按照时间顺序依次分析数据,获取基于社交网络的关注人群数据,将关注人群数据按照行业和/或下位代名词进行集群划分,将划分后的处于同一集群内且始终保持对该集群内关注人群关注度的关注人群数据所对应的行业和/或下位代名词列为兴趣属性点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏睿泰数字传媒有限公司,未经江苏睿泰数字传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710071572.2/2.html,转载请声明来源钻瓜专利网。