[发明专利]一种基于大数据的文旅舆论热度分析方法及系统在审
申请号: | 202211338310.5 | 申请日: | 2022-10-28 |
公开(公告)号: | CN115757939A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 李韩 | 申请(专利权)人: | 江苏艾易欧建设科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06Q50/00 |
代理公司: | 江苏长德知识产权代理有限公司 32478 | 代理人: | 刘威威 |
地址: | 223000 江苏省淮安市淮安*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 舆论 热度 分析 方法 系统 | ||
1.一种基于大数据的文旅舆论热度分析方法,其特征在于,包括如下步骤:
步骤一:利用文旅关键词通过网络索引文旅舆论数据和文旅舆论信息,文旅舆论数据包括话题评论量、话题转发量、话题浏览量、话题点赞量、话题发布时间,文旅舆论信息包括话题评论内容、话题评论ip地址;
步骤二:对文旅舆论数据进行分析操作,得到舆论数据;
步骤三:通过舆论数据获取话题持续时间,并利用公式获取文旅舆论的关注度,其中,GZi表示为文旅舆论的关注度,话题评论量为PLi、话题转发量为ZFi、话题浏览量为LLi、话题点赞量为DZi,a1、b1、c1和d1为预设的比例系数且不为零,η表示为修正因子,取值为0.3681;
步骤四:对文旅舆论信息中的话题评论内容进行去噪处理,去掉话题评论内容中的广告推广、链接信息、表情图片和相关推荐,获得多个纯净的评论文本信息;
步骤五:对多个评论文本信息通过情感关键词进行情感分类识别,获得评论类型数据,其中评论类型数据包括正面导向评论、负面导向评论和中立导向评论;
步骤六:利用公式获得文旅舆论热度,其中RDi为文旅舆论热度,正面导向评论数量为ZMLi、负面导向评论数量为FMLi和中立导向评论数量为ZLLi,b1和b2为预设的比例系数且不为零,α为修正因子,取值为0.8775。
2.一种基于大数据的文旅舆论热度分析系统,其特征在于,包括舆论采集模块、舆论分析模块、舆论处理模块、舆论预处理模块、处理器和推广模块;舆论采集模块通过文旅关键词索引网络上的文旅舆论数据以及文旅舆论信息,将文旅舆论数据发送至舆论分析模块,同时将文旅舆论信息发送至舆论预处理模块和推广模块;舆论分析模块用于对文旅舆论数据进行分析操作,得到舆论数据;舆论处理模块用于对舆论数据进行处理操作,得到文旅舆论的关注度;舆论预处理模块包括舆论去噪单元和情感分析单元,舆论预处理模块用于对文旅舆论信息中的话题评论内容进行预处理,获得评论类型数据,处理器用于对接收的评论类型数据以及文旅舆论的关注度进行计算操作,得到文旅舆论热度。
3.根据权利要求2所述的一种基于大数据的文旅舆论热度分析系统,其特征在于,文旅舆论数据包括话题评论量、话题转发量、话题浏览量、话题点赞量、话题发布时间,文旅舆论信息包括话题评论内容、话题评论ip地址。
4.根据权利要求3所述的一种基于大数据的文旅舆论热度分析系统,其特征在于,舆论处理模块的具体处理步骤包括;
步骤B1:获取舆论数据中的话题持续时间,利用话题发布时间t1与采集文旅舆论数据时间t2的时间差为话题持续时间并将话题持续时间标记为T;
步骤B2:获取话题评论量PLi、话题转发量ZFi、话题浏览量LLi、话题点赞量DZi和话题持续时间T,利用获取关注度,其中,GZi表示为文旅舆论的关注度,a1、b1、c1和d1为预设的比例系数且不为零,η表示为修正因子,取值为0.3681。
5.根据权利要求4所述的一种基于大数据的文旅舆论热度分析系统,其特征在于,舆论去噪单元用于对文旅舆论信息中的话题评论内容进行去噪处理,用于去掉话题评论内容中的广告推广、链接信息、表情图片和相关推荐,获得多个纯净的评论文本信息并发送至情感分析单元。
6.根据权利要求5所述的一种基于大数据的文旅舆论热度分析系统,其特征在于,情感分析单元对多个评论文本信息通过情感关键词进行情感分类识别,获得评论类型数据,其中评论类型数据包括正面导向评论、负面导向评论和中立导向评论。
7.根据权利要求6所述的一种基于大数据的文旅舆论热度分析系统,其特征在于,其中处理器进行计算操作的具体步骤包括:
步骤C1:分别将正面导向评论、负面导向评论和中立导向评论的数量设定为ZMLi、FMLi和ZLLi,i=1,2,3......n;
步骤C2:获取正面导向评论数量ZMLi、负面导向评论数量FMLi、中立导向评论数量ZLLi和关注度GZi,利用公式获得文旅舆论热度,其中RDi为文旅舆论热度,b1和b2为预设的比例系数且不为零,α为修正因子,取值为0.8775。
8.根据权利要求7所述的一种基于大数据的文旅舆论热度分析系统,其特征在于,推广模块根据文旅关键词获取文旅地的所在地位置信息,即文旅地所在省,根据文旅地所在省对话题评论ip地址进行分类并获取省内评论数量和全国评论数量,并获取省内评论数量和全国评论数量的比值,将该比值设定为V,将比值V与预设的比值范围进行对比,确定文旅舆论的推广范围;
其中将比值V与预设的比值范围进行对比的具体步骤包括:
当V>V2时,代表省内评论数量占比较高,加大省内广告舆论的推广力度;
当V1<V≤V2时,维持当前推广力度;
当V≤V1时,代表全国评论数量占比较高,加大省外的广告推广力度;其中V1和V2分别为比值范围的最小值和最大值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏艾易欧建设科技有限公司,未经江苏艾易欧建设科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211338310.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置