[发明专利]基于深度学习的旅游景点评论情感分析方法在审
申请号: | 202110884900.7 | 申请日: | 2021-08-03 |
公开(公告)号: | CN113591487A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 蒋金亮 | 申请(专利权)人: | 江苏省城市规划设计研究院有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F40/211;G06F16/33;G06K9/62;G06Q50/14 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 210036 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 旅游景点 评论 情感 分析 方法 | ||
本发明提出了一种基于深度学习的旅游景点评论情感分析方法,结合旅游景点作为研究对象,从游客对旅游景点的文本评论中,识别出旅游景点现状的问题和痛点。本发明利用网络公开的景点评论数据,结合文本语言的分句、分词方法,对文本语句进行语义切割,建立分析的词汇库,判断语句的情感指向,进而提取分词列表的词汇,分析情感正负面,对词汇进行基本聚类,再通过共词矩阵对分类进行补充和完善,最后形成旅游目的地认知的反馈结果。本发明利用共词矩阵对聚类结果进行矫正和重定向,降低学习成本,聚类过程中只需要认定词性无需自制训练集,无监督环境下的聚类结果高度聚合,提高了文本聚类分析的效率和精准度。
技术领域
本发明涉及旅游景点评价及文本情感分析技术领域,提出了一种基于深度学习的旅游景点评论情感分析方法。
背景技术
提升景区环境和管理是旅游景区稳定客源、保持竞争优势的重要手段。游客满意度对于景区环境和管理提升紧密相关,因此掌握旅游景区游客满意度的具体影响因素,提高游客满意度,对于保证稳定客源、科学管理景区一级持续开拓市场具有重要作用。游客游览景区后发表的评论文字最为直接反映游客对于旅游目的地的游览感受和认知,与传统的问卷调查相比,网络空间更为开放和共享,旅游者游览后对旅游目的地的网络评价信息最为真实客观反映旅游景区的市场形象。
目前,利用采用网络文本探究旅游景区的市场形象逐渐被应用,但是大多以词频分析为主,分析手段较为单一,现有文本评论方法深度学习成本高,训练集量需求大,聚类时间过长且结果不够精准,随着机器学习方法的进步,在方法上可以借助新型的计算方法进行情感分析和聚类研究,分析游客对景区的旅游形象感知。
发明内容
本发明所要解决的技术问题是:为了克服现有方法的不足,进行研究方法上的创新,通过梳理所有旅游景点评论数据作为数据本底,而提出一种基于深度学习的旅游景点评论情感分析方法。
本发明为解决以上技术问题,采用以下技术手段:
本发明提出一种基于深度学习的旅游景点评论情感分析方法,包括:
步骤1、整理旅游景点评论数据,并对评论数据进行清洗;
步骤2、结合文本语言的分句、分词方法,对文本语句进行语义切割,建立用于分析的词汇库;
步骤3、判断语句的情感指向,进而提取分词列表的词汇,分析情感正负面,获取情感指向词汇;
步骤4、对情感指向词汇进行基本聚类,再通过共词矩阵对分类进行补充和完善,最后形成旅游目的地认知的反馈结果。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,步骤1中整理旅游景点评论数据,是将原始景点评论文本数据整理成结构化数据,包括景点名称、评论内容、评论时间、评论者昵称信息。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,步骤1对旅游景点评论数据进行清洗。具体如下:
(101)、通过程序语言对评论数据进行去重处理;
(102)、对原始数据进行观察判断,采用广告文本作为训练集,将景区评论信息作为验证集进行朴素贝叶斯分类,剔除掉广告类型文本。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,朴素贝叶斯分类的训练过程,是基于训练集来估计类鲜艳概率,并为每个属性估计条件概率;
朴素贝叶斯分类器具体公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省城市规划设计研究院有限公司,未经江苏省城市规划设计研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110884900.7/2.html,转载请声明来源钻瓜专利网。