[发明专利]一种基于隐喻主题挖掘的景区评价知识库构建方法有效
申请号: | 201911302244.4 | 申请日: | 2019-12-17 |
公开(公告)号: | CN111078894B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 解吉波;杨腾飞;林振宇;李国庆 | 申请(专利权)人: | 中国科学院遥感与数字地球研究所 |
主分类号: | G06N5/025 | 分类号: | G06N5/025;G06N5/02;G06F16/36;G06F16/35;G06F16/31;G06F40/242;G06Q30/0282;G06Q50/14 |
代理公司: | 北京盛询知识产权代理有限公司 11901 | 代理人: | 张海青 |
地址: | 100094*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 隐喻 主题 挖掘 景区 评价 知识库 构建 方法 | ||
本发明公开一种基于隐喻主题挖掘的景区评价知识库构建方法,包括:S1、采用景区隐性主题挖掘算法构建景区隐性多主题知识库;S2、采用景区隐喻主题特征挖掘算法构建景区的隐喻多主题知识库;S3、基于景区语料库的语义搭配计算模型构建景区评价知识库,并基于景区评价知识库对游客评论数据所属的主题及在该主题下对应的情感倾向进行识别;本发明通过构建的顾及隐喻信息的景区评价知识库,能够较为精确的判断互联网旅游网站中每条评论的细粒度主题及对应主题的情感倾向信息,用于向游客提供数据支撑,辅助游客做出符合自己偏好性的决策,还能够辅助景区管理者提高景区服务,提升景区网络口碑。
技术领域
本发明涉及大数据分析技术领域,特别是涉及一种基于隐喻主题挖掘的景区评价知识库构建方法。
背景技术
随着旅游互联网的蓬勃发展,越来越多的游客会在旅行的过程中使用社交媒体平台记录旅途行程中的游览经历,真实的记录了自己在旅游过程中的所见所闻所感,这些信息多数以文本或图片形式存在于互联网的各旅游网站或者社交平台上,这些信息能够实时的反映出景区在不同主题指标上的变化,能够为游客的旅游路线及偏好提供大数据分析支持,也能够为景区的管理者在提升景区服务方面提供帮助。
目前国内外研究者针对旅游在线评论的研究多集中关注酒店业,对其他研究对象关注较少。有些学者关注了景区评论但分析的粒度较粗,仅从浅层关注了游客的满意度而没有细粒度的针对大量的评论数据逐条分析研究,无法细粒度的反映出景区的每项主题指标随时间的变化,无法及时向旅游管理者提供知识支撑。
从互联网旅游网站的海量评论信息中抽取细粒度的主题情感信息,通常这些信息具有口语性强、语义信息破碎度高等特征且在一个文本中会出现多个主题。基于传统的监督学习的方法需要大量的人工手工标注工作,而基于传统的基于规则的方法,目前的研究中还没有针对旅游领域的语料做出通用的规则,其他领域的规则无法移植到旅游领域。
发明内容
本发明的目的是提供一种基于隐喻主题挖掘的景区评价知识库构建方法,以解决上述现有技术存在的问题,能够对细粒度主题的感情倾向进行快速准确识别。
为实现上述目的,本发明提供了如下方案:本发明提供一种基于隐喻主题挖掘的景区评价知识库构建方法,包括如下步骤:
S1、采用景区隐性主题挖掘算法(Scenic hidden topic mining algorithm,SHTMA)构建景区隐性多主题知识库:根据显性主题词从景区评论语料中挖掘隐性主题词,构建景区隐性多主题知识库;其中,显性主题词与隐性主题词共同构成了基础多主题知识库;
S2、采用景区隐喻主题特征挖掘算法(Scenic metaphor topic feature miningalgorithm,SMTFMA)构建景区的隐喻多主题知识库:所述隐喻多主题知识库由隐喻主题词及隐喻主题特征两部分组成,根据步骤S1中得到的基础多主题知识库,从景区评论语料中挖掘隐喻主题词及隐喻主题特征,构建景区的隐喻多主题知识库;将隐喻主题词与基础多主题知识库进行整合,得到景区多主题知识库,将隐喻主题特征与情感词库整合得到景区情感词知识库;
S3、构建景区评价知识库:基于景区语料库的语义搭配计算模型来计算景区主题词与情感词之间的搭配关系,并对主题词与情感词构成的搭配进行优化,使景区主题词与情感词形成一对多的搭配,以知识树的形式进行存放,构建景区评价知识库;并基于景区评价知识库对游客评论数据所属的主题及在该主题下对应的情感倾向进行识别。
优选地,所述步骤S1景区隐性多主题知识库的构建方法具体包括:
首先构建景区显性多主题知识库,其次采用SHTMA,把基于各主题的显性主题词作为种子词,从景区评论语料中挖掘提取语料中包含的隐性主题词,构建隐性多主题知识库。
优选地,所述SHTMA的具体流程包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院遥感与数字地球研究所,未经中国科学院遥感与数字地球研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911302244.4/2.html,转载请声明来源钻瓜专利网。