[发明专利]基于语义分析的旅游行程生成方法、电子设备及存储介质有效
申请号: | 201711482674.X | 申请日: | 2017-12-29 |
公开(公告)号: | CN108268613B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 黄鸿;李悦;马春红;刘爽 | 申请(专利权)人: | 广州都市圈网络科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/387;G06F40/279;G06F40/30;G06Q50/14 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 邵穗娟;汤喜友 |
地址: | 511400 广东省广州市番禺大道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 分析 旅游 行程 生成 方法 电子设备 存储 介质 | ||
1.基于语义分析的旅游行程生成方法,其特征在于包括以下步骤:
获取游记文本,获取用于生成旅游行程的游记文本;
游记文本处理,遍历所述游记文本,获取所述游记文本的基本信息,在所述基本信息对应位置处对所述游记文本进行分段,获得若干分段结果,每一种所述分段结果包括若干分段文本,将所有所述分段文本生成分段结果矩阵,所述基本信息包括目的地;
提取兴趣点记录,筛选旅游专题资源数据库中所述目的地对应的若干兴趣点,生成兴趣点集合,将所述兴趣点集合中的元素与所述分段结果矩阵中的元素进行匹配,获得每种分段结果每天访问的兴趣点记录,将所有所述兴趣点记录生成访问记录矩阵;
生成旅游行程,将所述访问记录矩阵中的若干分段结果按照时间顺序进行对照,对若干所述分段结果中每天访问的兴趣点记录进行分析,通过兴趣点之间的空间距离,计算所述兴趣点记录的偏移量,将各兴趣点记录的偏移量与预设的偏离阈值进行对比,若偏移量大于偏离阈值,则清除所对应的兴趣点记录根据所述偏移量清除偏离当天行程的兴趣点记录,再将所述分段结果和兴趣点记录进行整合,生成旅游行程;
其中,在提取兴趣点记录的过程中还包括以下步骤:
清理所述访问记录矩阵中每种分段结果最后一天访问的兴趣点记录;
比对分段结果矩阵中相邻的分段结果,删除相邻的分段结果中重复的兴趣点访问记录。
2.如权利要求1所述的基于语义分析的旅游行程生成方法,其特征在于:所述步骤游记文本处理还包括分析所述游记文本的来源,对所述游记文本进行过滤,生成纯文本游记,根据所述基本信息对所述纯文本游记进行分段,获得若干分段结果,将若干所述分段结果生成分段结果矩阵。
3.如权利要求2所述的基于语义分析的旅游行程生成方法,其特征在于:所述基本信息还包括旅行开始时间、旅行结束时间、作者、旅行目的、同行人员、组织方式,所述步骤获取基本信息包括遍历所述纯文本游记,获取所述纯文本游记的旅行开始时间、旅行结束时间、作者、旅行目的、同行人员、组织方式。
4.如权利要求2所述的基于语义分析的旅游行程生成方法,其特征在于:所述步骤游记文本处理还包括获取具有时间属性的标志词,遍历所述纯文本游记,在所述具有时间属性的标志词对应位置处对所述纯文本游记进行切割,生成若干所述分段文本。
5.如权利要求1所述的基于语义分析的旅游行程生成方法,其特征在于:所述步骤生成旅游行程还包括根据所述分段结果中同一天访问的相邻兴趣点之间的关联系数计算所述相邻兴趣点之间的偏离系数,若所述偏离系数达到偏离阈值,则清除偏离的兴趣点记录。
6.如权利要求1所述的基于语义分析的旅游行程生成方法,其特征在于:还包括步骤审核旅游行程,审核所述旅游行程的内容和顺序,若所述旅游行程的内容缺失或顺序混乱,则对所述旅游行程的内容或顺序进行调整生成修正旅游行程。
7.一种电子设备,其特征在于包括:处理器;
存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行权利要求1-6任意一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行如权利要求1-6任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州都市圈网络科技有限公司,未经广州都市圈网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711482674.X/1.html,转载请声明来源钻瓜专利网。