[发明专利]基于空间和社交多媒体数据的室内空间语义价值计算方法有效
申请号: | 201810779775.1 | 申请日: | 2018-07-16 |
公开(公告)号: | CN109063034B | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 陈珂;寿黎但;喻影;陈刚;江大伟;伍赛;胡天磊 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q30/02 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 空间 社交 多媒体 数据 室内空间 语义 价值 计算方法 | ||
1.一种基于空间和社交多媒体数据的室内空间语义价值计算方法,其特点在于:所述方法的步骤如下:首先将室内独立子空间的语义价值划分为区位贡献度和社交贡献度两个子问题,分别计算室内独立子空间的区位贡献度和社交贡献度,然后融合室内独立子空间的区位贡献度和社交贡献度得到室内独立子空间的语义价值;
所述的室内独立子空间的区位贡献度是通过室内独立子空间区位贡献度计算模块具体采用以下方式计算,室内独立子空间区位贡献度计算模块包括SVG地图获取模块、室内空间建模模块和区位计算模块:
步骤1.1、通过SVG地图获取模块采用描摹的方式获取到SVG格式的室内空间室内地图,并将室内地图解析成由各种几何元素构成的集合;
步骤1.2、在室内空间建模模块中,通过生成算法,由各种几何元素构成的集合分析得到各几何元素间的拓扑连接关系,拓扑关系包括多边形元素及其连通门、多边形元素之间的连通关系;
步骤1.3、通过区位计算模块计算获得室内独立子空间的区位贡献度
步骤1.3.1:在各几何元素间的拓扑连接关系的基础上添加上用户行走约束,构建获得带约束的室内空间距离模型;
步骤1.3.2:以两个数据结构D2R和R2D作为混合索引,采用混合索引计算不同多边形元素之间的子路径的距离disi;
步骤1.3.3:计算用户从室内空间外到达室内独立子空间的各个不同行走路径的选择概率pk,行走路径是由不同多边形元素之间的子路径组成而成;
步骤1.3.4:对于每个室内独立子空间,结合不同行走路径的路径长度和选择概率,建立路径矩阵的数据结构:
对于第j楼层的第i家室内独立子空间,建立如下的路径矩阵:
其中:pk代表从室内空间不同的外部出入口行走到室内独立子空间可能选择的第k条行走路径的概率,disk代表从室内空间不同的外部出入口行走到室内独立子空间可能选择的第k条行走路径的路径长度,k=1~n,k表示路径的序数,n表示路径的总数;
步骤1.3.5:利用到达室内独立子空间的所有可能的行走路径的路径矩阵计算室内独立子空间的区位贡献度,具体计算如下公式:
其中,Value(storei)表示第i个室内独立子空间的区位贡献度,value(storejk)表示经过第j个楼层第k个行走路径的区位贡献度;β表示衰减系数的大小,表示随距离衰减的强弱;
所述的室内独立子空间的社交贡献度是通过室内独立子空间社交贡献度计算模块具体采用以下方式计算,室内独立子空间社交贡献度计算模块包括互联网爬虫模块、文本处理模块、情感分析中模块:
2.1、采用互联网爬虫模块获取到互联网下各室内独立子空间的社交媒体数据集;
2.2、社交媒体数据集中包含社交评价文本,接着使用文本处理模块进行社交评价文本的去重和社交评价文本的文本向量化,并使用依存句法分析社交评价文本中的句子结构并进行词性标注;
2.3、采用情感分析模块进行社交贡献度的评估计算
步骤2.3.1:使用词频逆文档频率TF-IDF算法,计算每条社交评价文本中的每个词语的TF-IDF特征值;
步骤2.3.2:从社交评价文本的句子结构中抽取指定关系对,若抽取到指定关系对,则对关键情感词的TF-IDF特征值乘以增强参数b以进行增强;若未抽取指定关系对,则不对关键情感词的TF-IDF特征值作处理;
步骤2.3.3:将社交评价文本d划分为一系列的句子组成:d={s1,s2,…,sm},其中m代表句子数目,si表示第i个句子;
将每个句子si划分为一系列词语组成,采用以下公式计算每个句子的评价值:
其中,f(si)表示第i个句子的属性权重,λ1表示关键词属性权重,λ2表示情感词属性权重,λ3表示标点符号属性权重,λ4表示句子在社交评价文本中的位置属性权重,表示关键词属性的评价值,表示情感词属性的评价值,表示标点符号属性的评价值,表示位置属性的评价值;
最后取社交评价文本中评价值最高的句子作为社交评价文本的情感关键句;
步骤2.3.4:通过所有已标注的社交评价文本样本训练获得情感关键句分类器f1、非情感关键句分类器f2和全文分类器f3,并且采用分类器融合处理方式对针对室内独立子空间对应的未标注的社交评价文本的待测对象进行标注,标注是指对社交评价文本标注上情感倾向,情感倾向分为情感倾向正向和情感倾向负向的两类,具体为:
使用对已标注的社交评价文本中的情感关键句来训练情感关键句分类器f1,用训练后的情感关键句分类器f1对未标注的社交评价文本进行处理,获得社交评价文本在情感倾向上的第一组概率值;
使用对已标注的社交评价文本中除情感关键句以外的其他句子来训练非情感关键句分类器f2,用训练后的非情感关键句分类器f2对未标注的社交评价文本进行处理,获得社交评价文本在情感倾向上的第二组概率值;
使用对已标注的社交评价文本整体来训练全文分类器f3,用训练后的全文分类器f3对未标注的社交评价文本进行处理,获得社交评价文本在情感倾向上的第三组概率值;
最后,在三组概率值中选择情感正向倾向的最大概率值和情感负向倾向的最大概率值,比较两者大小:若情感正向倾向的最大概率值大于等于情感负向倾向的最大概率值,则该条社交评价文本标注为好评;若情感正向倾向的最大概率值小于情感负向倾向的最大概率值,则该条社交评价文本标注为差评;
步骤2.3.5:采用以下公式计算室内独立子空间的社交贡献度S:
N=u+v
p=u/n
其中,S表示室内独立子空间的社交贡献度,u代表所有社交评价文本中好评的总数目,v代表所有社交评价文本中差评的总数目,N代表所有社交评价文本的总数,p表示好评率,zα是正态分布的分位数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810779775.1/1.html,转载请声明来源钻瓜专利网。