[发明专利]一种基于数据分析的智能路况信息检索方法有效
申请号: | 201610597217.4 | 申请日: | 2016-07-26 |
公开(公告)号: | CN107704461B | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 胡文鹏;郑楠;戴汝为 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 分析 智能 路况 信息 检索 方法 | ||
1.一种基于数据分析的智能路况信息检索方法,其特征在于,所述方法包括如下的步骤:
步骤S1:输入检索信息;
步骤S2:若输入检索信息中各关键词之间以空格隔开则为多关键词路况信息检索,执行步骤S4;否则为地名信息检索,执行步骤S3;
步骤S3:采用智能垂直地名信息模糊检索方法进行地名信息的检索,若检索信息中包含路名,则用该路名信息针对不同查询内容返回不同路况信息;否则将检索信息拆分为多个关键词后执行步骤S4;
步骤S4:采用智能垂直信息关键词组合检索方法,通过检索信息的每个关键词具有最大匹配率的路况信息特征,得到查询结果并进行路况信息的展示;
步骤S3中采用智能垂直地名信息模糊检索方法进行地名信息的检索的方法包括以下步骤:
步骤S31:获取检索信息;
步骤S32:使用斯坦福大学分词系统对检索信息进行分词和词性标注,并且提取名词及名词短语作为候选词;
步骤S33:将步骤S32中提取的候选词与标准路名词库进行模糊匹配,选取各候选词最优的匹配率;
步骤S34:利用设定的语法规则库中的语法规则,对步骤S32的分词结果进行拆分或者合并,生成新的候选词,并将新的候选词与标准路名词库进行模糊匹配,选取各候选词最优的匹配率;
步骤S35:对步骤S33和步骤S34得到的各匹配率进行排序,对不同拆分状态下的所有候选词进行加权平均处理,得到各拆分状态的匹配率,并选取匹配率最高的拆分状态对应的匹配结果;
步骤S36:若所选取的最高的匹配率大于设定阈值,则判断为检索信息中包含路名,该匹配率下的拆分状态对应的匹配结果作为准确的路名匹配结果;否则判断为检索信息中不包含路名。
2.如权利要求1所述的方法,其特征在于,步骤S4中采用智能垂直信息关键词组合检索的方法包括如下的步骤:
步骤S41:获取以空格隔开的关键词作为候选词;
步骤S42:确定输入的每个关键词具有最大匹配率的路况信息特征;所述路况信息特征分为信息来源、信息类型、创建时间、分区方向;
步骤S43:通过加权平均方法得到该条查询的查询结果;
步骤S44:将超过设定阈值的查询结果展示给查询用户。
3.如权利要求1所述的方法,其特征在于,步骤S33中进行模糊匹配并选取各候选词最优的匹配率的方法包括如下步骤:
步骤S331:遍历候选词和标准路名词库;
步骤S332:计算匹配率,公式如下:
其中,C为候选词,D为标准路名词库中的词典词,count(Ain B)表示A的每个字符出现在B中的总的次数;Num(A)表示A的字符数;
步骤AS333:对步骤S332中计算的每个候选词的匹配率使用快速排序法排序,选取匹配率最大的作为最优匹配率。
4.如权利要求1所述的方法,其特征在于,步骤S34所述语法规则为名词结构的合并和拆分,具体规则为:
“识别地名,识别地名”重新生成为“识别地名,识别地名”;
“识别地名,方向词,识别地名”重新生成为“识别地名,识别地名”;
“简称略语,名词”重新生成为“识别地名”;
“其他专名,名词,方向词”重新生成为“识别地名,方向词”;
“识别地名”拆分为“名词,方向词”。
5.如权利要求3所述的方法,其特征在于,步骤S35所述加权平均处理的方法为:
采用等权重平均方法计算总排序分数,基本公式如下所示:
其中n为一个拆分状态下的所有候选词的个数,S为检索信息。
6.如权利要求2所述的方法,其特征在于,步骤S42中确定输入的每个关键词具有最大匹配率的路况信息特征的方法为:
步骤S421:采用步骤S332的方法计算匹配率,其中各关键词为候选词;
步骤S422:选取匹配率最大的路况信息特征作为该关键词指示的信息特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610597217.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置