[发明专利]酒店数据的匹配系统及方法在审
申请号: | 201410043710.2 | 申请日: | 2014-01-29 |
公开(公告)号: | CN104809141A | 公开(公告)日: | 2015-07-29 |
发明(设计)人: | 张栋艺;蔡新发;曾凡荣 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/22 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;王婧荷 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 酒店 数据 匹配 系统 方法 | ||
技术领域
本发明涉及一种酒店数据的匹配系统及方法,特别是涉及一种对在线旅游网站的酒店数据特别是酒店名称及酒店房型进行分层匹配的酒店数据的匹配系统以及一种利用所述匹配系统实现的酒店数据的匹配方法。
背景技术
现有的在线旅游网站在对酒店数据进行匹配时所采用的相似度算法都是基于“分词+词库+字符”相似度的规则进行匹配,并通过数据库中的近义词、同义词的丰富来提升匹配度,但是,随着数据库中的近义词、同义词词条的增加或更新,会提高某些关键词匹配的相似度,但同时也会影响到其他关键词匹配的相似度。并且,数据库中的词条是全局的,不区分供应商,也不区分具体的业务场景,词条之间存在相互干扰,特别是对于带有包含关系或交叉关系的词条,随着词条数量增多,词条之间的关系会越来越复杂,词条之间的相互干扰会更加严重。
例如,在现有的数据库中,原本设定的规则词条为“高级=行政”,“高级大床房”这一关键词是与“行政大床间”相匹配的,若再添加规则词条“豪华=高级”,则可能导致“高级大床房”与“豪华双床房”相匹配,进而导致原有的最佳匹配结果发生变化并且难以控制预测,造成在添加规则词条时对关键词的匹配带来干扰。
发明内容
本发明要解决的技术问题是为了克服现有技术中酒店数据的关键词的匹配方式比较单一,造成在添加规则词条时,匹配结果会发生变化并且难以控制预测,进而对关键词的匹配带来干扰的缺陷,提供一种对在线旅游网站的酒店数据特别是酒店名称及酒店房型进行分层匹配的酒店数据的匹配系统以及一种利用所述匹配系统实现的酒店数据的匹配方法。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供了一种酒店数据的匹配系统,其特点在于,所述匹配系统具有N个匹配单元,每个匹配单元均预设有一匹配算法,其中N为正整数,且N≥2;
第k个匹配单元按照预设的匹配算法计算一数据库中的每个酒店数据与用户输入的关键词的相似度,并选取相似度的最大取值;
所述匹配系统还包括一判断模块及一输出模块,所述判断模块用于判断所述相似度的最大取值是否大于一第k阈值,若是,则调用所述输出模块输出与所述相似度的最大取值相对应的酒店数据,若否,则将k+1赋值为k;
若k+1=N且所述判断模块判断出第N个匹配单元计算出的相似度的最大取值不大于第N阈值,则从所述N个匹配单元计算出的相似度中选取一最大相似度,并调用所述输出模块输出与所述最大相似度相对应的酒店数据;
其中,第k阈值小于或等于第k+1阈值,k为正整数,且1≤k≤N-1,当所述匹配系统首次接收到用户输入的所述关键词时,k取值为1。
每个匹配单元所预设的匹配算法均为利用现有技术可实现的算法,在此就不再赘述,第k阈值小于或等于第k+1阈值就保证了所述匹配系统的匹配准确率越来越高。
当然,也可以设置为允许第k+1个匹配单元计算出的相似度结果大于或小于第k个匹配单元计算出的相似度结果,即允许各层结果少许浮动,因为最终结果取前k个匹配单元计算出的相似度中选取一最大相似度结果(抗局部震荡),从而保证所述匹配系统具有一定的容错性。
较佳地,若k+1=N且所述判断模块判断出第N个匹配单元计算出的相似度的最大取值不大于第N阈值,还按照从大到小的顺序对所述N个匹配单元计算出的相似度进行排序,并调用所述输出模块输出与前m个相似度相对应的酒店数据,其中m为正整数且m≥2。
较佳地,所述判断模块在判断出所述相似度的最大取值不大于所述第k阈值时,还将所述第k个匹配单元计算出的相似度赋值为0。
本发明的目的在于还提供了一种酒店数据的匹配方法,其特点在于,其利用上述的匹配系统实现,所述匹配方法包括以下步骤:
S1、当所述匹配系统首次接收到用户输入的关键词时,将k赋值为1;
S2、第k个匹配单元按照预设的匹配算法计算一数据库中的每个酒店数据与所述关键词的相似度,并选取相似度的最大取值;
S3、所述判断模块判断所述相似度的最大取值是否大于一第k阈值,若是,则执行步骤S4,若否,则执行步骤S5;
S4、调用所述输出模块输出与所述相似度的最大取值相对应的酒店数据,然后结束流程;
S5、将k+1赋值为k,然后返回步骤S2;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410043710.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种终端
- 下一篇:一种访问网页的方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置