[发明专利]一种基于交易平台的结构化信息搜索方法和装置有效
申请号: | 201210065899.6 | 申请日: | 2012-03-13 |
公开(公告)号: | CN103309886B | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 陈旭;陈智强;顾海杰;王德胜;何亮 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 交易平台 结构 信息 搜索 方法 装置 | ||
技术领域
本申请涉及交易平台数据处理的技术领域,特别是涉及一种基于交易平台的结构化信息搜索方法和一种基于交易平台的结构化信息搜索装置。
背景技术
在因特网开放的网络环境下,基于网络通讯技术,买卖双方可不谋面地通过交易平台进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付,以及各种商务活动、交易活动、金融活动和相关的综合服务活动。目前,交易平台一般可分为企业对企业(Business-to-Business,B2B)、企业对消费者(Business-to-Customer,B2C)、消费者对消费者(Customer-to-Customer,C2C)等模式。近几年来,国内交易平台迅速发展,各种B2B、C2C、B2C模式的交易平台(俗称购物网站),如淘宝网、当当网、卓越亚马逊、拍拍网、京东商城等,已被用户认可和接受。
供应商在交易平台发布所供应的产品信息,形成产品信息集合,如果发布的产品信息较多,供应商可以进一步按照一定的规则对产品信息进行分组。还可以设置相应产品的橱窗信息以供买家浏览。
买家在采购产品时,可以在交易平台搜索和筛选满意的供应商以进行交易。采用现有技术,买家可以在预先知道供应商ID的情况下,在搜索栏内基于供应商ID进行搜索,获得对应供应商所经营产品的相关信息。然而在大多数情况下,买家只能使用自定义的查询词在交易平台搜索自己关心或欲购买的产品,再通过产品信息找到对应供应商的信息,获得该供应商所经营产品的相关信息。并且,采用此种方式获得的供应商往往不是最佳的供应商,还需要买家进一步进行人工筛选。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种全新的基于交易平台的结构化信息搜索机制,用以提供买家个性化搜索的功能,使买家能快速、简单地搜索到其所需的最佳供应商。
发明内容
本申请的目的是提供一种基于交易平台的结构化信息搜索方法和装置,用以提供买家个性化搜索的功能,使买家能快速、简单地搜索到其所需的最佳供应商。
为了解决上述问题,本申请公开了一种基于交易平台的结构化信息搜索方法,包括:
接收搜索需求信息;
对所述搜索需求信息进行分词,获得关键词字段;
在预置的结构化信息库中,查找与所述关键词字段匹配的候选结构化信息;
采用所述关键词字段在所述候选结构化信息中计算文本相似度,以及,获取所述候选结构化信息的特征属性参数;
根据所述文本相似度和特征属性参数计算所述候选结构化信息的分值;
根据所述候选结构化信息的分值进行排序。
优选的,所述搜索需求信息包括产品信息关键词,所述产品信息关键词包括:用户提交的产品信息关键词;
或者,用户提交的产品信息关键词和后台生成的产品信息关键词。
优选的,所述分词后获得的关键词字段包括:关键词短语字段和关键词单词字段。
优选的,所述预置的结构化信息库中包括多个结构化信息索引文件,所述在预置的结构化信息库中查找与关键词字段匹配的候选结构化信息的步骤包括:
采用所述关键词短语字段查询结构化信息索引文件,提取最相似的K个结构化信息为候选结构化信息;其中,所述K为预设的数量阈值;
若采用所述关键词短语字段查询结构化信息索引文件返回的结构化信息为L个,且所述L<K,则进一步采用关键词单词字段查询索引文件,提取最相似的K-L个结构化信息,所述L个结构化信息以及K-L个结构化信息组成候选结构化信息。
优选的,所述分词后获得的关键词字段仅包括关键词单词字段,所述预置的结构化信息库包括多个结构化信息索引文件;所述在预置的结构化信息库中查找与关键词字段匹配的候选结构化信息的步骤包括:
采用所述关键词单词字段查询结构化信息索引文件,提取最相似的K个结构化信息为候选结构化信息;其中,所述K为预设的数量阈值。
优选的,所述结构化信息为供应商的产品分组信息,所述供应商的产品分组信息中包括供应商分组的主要关键词,所述采用关键词字段在所述候选结构化信息中计算文本相似度的步骤包括:
计算第一文本相似度,所述第一文本相似度为所述关键词单词字段与候选供应商的产品分组信息中的供应商分组的主要关键词的文本相似度;
计算第二文本相似度,所述第二文本相似度为所述关键词短语字段与相应候选供应商的产品分组信息中的供应商分组的主要关键词的文本相似度;
根据所述第一文本相似度和第二文本相似度生成相应候选供应商的产品分组信息的文本相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210065899.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用户行为采集的验证方法及验证装置
- 下一篇:数据抽稀方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置