[发明专利]信息输出方法和装置在审

专利信息
申请号: 201810018641.8 申请日: 2018-01-09
公开(公告)号: CN110110199A 公开(公告)日: 2019-08-09
发明(设计)人: 安旭;安伟佳;汪雷;李雪 申请(专利权)人: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06Q30/06
代理公司: 北京英赛嘉华知识产权代理有限责任公司 11204 代理人: 王达佐;马晓亚
地址: 100080 北京市海淀区杏石口路6*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 候选物品 向量 词向量 候选句 加权 目标物品 方法和装置 信息对应 信息集合 信息输出 词转换 匹配度 查询请求 顺序选取 物品信息 成功率 匹配 输出 响应 申请
【说明书】:

本申请公开了信息输出方法和装置。该方法的一具体实施方式包括:响应于接收到包括目标物品信息的查询请求,获取候选物品信息集合;将目标物品信息中的每个词转换成词向量,并将目标物品信息对应的各个词向量组成目标句向量;根据词的类别对于候选物品信息集合中的每个候选物品信息,将该候选物品信息中的每个词转换成词向量,并将该候选物品信息对应的各个词向量组成该候选物品信息的候选句向量;确定加权后的目标句向量与加权后的各候选物品信息的候选句向量之间的匹配度;按照匹配度由大到小的顺序选取预定数目个加权后的候选句向量,并输出所选取的加权后的候选句向量对应的候选物品信息。该实施方式提高了物品信息匹配的成功率。

技术领域

本申请实施例涉及计算机技术领域,具体涉及深度学习技术领域,尤其信息输出方法和装置。

背景技术

对于某一网站上展现的某一物品,如何在其它网站上找到相同的物品,现有的方法是通过型号,名称进行匹配。不同的网站对于同一物品的型号可能还能相同,名称有时候不能完全匹配。

通常通过词向量模型求得标题的句向量,然后计算句向量的余弦相似度来确定不同网站上展示的物品之间的相似度。最后按照相似度排名推荐出前几名即可。

发明内容

本申请实施例提出了信息输出方法和装置。

第一方面,本申请实施例提供了一种信息输出方法,包括:响应于接收到包括目标物品信息的查询请求,获取候选物品信息集合;将目标物品信息中的每个词转换成词向量,并将目标物品信息对应的各个词向量组成目标句向量;对于候选物品信息集合中的每个候选物品信息,将该候选物品信息中的每个词转换成词向量,并将该候选物品信息对应的各个词向量组成该候选物品信息的候选句向量;确定所述目标物品信息和各候选物品信息中的每个词的类别,并获取各类别对应的权重;根据词的类别对目标句向量和各候选物品信息的候选句向量进行加权,并确定加权后的目标句向量与加权后的各候选物品信息的候选句向量之间的匹配度;按照匹配度由大到小的顺序选取预定数目个加权后的候选句向量,并输出所选取的加权后的候选句向量对应的候选物品信息。

在一些实施例中,根据词的类别对目标句向量和各候选物品信息的候选句向量进行加权,包括:根据目标物品信息中的每个词的类别对应的权重分别对目标句向量中的每个词向量进行加权,并生成加权后的目标句向量;对于每个候选物品信息,根据该候选物品信息中的每个词的权重分别对该候选句向量中的每个词向量进行加权,并生成该候选物品信息的加权后的候选句向量。

在一些实施例中,确定所述目标物品信息和各候选物品信息中的每个词的类别,并获取各类别对应的权重,包括:将所述目标物品信息中的每个词和各候选物品信息中的每个词与预设的类别词集合进行匹配以确定出每个词的类别;对于每个类别,获取所述目标物品信息和各候选物品信息中该类别词的词频-逆文本频率作为该类别的权重。

在一些实施例中,确定所述目标物品信息和各候选物品信息中的每个词的类别,并获取各类别对应的权重,包括:将目标物品信息中的每个词和各候选物品信息中的每个词与预设的特征词集合进行匹配以确定出匹配的至少一个特征词;对于至少一个特征词中每个特征词,确定该特征词所属的类别,并根据该特征词所属的类别查找预设的权重表中的权重作为该特征词的权重,其中,权重表用于表征类别与权重之间的对应关系;对于目标物品信息中与特征词集合不匹配的每个词和各候选物品信息中与特征词集合不匹配的每个词,获取该词的词频-逆文本频率作为该词的权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810018641.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top