[发明专利]核心商品词挖掘方法、装置、电子设备及存储介质有效
申请号: | 202010601024.8 | 申请日: | 2020-06-28 |
公开(公告)号: | CN111881674B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 黄志标;裴一飞 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06Q30/0601;G06F16/335 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 谷春静 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 核心 商品 挖掘 方法 装置 电子设备 存储 介质 | ||
本申请公开了核心商品词挖掘方法、装置、电子设备及存储介质,涉及人工智能、电子商务、自然语言处理及互联网领域,其中的方法可包括:对待处理的商品的商品标题进行分词;分别获取分词得到的各词项的权重;从各词项中确定出极核心词;根据极核心词及所述权重确定出候选核心商品词;根据候选核心商品词及商品的预定维度信息确定出核心商品词。应用本申请所述方案,可降低实现成本及提升挖掘出的核心商品词的准确性等。
技术领域
本申请涉及计算机应用技术,特别涉及人工智能、电子商务、自然语言处理及互联网领域的核心商品词挖掘方法、装置、电子设备及存储介质。
背景技术
核心商品词是指卖家销售给买家的具体商品或服务,在电子商务等场景具有广泛应用,如可基于核心商品词进行相似商品推荐等。为此,需要预先挖掘出商品的核心商品词。
目前,在挖掘核心商品词时,通常采用以下方式:将商品标题输入预先训练得到的模型中,根据模型的输出确定出核心商品词。但这种方式中所采用的模型通常复杂度较高,训练时间很长,而且,当行业差异较大时,需要针对不同行业训练不同的模型,实现成本很高。
发明内容
本申请提供了核心商品词挖掘方法、装置、电子设备及存储介质。
一种核心商品词挖掘方法,包括:
对待处理的商品的商品标题进行分词;
分别获取分词得到的各词项的权重;
从各词项中确定出极核心词;
根据所述极核心词及所述权重确定出候选核心商品词;
根据所述候选核心商品词及所述商品的预定维度信息确定出核心商品词。
一种核心商品词挖掘装置,包括:标题分词模块、权重获取模块、候选确定模块以及商品词确定模块;
所述标题分词模块,用于对待处理的商品的商品标题进行分词;
所述权重获取模块,用于分别获取分词得到的各词项的权重;
所述候选确定模块,用于从各词项中确定出极核心词,根据所述极核心词及所述权重确定出候选核心商品词;
所述商品词确定模块,用于根据所述候选核心商品词及所述商品的预定维度信息确定出核心商品词。
一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如以上所述的方法。
一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如以上所述的方法。
一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如以上所述的方法。
上述申请中的一个实施例具有如下优点或有益效果:可通过对商品标题进行分词等确定出候选核心商品词,并可结合商品的预定维度信息,最终确定出核心商品词,相比于现有方式,本申请所述方式无需进行模型的训练等,从而降低了实现成本,而且,除商品标题外,进一步结合了商品的预定维度信息来最终确定出核心商品词,从而提升了挖掘出的核心商品词的准确性等。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010601024.8/2.html,转载请声明来源钻瓜专利网。