[发明专利]产品词处理方法及其装置、设备、介质、产品在审
申请号: | 202210398108.5 | 申请日: | 2022-04-13 |
公开(公告)号: | CN114662492A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 黄丕帅 | 申请(专利权)人: | 广州欢聚时代信息科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/237;G06F40/30;G06Q30/06;G06F16/33 |
代理公司: | 广州利能知识产权代理事务所(普通合伙) 44673 | 代理人: | 王增鑫 |
地址: | 511442 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 产品 处理 方法 及其 装置 设备 介质 | ||
1.一种产品词处理方法,其特征在于,包括如下步骤:
将商品标题进行分词处理,获得有序的多个分词,构成分词序列;
计算各个分词的语义特征向量与所述商品标题的语义特征向量之间的数据距离,相应作为各个分词的相似分值;
根据命中预设产品词典中的词元的分词在所述分词序列中的排序信息,量化确定其排序分值;
将综合分值最高的分词输出为所述商品标题的产品词,所述综合分值为其相应的分词的相似分值与排序分值之和。
2.根据权利要求1所述的产品词处理方法,其特征在于,将商品标题进行分词处理,获得多个分词,构成分词序列,包括如下步骤:
获取用户提交的商品标题;
采用预设的分词算法对该商品标题进行分词,获得多个分词;
按照所述多个分词在所述商品标题中的顺序,将所述多个分词构造为分词序列,通过所述分词在所述分词序列中的排序值表征其排序信息。
3.根据权利要求1所述的产品词处理方法,其特征在于,计算各个分词的语义特征向量与所述商品标题的语义特征向量之间的数据距离,相应作为各个分词的相似分值,包括如下步骤:
分别对所述各个分词及所述商品标题进行词嵌入,获得各个分词及所述商品标题相应的嵌入向量;
采用已训练至收敛状态的文本特征提取模型分别对所述各个分词及所述商品标题相应的嵌入向量进行表示学习,获得相应的语义特征向量;
计算每个分词的语义特征向量与所述商品标题的语义特征向量之间的数据距离,将该数据距离作为该分词的相似分值。
4.根据权利要求1所述的产品词处理方法,其特征在于,根据命中预设产品词典中的词元的分词在所述分词序列中的排序信息,量化确定其排序分值,包括如下步骤:
根据所述商品标题的语义特征向量确定该商品标题相对应的商品分类;
针对每个分词,检测其是否包含对应该商品分类预设的产品词典中的至少一个词元,当包含该词元时,确定该分词为命中该产品词典中的词元的可选分词;
确定所述可选分词在所述分词序列中的排序值,将该排序值关联预设权重设置为该可选分词相对应的排序分值。
5.根据权利要求1所述的产品词处理方法,其特征在于,将综合分值最高的分词输出为所述商品标题的产品词,包括如下步骤:
计算每个命中所述产品词典的词元的分词的相似分值和排序分值的和值,获得该分词的综合分值;
根据所述综合分值对命中所述产品词典的各个分词进行倒排序,确定其中首个分词为所述商品标题的产品词;
输出所述的产品词。
6.根据权利要求1至5中任意一项所述的产品词处理方法,其特征在于,根据命中预设产品词典中的词元的分词在所述分词序列中的排序信息的步骤之前,包括如下步骤:
从对应各个商品分类预采集的产品词中抽取出多个词元,将其存储构造相应的商品分类的产品词典。
7.根据权利要求1至5中任意一项所述的产品词处理方法,其特征在于,将综合分值最高的分词输出为所述商品标题的产品词的步骤之后,还包括如下步骤:
根据所述商品标题的产品词,从商品数据库中检索产品词与之相一致或语义相似的目标商品;
将所述目标商品的商品信息推送至提交所述商品标题的终端设备。
8.一种产品词处理装置,其特征在于,包括:
分词处理模块,用于将商品标题进行分词处理,获得有序的多个分词,构成分词序列;
相似分值模块,用于计算各个分词的语义特征向量与所述商品标题的语义特征向量之间的数据距离,相应作为各个分词的相似分值;
排序分值模块,用于根据命中预设产品词典中的词元的分词在所述分词序列中的排序信息,量化确定其排序分值;
用词确定模块,用于将综合分值最高的分词输出为所述商品标题的产品词,所述综合分值为其相应的分词的相似分值与排序分值之和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州欢聚时代信息科技有限公司,未经广州欢聚时代信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210398108.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动换板曝光机
- 下一篇:一种用于电池串联充放电设备的电池电压采样方法