[发明专利]关键词及话题标签生成方法、装置、介质及电子设备有效
申请号: | 201910372712.9 | 申请日: | 2019-05-06 |
公开(公告)号: | CN110188158B | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 李菁;史树明;王樾 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F40/126 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美;王鹏健 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 话题 标签 生成 方法 装置 介质 电子设备 | ||
本申请的实施例提供了一种关键词及话题标签生成方法、装置、介质及电子设备。文本数据的关键词生成方法包括:获取需要生成关键词的第一文本数据,并获取与所述第一文本数据相关联的第二文本数据;对所述第一文本数据进行编码处理得到第一特征向量,对所述第二文本数据进行编码处理得到第二特征向量;根据所述第一特征向量和所述第二特征向量,确定所述第一特征向量与所述第二特征向量之间的相关性特征;基于所述第一特征向量、所述第二特征向量和所述相关性特征,生成与所述第一文本数据相关联的关键词。本申请实施例的技术方案可以提高生成的文本数据的关键词的准确性及可扩展性。
技术领域
本申请涉及计算机及通信技术领域,具体而言,涉及一种关键词及话题标签生成方法、装置、介质及电子设备。
背景技术
在生成社交文本中的话题标签时,相关技术中通常是在社交文本中直接抽取关键词作为话题标签,由于通过这种方式抽取出的关键词都是社交文本中存在的词语,因此抽取得到的关键词难免存在局限性,并且也会由于社交文本数据较少而导致抽取出的关键词不准确、不能客观反映社交文本中话题标签的问题。
发明内容
本申请的实施例提供了一种关键词及话题标签生成方法、装置、介质及电子设备,进而至少在一定程度上可以提高生成的文本数据的关键词的准确性及可扩展性。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种文本数据的关键词生成方法,包括:获取需要生成关键词的第一文本数据,并获取与所述第一文本数据相关联的第二文本数据;对所述第一文本数据进行编码处理得到第一特征向量,对所述第二文本数据进行编码处理得到第二特征向量;根据所述第一特征向量和所述第二特征向量,确定所述第一特征向量与所述第二特征向量之间的相关性特征;基于所述第一特征向量、所述第二特征向量和所述相关性特征,生成与所述第一文本数据相关联的关键词。
根据本申请实施例的一个方面,提供了一种话题标签的生成方法,包括:获取内容分享平台中的消息数据,并获取所述消息数据的关联数据,所述关联数据包括所述消息数据的回复信息和/或评论信息;对所述消息数据进行编码处理得到第一特征向量,对所述关联数据进行编码处理得到第二特征向量;根据所述第一特征向量和所述第二特征向量,确定所述第一特征向量与所述第二特征向量之间的相关性特征;基于所述第一特征向量、所述第二特征向量和所述相关性特征,生成所述消息数据的话题标签。
根据本申请实施例的一个方面,提供了一种文本数据的关键词生成装置,包括:获取单元,用于获取需要生成关键词的第一文本数据,并获取与所述第一文本数据相关联的第二文本数据;编码单元,用于对所述第一文本数据进行编码处理得到第一特征向量,对所述第二文本数据进行编码处理得到第二特征向量;第一处理单元,用于根据所述第一特征向量和所述第二特征向量,确定所述第一特征向量与所述第二特征向量之间的相关性特征;第二处理单元,用于基于所述第一特征向量、所述第二特征向量和所述相关性特征,生成与所述第一文本数据相关联的关键词。
在本申请的一些实施例中,基于前述方案,所述编码单元配置为:通过第一编码器对所述第一文本数据的词向量特征进行编码处理得到所述第一特征向量,通过第二编码器对所述第二文本数据的词向量特征进行编码处理得到所述第二特征向量。
在本申请的一些实施例中,基于前述方案,所述第一处理单元包括:第一计算单元,用于根据所述第一特征向量和所述第二特征向量,计算所述第一特征向量所包含的各个第一元素与所述第二特征向量所包含的各个第二元素之间的相似性;第一生成单元,用于根据所述各个第一元素与所述各个第二元素之间的相似性,生成通过所述第二特征向量表征所述第一特征向量的第一内容向量,并生成通过所述第一特征向量表征所述第二特征向量的第二内容向量;第一确定单元,用于基于所述第一内容向量和所述第二内容向量,确定所述第一特征向量与所述第二特征向量之间的相关性特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910372712.9/2.html,转载请声明来源钻瓜专利网。