[发明专利]在线文本标签的实时添加方法、装置及相关设备有效
申请号: | 201910871158.9 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110795911B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 唐亚 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/284 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线 文本 标签 实时 添加 方法 装置 相关 设备 | ||
本发明属于人工智能领域,涉及一种在线文本标签的实时添加方法、装置及计算机设备、存储介质,所述方法包括:实时获取文本数据,对所述文本数据进行分词处理得到一组分词;根据预设的词向量生成模型获取每个分词的词向量;将所述每个分词的词向量与预设关键词库中的关键词的词向量进行相似性计算,匹配得到相似性满足预设阈值的关键词和分词;根据匹配得到的关键词和预设的主题映射信息获取与所述匹配得到的关键词相对应的主题;输出匹配得到的分词和获取的主题至用户端界面。本发明提供的方案使得分词能够以语义近邻的方式匹配主题,可优化关键词与主题映射匹配的模式,提高文本标签覆盖率,减少工作量,以及实现关键词库的扩充。
技术领域
本发明实施例属于人工智能技术领域,尤其涉及一种在线文本标签的实时添加方法、装置及计算机设备、存储介质。
背景技术
用户在网络上发布提问、话题、评论、资讯或者其他在线文本时,往往需要在发布后显示与提问、话题、评论、资讯等相关联的关键词和主题,即为在线文本添加文本标签,现有的在线文本添加标签的方式包括用户自定义添加或者后台系统从提问、话题、评论、资讯中提取关键词和通过关键词匹配主题进行添加,后台系统在获取主题的过程主要通过使用预先设定的关键词与主题映射规则来匹配实现,现有的这种实现方式至少存在如下问题:
1、关键词与主题映射规则的规则匹配覆盖率不高;
2、无法自动扩展关键词词典,也无法自动扩展关键词与主题映射规则;
3、需要定期更新迭代关键词与主题及其映射规则,人工工作量大。
发明内容
本发明实施例提供一种在线文本标签的实时添加方法、装置及计算机设备、存储介质,以解决现有技术中对在线文本添加文本标签时关键词与主题映射规则的规则匹配覆盖率不高、无法自动扩展关键词词典、无法自动扩展关键词与主题映射规则,以及需要定期更新迭代关键词与主题及其映射规则,人工工作量大的问题。
第一方面,本发明实施例提供一种在线文本标签的实时添加方法,包括:
实时获取用户端输入的文本数据,对所述文本数据进行分词处理,得到一组分词;
根据预设的词向量生成模型获取每个分词的词向量;
将所述每个分词的词向量与预设关键词库中的关键词的词向量进行相似性计算,匹配得到相似性满足预设阈值的关键词和分词;
根据匹配得到的关键词和预设的主题映射信息获取与所述匹配得到的关键词相对应的主题;
输出匹配得到的分词和获取的主题至用户端界面。
作为本发明可实施的方式,所述方法还包括:
根据所述每个分词的词向量计算所述文本数据的句向量,将所述文本数据的句向量与历史文本数据库中的历史文本数据的句向量进行相似性计算,若匹配得到相似性满足预设阈值的历史文本数据,则获取匹配得到的历史文本数据所对应的主题,并将其作为所述文本数据的主题输出至用户端界面。
作为本发明可实施的方式,所述根据所述每个分词的词向量计算所述文本数据的句向量包括:
将所述文本数据的所有分词的词向量进行加和平均,得到所述文本数据的句向量。
作为本发明可实施的方式,所述根据所述每个分词的词向量计算所述文本数据的句向量包括:
对所述文本数据中的所有分词进行权重分配,根据各分词的权重和词向量进行加权平均,得到所述文本数据的句向量。
作为本发明可实施的方式,在所述实时获取用户端输入的文本数据之前,所述方法包括训练所述预设的词向量生成模型,其中所述预设的词向量生成模型的训练包括:
访问文本数据库,获取所述文本数据库中的所有文本数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910871158.9/2.html,转载请声明来源钻瓜专利网。