[发明专利]标签同义词的扩充方法、扩充装置、电子设备及存储介质有效
申请号: | 202010553900.4 | 申请日: | 2020-06-17 |
公开(公告)号: | CN111708900B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 石慧江;于政;王道广;袁灿 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/247 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 裴素英 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 同义词 扩充 方法 装置 电子设备 存储 介质 | ||
1.一种标签同义词的扩充方法,其特征在于,所述扩充方法包括:
获取一段目标文本以及针对所述目标文本的预设标签;
从所述目标文本中,确定出多种字符串长度,以及在每种字符串长度下的多个文本标签,确定每个所述文本标签与所述预设标签之间的相似度;其中,通过以下步骤确定每种字符串长度下的多个文本标签:确定所述目标文本的至少一个起始点;以每个字符串长度为滑动步长,分别从每个起始点开始对所述目标文本进行滑动取值,得到在每个字符串长度下的多个文本标签;目标文本的起始点的数量与目标文本的字符总数相同,起始点为任意一个字符前的位置;每改变一次起始点,对目标文本重新进行一次滑动取值;
从确定出的多个文本标签中确定相似度最大的文本标签为预设标签同义词。
2.根据权利要求1所述的扩充方法,其特征在于,通过以下步骤确定出多种字符串长度:
获取所述目标文本的字符串总长度值;
确定所述目标文本的字符串长度区间阵列,其中,将一个字符长度值作为所述字符串长度区间阵列的起点,所述字符串总长度值作为所述字符串长度区间阵列的终点;
以单个字符长度值为划分步长,在所述字符串长度区间阵列内对字符串长度进行划分取值,确定多种字符串长度。
3.根据权利要求1所述的扩充方法,其特征在于,通过以下步骤确定出多种字符串长度:
获取所述预设标签的长度值和预设变量值;
在所述预设标签的长度值的基础上,增加和减少所述预设变量值,得到字符串长度值区间阵列的最大值和最小值;
以单个字符长度值为划分步长,在所述字符串长度值区间阵列内对字符串长度进行划分取值,确定多种字符串长度。
4.根据权利要求1所述的扩充方法,其特征在于,通过以下步骤确定每个所述文本标签与所述预设标签之间的相似度:
计算每个所述文本标签与所述预设标签之间的语义相似度;
从所有所述语义相似度中确定出相似度最大的语义相似度。
5.一种标签同义词的扩充装置,其特征在于,所述扩充装置包括:
获取模块,用于获取一段目标文本以及针对所述目标文本的预设标签;
确定模块,用于从所述目标文本中,确定出多种字符串长度,以及在每种字符串长度下的多个文本标签,确定每个所述文本标签与所述预设标签之间的相似度;其中,确定模块用于通过以下步骤确定每种字符串长度下的多个文本标签:确定所述目标文本的至少一个起始点;以每个字符串长度为滑动步长,分别从每个起始点开始对所述目标文本进行滑动取值,得到在每个字符串长度下的多个文本标签;目标文本的起始点的数量与目标文本的字符总数相同,起始点为任意一个字符前的位置;每改变一次起始点,对目标文本重新进行一次滑动取值;
同义词确定模块,用于从确定出的多个文本标签中确定相似度最大的文本标签为预设标签同义词。
6.根据权利要求5所述的扩充装置,其特征在于,所述确定模块用于通过以下步骤确定出多种字符串长度:
获取所述目标文本的字符串总长度值;
确定所述目标文本的字符串长度区间阵列,其中,将一个字符长度值作为所述字符串长度区间阵列的起点,所述字符串总长度值作为所述字符串长度区间阵列的终点;
以单个字符长度值为划分步长,在所述字符串长度区间阵列内对字符串长度进行划分取值,确定多种字符串长度。
7.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至4中任一所述的标签同义词的扩充方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至4中任一所述的标签同义词的扩充方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010553900.4/1.html,转载请声明来源钻瓜专利网。