[发明专利]文本的处理方法、装置和存储介质在审
申请号: | 201910178294.X | 申请日: | 2019-03-08 |
公开(公告)号: | CN110033022A | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 赵瑞辉;韦伟;乔倩倩 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/27 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文本的处理方法、装置和存储介质。该方法包括:获取原始文本的多个原始短句和每个原始短句的多个原始词,获取目标文本的多个目标短句和每个目标短句的多个目标词;根据每个原始词的原始词向量和对应的重要性权重确定每个原始短句的原始短句向量,根据每个目标词的目标词向量和对应的重要性权重确定每个目标短句的目标短句向量;根据每个原始短句向量和对应的重要性权重确定的第一目标矩阵和根据每个目标短句向量和对应的重要性权重确定的第二目标矩阵,获取原始文本和目标文本之间的相似度;在相似度大于目标阈值时,确定目标文本与原始文本相匹配,输出目标文本。本发明解决了相关技术对文本进行匹配的准确性低的技术问题。 | ||
搜索关键词: | 短句 向量 权重确定 文本 原始词 存储介质 多个目标 目标矩阵 目标文本 原始文本 目标词 相似度 匹配 获取目标 输出目标 阈值时 | ||
【主权项】:
1.一种文本的处理方法,其特征在于,包括:获取输入的原始文本的多个原始短句和每个所述原始短句的多个原始词,并获取目标文本的多个目标短句和每个所述目标短句的多个目标词,其中,所述目标文本为与所述原始文本待进行匹配的文本;根据每个所述原始词的原始词向量和每个所述原始词在所处的所述原始短句中的重要性权重,确定每个所述原始短句的原始短句向量,得到多个原始短句向量,并根据每个所述目标词的目标词向量和每个所述目标词在所处的所述目标短句中的重要性权重,确定每个所述目标短句的目标短句向量,得到多个目标短句向量;根据每个所述原始短句向量和每个所述原始短句在所述原始文本中的重要性权重,确定第一目标矩阵,并根据每个所述目标短句向量和每个所述目标短句在所述目标文本中的重要性权重,确定第二目标矩阵;根据所述第一目标矩阵和所述第二目标矩阵获取所述原始文本和所述目标文本之间的相似度;在所述相似度大于目标阈值的情况下,确定所述目标文本与所述原始文本相匹配,并输出所述目标文本。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910178294.X/,转载请声明来源钻瓜专利网。