[发明专利]文本数据的处理方法和装置、以及存储介质和电子装置在审
申请号: | 201810444924.9 | 申请日: | 2018-05-10 |
公开(公告)号: | CN110196920A | 公开(公告)日: | 2019-09-03 |
发明(设计)人: | 汤见乐 | 申请(专利权)人: | 腾讯科技(北京)有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06F16/33 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷;江舟 |
地址: | 100080 北京市海淀区海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文本数据的处理方法和装置、以及存储介质和电子装置。其中,该方法包括:抓取多个媒体资源集的每个媒体资源集中目标媒体资源的文本数据,得到多个文本,其中,多个文本与多个媒体资源集一一对应;确定多个文本中任意两个文本之间的文本相似度值;根据每个文本相对于多个文本中其它文本的文本相似度值,确定对应文本的文本准确度值;根据多个文本中文本准确度值符合目标条件的文本,对目标媒体资源集中的目标媒体资源的文本数据进行处理。本发明解决了相关技术中对文本数据进行处理的方法效率较低的技术问题。 | ||
搜索关键词: | 文本 文本数据 媒体资源 目标媒体 方法和装置 文本相似度 存储介质 电子装置 准确度 抓取 目标条件 资源集中 中文 | ||
【主权项】:
1.一种文本数据的处理方法,其特征在于,包括:抓取多个媒体资源集的每个媒体资源集中目标媒体资源的文本数据,得到多个文本,其中,所述多个文本与所述多个媒体资源集一一对应;确定所述多个文本中任意两个文本之间的文本相似度值;根据每个文本相对于所述多个文本中其它文本的文本相似度值,确定对应文本的文本准确度值;根据所述多个文本中文本准确度值符合目标条件的文本,对目标媒体资源集中的所述目标媒体资源的文本数据进行处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(北京)有限公司,未经腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810444924.9/,转载请声明来源钻瓜专利网。