[发明专利]应用语义向量和关键字分析关联数据集的方法和装置无效
申请号: | 200880001312.7 | 申请日: | 2008-07-29 |
公开(公告)号: | CN101802776A | 公开(公告)日: | 2010-08-11 |
发明(设计)人: | 文圆;克里特普瑞特斯·马;杰拉德弗朗斯·荷利三世;安德鲁劳伦斯·法瑞斯;咖贝尔·斯汀伯格 | 申请(专利权)人: | 特克斯特怀茨有限责任公司 |
主分类号: | G06F7/00 | 分类号: | G06F7/00 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于分析专有语义向量和语义表示来识别一个或多个数据集的系统和方法,该数据集,如广告,根据上下文关联到主题数据集,如用户正在浏览的网页;该专有语义向量,如可训练语义向量(TSV),代表网页和广告,该语义表示包括所述广告和所述网页的有代表性关键字的信息。 | ||
搜索关键词: | 应用 语义 向量 关键字 分析 关联 数据 方法 装置 | ||
【主权项】:
一种机器执行方法,用于控制数据处理系统以便将一组数据集的至少一个数据集关联到主题数据集,其中每个数据集或所述主题数据集包括至少一个关键字,该方法包括以下机器执行的步骤:获取代表所述主题数据集的语义向量和代表所述组中每个单独数据集的各个语义向量,其中:代表所述组中的每个单独数据集的每个语义向量包括在所述单独数据集的所述至少一个关键字的每一个与预先确定目录之间的关系的集合信息,所述单独数据集的所述至少一个关键字的每一个都可能关联到所述目录;代表所述主题数据集的所述语义向量包括集合信息,该集合信息具有所述主题数据集的所述至少一个关键字的每一个与预先确定目录之间的关系,所述主题数据集的所述至少一个关键字的每一个都可能关联到的所述目录,以及代表所述主题数据集或所述组中每个单独数据集的所述语义向量具有与预先确定目录的数目相等的维;对于所述组中的每个数据集,通过将与所述主题数据集关联的所述语义向量和与所述组中的每个数据集关联的所述语义向量进行比较,来确定所述主题数据集与所述组中的每个数据集之间的第一相似性;获取所述主题数据集的关键字语义表示和所述组中的每个单独数据集的关键字语义表示,其中:所述主题数据集的关键字语义表示或所述组中的每个单独数据集的关键字语义表示包括指示所述主题数据集或所述组中单独数据集的有代表性关键字的信息,以及所述主题数据集的所述关键字语义表示或所述组中的每个单独数据集的所述关键字语义表示以一种不同于所述主题数据集的所述语义向量或所述组中的每个单独数据集的所述语义向量的方式构成;对于所述组中的每个数据集,通过将所述主题数据集的关键字语义表示和所述组中的每个数据集的关键字语义表示进行比较,来确定所述主题数据集与所述组中的每个数据集之间的第二相似性;以及根据所述主题数据集与所述组中的每个数据集之间的所述第一相似性和所述主题数据集与所述组中的每个数据集之间的所述第二相似性,选择所述组中的所述数据集的至少一个数据集;以及将所述至少一个被选择的数据集关联到所述主题数据集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特克斯特怀茨有限责任公司,未经特克斯特怀茨有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200880001312.7/,转载请声明来源钻瓜专利网。
- 上一篇:举升平衡装置及安装有该举升平衡装置的前顶自卸车
- 下一篇:新式车座