[发明专利]用于数字实体相关的技术有效
申请号: | 201680064958.4 | 申请日: | 2016-11-02 |
公开(公告)号: | CN108292310B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | M·雅库特;K·查克拉巴蒂;M·彼什纳 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F40/146 | 分类号: | G06F40/146;G06F40/279;G06F16/36;G06K9/62 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;罗利娜 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 数字 实体 相关 技术 | ||
1.一种用于实体相关的方法,包括:
将与来自第一知识图的第一实体相关联的日期或时间编码成多个日期或时间精度级别,所述多个日期或时间精度级别中的每个日期或时间精度级别指定不同的日期或时间分辨率;
将与来自第二知识图的第二实体相关联的日期或时间编码成所述多个日期或时间精度级别,其中所述第二知识图与所述第一知识图不同;
将与所述第一实体和所述第二实体中的每个实体相关联的所述多个精度级别相关,以生成匹配对;
接收针对信息的数字请求;
利用与所述匹配对相关联的至少一个数字属性值来对所述针对信息的数字请求进行响应,
其中所述相关包括:
计算多个候选对中的每个候选对的相似度度量,每个候选对包括第一知识图候选实体和第二知识图候选实体;以及
基于所计算的相似度度量,从所述多个候选对选择所述至少一个匹配对,并且其中计算每个候选对的所述相似度度量包括:
标识与基元相关联的至少一个扩展对,所述至少一个扩展对直接或间接地耦合到所述候选对;
针对所述至少一个扩展对中的每个扩展对,计算初始相似度度量;以及
将所述相似度度量生成为与所述候选对耦合的所有所述至少一个扩展对的初始相似度度量的加权和,权值包括从相应的扩展对开始、在所述候选对处着陆的概率。
2.根据权利要求1所述的方法,还包括使用多分辨率编码来编码除日期或时间之外的至少一个数字属性值。
3.根据权利要求2所述的方法,所述编码还包括以下至少一个:
生成针对在对应的数字属性值中存在的每个不同的文本或串n-元语法的基元;
生成针对在对应的数字属性值中存在的数字的至少一个较低精度舍入版本中的每一个的基元;
生成针对在对应的数字属性值中存在的URL的每个标准化版本的基元;
生成包括数字属性值与所生成的基元的级联的基元;以及
生成包括身份属性值与所生成的基元的级联的基元;
其中所述相关还包括将与来自所述第一知识图的所述第一实体相关联的所生成的至少一个基元和与来自所述第二知识图的所述第二实体相关联的所生成的至少一个基元相关,以生成匹配对。
4.根据权利要求1所述的方法,所述相关还包括生成至少一个种子对,所述至少一个种子对包括来自所述第一知识图的第一种子实体和来自所述第二知识图的第二种子实体,并且生成耦合到所述至少一个种子对的至少一个扩展对,所述至少一个扩展对包括来自所述第一知识图的第一扩展实体和来自所述第二知识图的第二扩展实体。
5.根据权利要求4所述的方法,所述生成所述至少一个种子对包括:
选择实体类;
计算以下每个词的词得分:该词与具有所选择的实体类的每个实体的数字属性值相关联;
基于所计算的词得分来计算多个候选对的相似度得分,每个候选对包括共享实体类和至少一个词的实体;以及
基于所述相似度得分来选择所述多个候选对中的至少一个候选对作为所述至少一个种子对。
6.根据权利要求1所述的方法,所述相关包括:
计算多个候选对中的每个候选对的相似度度量,每个候选对包括来自所述第一知识图的第一候选实体和来自所述第二知识图的第二候选实体;以及
基于所计算的相似度度量来从所述多个候选对中选择所述至少一个匹配对。
7.根据权利要求6所述的方法,所述计算候选对的所述相似度度量包括:
标识与基元相关联的至少一个扩展对,所述至少一个扩展对直接或间接耦合到所述候选对;
针对所述至少一个扩展对中的每个扩展对,将初始相似度度量计算为每个所述基元的度的倒数在与所述扩展对相关联的所有基元上的总和;以及
将所述相似度度量生成为耦合到所述候选对的所有所述至少一个扩展对的初始相似度度量的加权和,权值包括从相应的扩展对开始、到达所述候选对处的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680064958.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:使用深度学习模型识别内容项
- 下一篇:用于处理元数据的设备和方法