[发明专利]根据多个源进行产品合成无效
申请号: | 201180019971.5 | 申请日: | 2011-04-20 |
公开(公告)号: | CN102859548A | 公开(公告)日: | 2013-01-02 |
发明(设计)人: | A.福西曼;H.阮;J.F.d.L.e.斯瓦;S.帕帕里佐斯;R.阿格拉瓦;陈志敏;L.W.科拉吉奥范尼;P.斯克奇 | 申请(专利权)人: | 微软公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李亚非;汪扬 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了将来自多个数据源的产品信息自动合成到在线目录中的方法与系统。特别地,本发明公开了基于属性—值对自动合成产品信息的方法与系统。可以通过实体提取、种子摄入以及其他机制,从具有不同分类法和模式的多个结构化和非结构化的数据源获得产品信息。还可以基于普及度数据,额外或可替代地获得或导出产品信息。可以对产品信息进行清理、分割和标准化。可以对产品信息进行聚集,把最相近的产品、属性名和属性值关联起来。可以确定属性名的代表性值,更新在线目录以使得条目对目录用户来说全面、有意义并且有用。可以安排频繁发生的每天数次根据至少5亿个不同的数据源的更新。 | ||
搜索关键词: | 根据 多个源 进行 产品 合成 | ||
【主权项】:
一种将来自多个数据源的产品信息自动合成到在线目录中的方法,包括:从多个历史数据源获得与所述在线目录中表示的现有产品相对应的历史信息,所述历史信息包括多个历史属性—值对,并且每个历史属性—值对包括历史属性名和对应的历史属性值;确定源—目录属性对应关系包括确定第一历史数据源的第一历史产品模式中包含的第一历史属性名与所述在线目录的目录模式中包含的第一目录属性之间的对应关系,所述目录模式包括多个目录属性—值对,并且每个目录属性—值对包括不同的目录属性名和对应的目录属性值;基于所述源—目录属性对应关系,确定属性—值对的提取,包括:对于所述历史信息中包含的每个历史属性—值对,确定现有目录属性名与至少部分第一历史属性值之间的现有关联;以及在所述目录模式中存储所述现有目录属性名与所述至少部分第一历史属性值之间的所述现有关联,其中,从多个传入和历史数据源获得传入和历史信息包括:从多个传入和历史数据源获得多个不同模式中的非结构化数据和结构化数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201180019971.5/,转载请声明来源钻瓜专利网。
- 上一篇:汽车发动机机油压力监控方法
- 下一篇:中低温煤焦油的组合加工方法