[发明专利]用于消费信息提取服务的可扩展表面有效
申请号: | 201210052877.6 | 申请日: | 2012-03-02 |
公开(公告)号: | CN102693269B | 公开(公告)日: | 2018-06-08 |
发明(设计)人: | P·D·德罗塞 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈斌 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多个数据库 提取服务 消费信息 可扩展 语料库 非结构化数据 关系型数据库 信息提取技术 结构化数据 数据库工具 概念查询 允许使用 工作流 查询 应用 | ||
1.一种在计算环境中的按照允许使用关系型数据库概念来查询的方式表示从非结构化数据提取的结构化数据的方法,所述方法包括:
接收指定一个或多个数据库视图(106)的用户输入(302);
接收指定信息提取技术的用户输入(304),所述用户输入中所指定的所述信息提取技术定义如何从非结构化数据中提取结构化数据并且所述信息提取技术包括短语语义提取技术,所述短语语义提取技术基于一个或多个字的语义环境来确定与所述一个或多个字有关的语义关系;
接收指定包括非结构化数据的数据语料库(102)的用户输入(306),其中所述非结构化数据包括在实体层级没有按照语义组织的数据;以及
将所述提取技术应用到所述数据语料库(102)以产生所述一个或多个数据库视图(106)(308)。
2.如权利要求1所述的方法,其特征在于,所述一个或多个视图包括单个查询的一个或多个自组织视图。
3.如权利要求1所述的方法,其特征在于,多个视图被指定为视图的集合。
4.如权利要求1所述的方法,其特征在于,还包括接收与所述提取技术有关的附加选项。
5.如权利要求1所述的方法,其特征在于,还包括对所产生的视图执行一个或多个查询。
6.如权利要求1所述的方法,其特征在于,应用所述提取技术还产生过程。
7.如权利要求6所述的方法,其特征在于,所述过程定义对所述一个或多个视图进行操作的方法。
8.如权利要求1所述的方法,其特征在于,所述提取技术包括属性提升。
9.如权利要求1所述的方法,其特征在于,所述提取技术包括关系标识。
10.如权利要求1所述的方法,其特征在于,所述提取技术包括实体识别或实体提取。
11.如权利要求1所述的方法,其特征在于,所述提取技术包括实体消歧。
12.如权利要求1所述的方法,其特征在于,所述一个或多个视图表示图。
13.如权利要求1所述的方法,其特征在于,所述一个或多个视图表示表格数据。
14.如权利要求1所述的方法,其特征在于,所述提取技术包括模式识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210052877.6/1.html,转载请声明来源钻瓜专利网。