[发明专利]使用非结构化输入更新异构数据存储在审
申请号: | 201980060334.9 | 申请日: | 2019-09-05 |
公开(公告)号: | CN112703502A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | M·麦克哈德;J·鲍尔;T·A·小库克;S·哈利纳斯;R·拉拉尼;Z·拉瑞科;Q·刘;M·罗森鲍姆;K·R·斯库查;J-M·苏梅特;M·维贾亚库马 | 申请(专利权)人: | 易享信息技术有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F16/35 |
代理公司: | 北京市联德律师事务所 11361 | 代理人: | 黄大正;张来光 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 结构 输入 新异 数据 存储 | ||
1.一种用于自然语言处理的方法,所述方法包括:
由服务器的一个或多个处理器接收非结构化文本输入;
由所述一个或多个处理器接收用于解释所述非结构化文本输入的模板;
使用实体分类器,识别所述非结构化文本输入中的实体;
由所述一个或多个处理器,基于所述模板,从识别的实体中识别一个或多个潜在的父实体;
由所述一个或多个处理器接收来自所述一个或多个潜在的父实体的对父实体的选择;
由所述一个或多个处理器,基于所述模板和选择的父实体,从所述识别的实体中识别一个或多个潜在的子实体;
由所述一个或多个处理器接收来自所述一个或多个潜在的子实体的对子实体的选择;
由所述一个或多个处理器,基于所述识别的实体和所述模板,识别所述非结构化文本输入中的动作项;
使用意图分类器,确定所述动作项的意图;和
基于确定的意图、所述识别的实体和所述选择的子实体,更新数据存储。
2.根据权利要求1所述的方法,其中更新所述数据存储进一步基于所述选择的父实体。
3.根据权利要求1或2所述的方法,其中识别所述实体包括识别所述实体中的每个实体的类型、所述实体中的每个实体的值和所述识别中的置信度。
4.根据权利要求3所述的方法,其中所述实体中的每个实体的类型选自由组织、人员、日期、时间、百分比、货币值和选择列表类型组成的组。
5.根据权利要求1-4中任一项所述的方法,其中基于所述确定的意图、所述识别的实体和所述选择的子实体而更新所述数据存储包括:
将在所述动作项中识别的一个或多个实体的确定的意图和类型与所述模板中的动作项签名进行匹配;和
基于在所述动作项中识别的所述一个或多个实体的签名和值生成数据库查询。
6.根据权利要求5所述的方法,其中通过在所述动作项中识别的对应实体的类型,在所述模板中识别字段,所述字段来自所述数据存储中的记录以包括在所述数据库查询中。
7.根据权利要求1-6中任一项所述的方法,其中:
识别所述一个或多个潜在的父实体包括:在所述数据存储中的一个或多个父表的记录中搜索与所述识别的实体中的一个或多个匹配的值,所述识别的实体中的一个或多个的类型与所述一个或多个父表的类型匹配;和
在所述模板中识别所述一个或多个父表。
8.根据权利要求1-7中任一项所述的方法,其中:
识别所述一个或多个潜在的子实体包括:在所述数据存储中的一个或多个子表的记录中搜索与所述识别的实体中的一个或多个匹配的值,所述识别的实体中的一个或多个的类型与所述一个或多个子表的类型匹配;
在所述模板中识别所述一个或多个子表;和
所述记录与对应于所述选择的父实体的记录相关联。
9.根据权利要求8所述的方法,其中识别所述一个或多个潜在的子实体进一步包括如下一项或多项:
基于所述模板中的过滤器,过滤所述记录;或
基于由所述模板指定的排序,对所述一个或多个潜在的子实体排序。
10.根据权利要求1-9中任一项所述的方法,进一步包括基于所述更新,将发布对所述数据存储的更改。
11.根据权利要求1-10中任一项所述的方法,其中:
所述非结构化文本输入被接收为音频输入;和
所述方法进一步包括对所述音频输入执行语音识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易享信息技术有限公司,未经易享信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980060334.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:视频译码中的条带和分块
- 下一篇:外科机器人系统