[发明专利]数据模型处理方法及装置在审
申请号: | 201611219684.X | 申请日: | 2016-12-26 |
公开(公告)号: | CN106844336A | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 杨帆;曹恺 | 申请(专利权)人: | 博彦科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 韩建伟,张永明 |
地址: | 100193 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据模型 处理 方法 装置 | ||
技术领域
本发明涉及数据处理领域,具体而言,涉及一种数据模型处理方法及装置。
背景技术
互联网是当今最主要的网络信息集散地,汇聚了大量的信息,信息检索技术作为一种便捷的信息查看方式在信息获取的过程中的作用越来越重。传统的搜索引擎大多使用关键词匹配的方式,通过关键词检索,在由关键词组成的数据模型库中提取对应数据模型。
针对上述不能根据语义构建数据模型的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据模型处理方法及装置,以至少解决不能根据语义构建数据模型的技术问题。
根据本发明实施例的一个方面,提供了一种数据模型处理方法,包括:获取文档中使用自然语言记录的文本文字;对所述文本文字进行分词以及语义判断,将所述文本文字分为多个词句;将所述多个词句根据类型的不同分配到不同的多个数据集合中以构造数据模型,其中,所述数据模型包括所述多个数据集合;至少根据所述多个数据集合得到第一数据模型;对所述第一数据模型进行修正后得到第二数据模型,其中,所述第二数据模型为所述文档对应的行业所对应的数据模型。
进一步地,对所述第一数据模型进行修正后得到所述第二数据模型包括:获取预先配置的所述行业对应的最优数据模型;根据所述最优数据模型对所述第一数据模型进行修正得到所述第二数据模型。
进一步地,对所述第一数据模型进行修正后得到所述第二数据模型包括:将所述第一数据模型提供给用户;接收所述用户对所述第一数据模型的修改;将修改后的所述第一数据模型作为所述第二数据模型。
进一步地,通过导引将所述第一数据模型提供给用户,其中,所述导引用于指导所述用户对所述第一数据模型进行修改;通过所述导引接收所述用户对所述第一数据模型的修改。
进一步地,所述第一数据模型包括以下至少之一:数据使用用户集合、用户类型集合、至少一个实体集合、实体的属性集合、业务规则集合、实体所属主题集合、以及数据流程集合。
进一步地,接收所述用户对所述第一数据模型的修改包括以下至少之一:所述第一数据模型中的集合的增加或减少、所述第一数据模型中的集合的内容的增加或减少。
根据本发明实施例的另一方面,还提供了一种数据模型处理装置,包括:获取单元,用于获取文档中使用自然语言记录的文本文字;判断单元,用于对所述文本文字进行分词以及语义判断,将所述文本文字分为多个词句;构造单元,用于将所述多个词句根据类型的不同分配到不同的多个数据集合中以构造数据模型,其中,所述数据模型包括所述多个数据集合;建模单元,用于至少根据所述多个数据集合得到第一数据模型;修正单元,用于对所述第一数据模型进行修正后得到第二数据模型,其中,所述第二数据模型为所述文档对应的行业所对应的数据模型。
进一步地,所述修正单元包括:获取模块,用于获取预先配置的所述行业对应的最优数据模型;修正模块,用于根据所述最优数据模型对所述第一数据模型进行修正得到所述第二数据模型。
进一步地,所述修正单元包括:发送模块,用于将所述第一数据模型提供给用户;接收模块,用于接收所述用户对所述第一数据模型的修改;替换模块,用于将修改后的所述第一数据模型作为所述第二数据模型。
进一步地,导引发送模块,用于通过导引将所述第一数据模型提供给用户,其中,所述导引用于指导所述用户对所述第一数据模型进行修改;导引接收模块,用于通过所述导引接收所述用户对所述第一数据模型的修改。
进一步地,所述第一数据模型包括以下至少之一:数据使用用户集合、用户类型集合、至少一个实体集合、实体的属性集合、业务规则集合、实体所属主题集合、以及数据流程集合。
进一步地,所述包括以下至少之一:所述第一数据模型中的集合的增加或减少、所述第一数据模型中的集合的内容的增加或减少。
在本发明实施例中,通过获取文档中使用自然语言记录的文本文字;对所述文本文字进行分词以及语义判断,将所述文本文字分为多个词句;将所述多个词句根据类型的不同分配到不同的多个数据集合中以构造数据模型,其中,所述数据模型包括所述多个数据集合;至少根据所述多个数据集合得到第一数据模型;对所述第一数据模型进行修正后得到第二数据模型,其中,所述第二数据模型为所述文档对应的行业所对应的数据模型,进而解决了不能根据语义构建数据模型的技术问题。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博彦科技股份有限公司,未经博彦科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611219684.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电控自动供给双腔饮食器具装置
- 下一篇:一种高效雾化的护肤喷雾