[发明专利]译员行为的大数据库及其建立方法、装置与电子设备在审
申请号: | 201811039593.7 | 申请日: | 2018-09-06 |
公开(公告)号: | CN109271384A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 何恩培;陈钰清 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 430000 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大数据库 行为数据 存储模型 电子设备 大数据 共享使用 记录数据 逻辑架构 深度掌握 外部系统 翻译 开放 | ||
1.一种译员行为的大数据库建立方法,其特征在于,包括:
基于译员的外部系统记录数据,采用开放API技术,聚集译员的行为数据;
将所述行为数据以大数据的存储模型进行处理,形成所述译员行为的大数据库。
2.根据权利要求1所述的方法,其特征在于,译员的所述行为数据具体包括译员的基本信息数据、任务行为数据、评价行为数据、能力数据、经验数据、信用数据、翻译工具数据、翻译偏好和登录/退出数据中的一种或者多种。
3.根据权利要求1所述的方法,其特征在于,所述将所述行为数据以大数据的存储模型进行处理的步骤进一步包括:
构建具有由底层构架至上层构架包括采集层、数据库层、挖掘层、知识库层、服务层和应用层的大数据库逻辑架构,并分别定义各逻辑层的业务逻辑;
对所述行为数据,按照所述大数据库逻辑架构和所述业务逻辑进行存储。
4.根据权利要求3所述的方法,其特征在于,所述分别定义各逻辑层的业务逻辑的步骤进一步包括:
定义所述采集层的业务逻辑包括:采用开放API技术或爬虫技术,汇集译员的所述行为数据,并将所述行为数据传输至所述数据库层;
定义所述数据库层的业务逻辑包括:利用NOSQL数据库,以大数据的形式存储所述行为数据;
定义所述挖掘层的业务逻辑包括:对译员的所述行为数据进行清洗、加工,提取译员的不同基因,并将所述基因传输至所述知识库层;
定义所述知识库层的业务逻辑包括:对所述基因进行存储,并为所述服务层和所述应用层提供所述基因;
定义所述服务层的业务逻辑包括:提供对所述基因的API接口服务;
定义所述应用层的业务逻辑包括:提供基于所述基因的APP应用。
5.根据权利要求3所述的方法,其特征在于,在所述对所述行为数据,按照所述大数据库逻辑架构和所述业务逻辑进行存储的步骤之后,还包括:
定义对所述译员行为的大数据库中大数据的处理逻辑包括数据采集逻辑、导入/预处理逻辑、统计分析逻辑和数据挖掘逻辑。
6.根据权利要求3所述的方法,其特征在于,在所述分别定义各逻辑层的业务逻辑的步骤之后,还包括:
进行基于事件模型的系统开放API设计。
7.一种译员行为的大数据库建立装置,其特征在于,包括:
数据采集模块,用于基于译员的外部系统记录数据,采用开放API技术,聚集译员的行为数据;
输出模块,用于将所述行为数据以大数据的存储模型进行处理,形成所述译员行为的大数据库。
8.一种电子设备,其特征在于,包括:至少一个存储器、至少一个处理器、通信接口和总线;
所述存储器、所述处理器和所述通信接口通过所述总线完成相互间的通信,所述通信接口用于所述电子设备与外部系统API接口设备之间的信息传输;
所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1至6中任一所述的方法。
9.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至6中任一所述的方法。
10.一种译员行为的大数据库,其特征在于,包括:
原始库集群模块,用于采用NOSQL MongoDB数据库,对译员的行为数据进行存储;
成果库集群模块,用于采用ORALCE数据库,对提取的译员的基因进行存储;
应用库集群模块,用于采用MYSQL或者ORACLE数据库,对译员的所述基因进行聚合同步后再进行存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811039593.7/1.html,转载请声明来源钻瓜专利网。