[发明专利]语言信息主动校对系统及其主动校对方法在审

专利信息
申请号: 201811506143.4 申请日: 2018-12-10
公开(公告)号: CN109858014A 公开(公告)日: 2019-06-07
发明(设计)人: 朱西平;邓魁;李伟勤;苟智坚;韩斌;李季;郑达;帅靖;杨朋 申请(专利权)人: 西南石油大学;成都信息工程大学;四川品亿科技有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06K9/34;G06F16/583;G06F16/51
代理公司: 成都众恒智合专利代理事务所(普通合伙) 51239 代理人: 钟显毅
地址: 610500 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 校对 对比服务器 记录服务器 审核服务器 校对结果 校对系统 校对信息 语言信息 自动识别 词字 区域合作 发布 终端 多语言文字 准确度 反馈 标准语言 发布信息 机器识别 记录数据 人工审核 图文识别 文化信息 信息资料 字数据库 多语言 有效地 单词 语言 数据库 交汇 采集 记录
【权利要求书】:

1.一种语言信息主动校对系统,其特征在于,包括用于提供标准语言的字符和单词的语言基本词字数据库,用于提供所采集的区域合作沿线多语言文字信息资料的语言图文识别数据库,参照语言基本词字数据库对所述语言图文识别数据库的资料进行初步自动识别的对比服务器,将对比服务器无法自动识别的结果进行记录的错词字记录服务器,用于发布来自于错词字记录服务器所记录数据的校对信息发布平台,用于接收校对信息发布平台所发布信息并反馈校对结果的主动校对终端,与校对信息发布平台连接的用于接收主动校对终端所反馈的校对结果的审核服务器,以及与审核服务器连接的人工审核终端,其中,所述主动校对终端由区域合作沿线语言文化爱好者使用,通过一定数量的区域合作沿线语言文化爱好者共同进行对错词字的主动校对。

2.根据权利要求1所述的语言信息主动校对系统,其特征在于,所述校对信息发布平台以广播方式向多个主动校对终端发布错词字记录。

3.根据权利要求1所述的语言信息主动校对系统,其特征在于,还包括将对比服务器自动识别出的结果进行记录的识别词字记录服务器,所述校对信息发布平台分别提取来自错词字记录服务器的错词字记录和来自识别词字记录服务器的识别词字记录,混搭后向主动校对终端发布,用以测验所述主动校对终端的使用者。

4.根据权利要求2所述的语言信息主动校对系统,其特征在于,当某一所述主动校对终端所反馈的校对结果大于一设定阈值时,由校对信息发布平台向该主动校对终端发送奖励信息。

5.根据权利要求1所述的语言信息主动校对系统,其特征在于,对于某一错词字记录,所述审核服务器根据接收到的反馈的校对结果的数量来自动判断所述校对结果是否准确,当同一校对结果的数量与其他校对结果的数量的差值不低于一设定阈值时,判定该同一校对结果为准确,该其他校对结果为不准确,当同一校对结果的数量与其他校对结果数量的差值低于该设定阈值时,则交由所述人工审核终端进行审核。

6.根据权利要求1~5任一项所述的语言信息主动校对系统,其特征在于,所述语言图文识别数据库所存储的语言图文识别信息由语言图文识别系统提供。

7.根据权利要求6所述的语言信息主动校对系统,其特征在于,所述语言图文识别系统包括用于从后台数据服务器中获取原始图文图像数据的图像提取模块,用于原始图文图像进行边缘预识别的边缘预识别模块,用于将边缘预识别后的图像预分割为图片图像信息和文字图像信息的预分割模块,用于将分割后且相关联的图片图像信息和文字图像信息进行相同标记的预标记模块,用于对标记后的图片图像信息进行存储的图片临时存储模块,用于对标记后的文字图像进行亮度处理的亮度调节模块,用于对亮度处理后的文字图像进行识别的OCR文字识别模块,用于存储识别后的文字数据的文字临时存储模块,用于分别从图片临时存储模块和文字临时存储模块中提取具有相同标记的图片图像信息和文字数据的目标提取模块,以及用于将相同标记的图片图像和文字组合的图文重组模块,其中所述图文重组模块重组的图文信息存储于所述语言图文识别数据库中。

8.如权利要求1~7任一项所述的语言信息主动校对系统的主动校对方法,其特征在于,包括如下步骤:

(1)由语言图文识别系统获取后台服务器中关于区域合作沿线语言文化信息的原始图文图像数据,并进行图文识别,将原始图文图像中的文字图像转换为文字文本存储于语言图文识别数据库中;

(2)由对比服务器提取所述语言图文识别数据库中存储的文字文本数据,并与语言基本词字数据库中所记录的标准语言的字符和单词相对比,若该文字文本数据中的字符或单词与语言基本词字数据库的数据相匹配,则将该字符或单词记录于识别词字记录服务器中,否则将该字符或单词记录于错词字记录服务器中;

(3)由校对信息发布平台从错词字记录服务器中随机提取错词字记录,并以广播方式向各主动校对终端发布;

(4)审核服务器接收由各主动校对终端反馈的该错词字记录的主动校对结果,并根据这些主动校对结果的数量进行自动判定,若判定结果为准确,则对反馈了准确的主动校对结果的主动校对终端发送奖励信息,若审核服务器无法自动判定结果,则将反馈结果传输至人工审核终端;

(5)人工审核终端根据人工审核的结果向反馈了准确的主动校对结果的主动校对终端发送奖励信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学;成都信息工程大学;四川品亿科技有限公司,未经西南石油大学;成都信息工程大学;四川品亿科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811506143.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top