[发明专利]智能校对系统有效

专利信息
申请号: 201811022154.5 申请日: 2018-09-04
公开(公告)号: CN109255113B 公开(公告)日: 2022-10-11
发明(设计)人: 鲁艳;焦少波;陈光;董安琪 申请(专利权)人: 郑州信大壹密科技有限公司
主分类号: G06F40/169 分类号: G06F40/169;G06F40/189;G06F40/216;G06F40/289;G06F40/30;G06V30/14;G06V30/148;G10L13/04;G10L15/02;G10L15/06;G10L15/26
代理公司: 郑州明华专利代理事务所(普通合伙) 41162 代理人: 王明朗
地址: 450000 河南省郑州市高新技*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 智能 校对 系统
【说明书】:

发明公开了一种智能校对系统,建立文本校对模块、语音合成模块、语音识别模块、OCR识别模块四个模块,系统核心校对工作由文本校对模块完成;语音合成、语音识别模块、OCR识别模块负责将校对结果导出为语音、将语音识别为文本、将图文识别为文本,文本校对模块负责将识别后的文本进行校对工作。系统融合了自然语言处理、语音识别、语音合成、OCR识别等多种人工智能技术手段,在文本、语音、图片等不同形式输入下均可以完成校对工作,增加了人机交互过程,减少了工作人员工作量,并提高了校对效率及准确率。

技术领域

本发明涉及出版检校技术领域,具体涉及一种基于语音交互的智能校对方法及系统。

背景技术

在中文文字处理中,录入、编辑和排版都已经有相当成熟的电脑应用系统,但文本校对这一中间环节尚停留主要依靠人工处理阶段,并已成为新闻、出版、办公室文印等领域制约整个行业发展,影响工作效率的瓶颈。

校对是保证录入文档内容准确性的重要一环,已有1400年的历史。如果文稿校对不准确,一字之差就会造成读者的困惑或不满,严重时会造成重大事故。因此需增强对校对工作的认识,提高校对工作的技巧,使校对更好地发挥消灭差错保证质量的作用。近年来,国内外都在进行文本自动查错和纠错方面的研究,并取得了一定的成果,目前市场现有的文本校对软件可以完成初步的简单的审核校对,这些软件在校对文字、专业术语、单位和专业名词等方面还可以,但在校对敏感问题,如政治、宗教还有知识性错误、事实性错误、单句/篇章语法错误等都存在无法校对或者准确率不高等问题,导致不能准确的校对是非、校对的误报率较高等问题。

同时,虽然人工智能技术飞速发展,但市场上尚未出现专门针对校对市场的智能校对系统,目前的校对软件绝大部分为文本输入,少部分有图片识别的功能,对于多种格式的输入和输出具有一定的局限性,所以目前的校对市场仍以人工校对为主,对降低校对人员工作量方面效用不大,因此研究结合多种人工智能的技术手段,提高校对准确率,降低校对人员的庞大工作量的智能校对系统还是很有必要的。

发明内容

针对校对工作多,工作人员工作量大,为了有效降低校对工作错误率,提升校对准确率,本发明融合语音识别、语音合成、OCR识别等多种人工智能技术手段,合理利用计算机进行辅助工作,通过人机互动,减少了人工校对工作量,减轻校对人员的疲劳程度,提高工作效率和准确度。

本发明所采用的技术方案:一种智能校对系统,建立文本校对模块、语音合成模块、语音识别模块、OCR识别模块四个模块,系统核心校对工作由文本校对模块完成,语音识别模块在于工作人员朗读,计算机进行校对;语音合成模块计算机校对,朗读并提醒,工作人员判断,OCR识别模块在于将输入的图片转为文本;语音合成、语音识别模块、OCR识别模块负责将校对结果导出为语音、将语音识别为文本、将图文识别为文本,文本校对模块负责将识别后的文本进行校对工作。

文本校对模块实现方法包括以下步骤:

(1)首先对于用户输入的问句进行分词处理和词性标注;(2)通过将分词后的词语串采用N-gram语言模型进行建模;(3)采用N-gram方法以庞大的语料库做基础,进行错误字符的定位操作,检测到可能出错的位置;(4)将疑错窗口中的字符再通过词性的N-gram方法进行进一步检测,如果检测为不合理,则判定为错误,定义为出错字符串;(5)将出错字符串进行纠错处理,给出最近的相似词语,进行返回(6)组合成纠错后的语句返回给用户或者进行下一步处理。

语音合成模块包括训练阶段和合成阶段如下。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州信大壹密科技有限公司,未经郑州信大壹密科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811022154.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top