[发明专利]智能校对系统有效
申请号: | 201811022154.5 | 申请日: | 2018-09-04 |
公开(公告)号: | CN109255113B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 鲁艳;焦少波;陈光;董安琪 | 申请(专利权)人: | 郑州信大壹密科技有限公司 |
主分类号: | G06F40/169 | 分类号: | G06F40/169;G06F40/189;G06F40/216;G06F40/289;G06F40/30;G06V30/14;G06V30/148;G10L13/04;G10L15/02;G10L15/06;G10L15/26 |
代理公司: | 郑州明华专利代理事务所(普通合伙) 41162 | 代理人: | 王明朗 |
地址: | 450000 河南省郑州市高新技*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 校对 系统 | ||
本发明公开了一种智能校对系统,建立文本校对模块、语音合成模块、语音识别模块、OCR识别模块四个模块,系统核心校对工作由文本校对模块完成;语音合成、语音识别模块、OCR识别模块负责将校对结果导出为语音、将语音识别为文本、将图文识别为文本,文本校对模块负责将识别后的文本进行校对工作。系统融合了自然语言处理、语音识别、语音合成、OCR识别等多种人工智能技术手段,在文本、语音、图片等不同形式输入下均可以完成校对工作,增加了人机交互过程,减少了工作人员工作量,并提高了校对效率及准确率。
技术领域
本发明涉及出版检校技术领域,具体涉及一种基于语音交互的智能校对方法及系统。
背景技术
在中文文字处理中,录入、编辑和排版都已经有相当成熟的电脑应用系统,但文本校对这一中间环节尚停留主要依靠人工处理阶段,并已成为新闻、出版、办公室文印等领域制约整个行业发展,影响工作效率的瓶颈。
校对是保证录入文档内容准确性的重要一环,已有1400年的历史。如果文稿校对不准确,一字之差就会造成读者的困惑或不满,严重时会造成重大事故。因此需增强对校对工作的认识,提高校对工作的技巧,使校对更好地发挥消灭差错保证质量的作用。近年来,国内外都在进行文本自动查错和纠错方面的研究,并取得了一定的成果,目前市场现有的文本校对软件可以完成初步的简单的审核校对,这些软件在校对文字、专业术语、单位和专业名词等方面还可以,但在校对敏感问题,如政治、宗教还有知识性错误、事实性错误、单句/篇章语法错误等都存在无法校对或者准确率不高等问题,导致不能准确的校对是非、校对的误报率较高等问题。
同时,虽然人工智能技术飞速发展,但市场上尚未出现专门针对校对市场的智能校对系统,目前的校对软件绝大部分为文本输入,少部分有图片识别的功能,对于多种格式的输入和输出具有一定的局限性,所以目前的校对市场仍以人工校对为主,对降低校对人员工作量方面效用不大,因此研究结合多种人工智能的技术手段,提高校对准确率,降低校对人员的庞大工作量的智能校对系统还是很有必要的。
发明内容
针对校对工作多,工作人员工作量大,为了有效降低校对工作错误率,提升校对准确率,本发明融合语音识别、语音合成、OCR识别等多种人工智能技术手段,合理利用计算机进行辅助工作,通过人机互动,减少了人工校对工作量,减轻校对人员的疲劳程度,提高工作效率和准确度。
本发明所采用的技术方案:一种智能校对系统,建立文本校对模块、语音合成模块、语音识别模块、OCR识别模块四个模块,系统核心校对工作由文本校对模块完成,语音识别模块在于工作人员朗读,计算机进行校对;语音合成模块计算机校对,朗读并提醒,工作人员判断,OCR识别模块在于将输入的图片转为文本;语音合成、语音识别模块、OCR识别模块负责将校对结果导出为语音、将语音识别为文本、将图文识别为文本,文本校对模块负责将识别后的文本进行校对工作。
文本校对模块实现方法包括以下步骤:
(1)首先对于用户输入的问句进行分词处理和词性标注;(2)通过将分词后的词语串采用N-gram语言模型进行建模;(3)采用N-gram方法以庞大的语料库做基础,进行错误字符的定位操作,检测到可能出错的位置;(4)将疑错窗口中的字符再通过词性的N-gram方法进行进一步检测,如果检测为不合理,则判定为错误,定义为出错字符串;(5)将出错字符串进行纠错处理,给出最近的相似词语,进行返回(6)组合成纠错后的语句返回给用户或者进行下一步处理。
语音合成模块包括训练阶段和合成阶段如下。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州信大壹密科技有限公司,未经郑州信大壹密科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811022154.5/2.html,转载请声明来源钻瓜专利网。