[发明专利]网站错别字的识别方法及装置在审
申请号: | 201510719774.4 | 申请日: | 2015-10-29 |
公开(公告)号: | CN106649325A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 冯鸳鹤 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙)11348 | 代理人: | 王伟锋,刘铁生 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 错别字 识别 方法 装置 | ||
技术领域
本发明涉及互联网技术领域,特别是涉及一种网站错别字的识别方法及装置。
背景技术
网站错别字,顾名思义是指网站所有内容网页出现的错字和别字。网站错别字的出现,原因是多方面的,其不良的影响或者危害也是不容忽视的。特别是政府网站,随着一些政策性文件的出台,错别字识别已作为政府网站硬性的考核指标项。
政府网站错别字识别的主要任务在于人物和职称不对称信息的查找,例如:某某人的职称为副主任,若政府网站上展示成某某人为正主任,这种错误在政府行业是及其严重的错误,特别是对某人职称的降低更是不允许出现的;因此,能够快速、准确识别出政府网站内所有内容网页中的错别字是亟需解决的问题。目前,识别网站错别字的方式为通过人工查找的方式确定网站中是否存在错别字,由于网站中人物和职称之间的对应关系是随时变动的,因此网站错别字识别的参与人员需要每天对网站中人物和职称之间的对应关系进行学习,而网站错别字识别的参与人员的人工素质和状态存在差异,导致识别网站中错别字的准确率较低。
发明内容
有鉴于此,本发明提供的一种网站错别字的识别方法及装置,主要目的在于提高识别网站错别字的准确率。
为了解决上述问题,本发明主要提供如下技术方案:
一方面,本发明提供了一种网站错别字的识别方法,该方法包括:
获取待检测网站内所有内容页面,并确定第一人物与职称关系,所述第一人物与职称关系为从所述待检测网站内所有内容页面中提取的人物与职称关系;
确定所述第一人物与职称关系与第二人物与职称关系是否一致,所述 第二人物与职称关系存储于人物职称库中,所述人物职称库记录有预设官方媒体网站的页面内容中包含的人物与职称之间的对应关系;
若确定所述第一人物与职称关系与所述第二人物与职称关系不一致,则输出显示所述待检测网站中有错别字的提示信息。
另一方面,本发明还提供一种网站错别字的识别装置,该装置包括:
获取单元,用于获取待检测网站内所有内容页面;
第一确定单元,用于在所述获取单元获取待检测网站内所有内容页面之后,确定第一人物与职称关系,所述第一人物与职称关系为从所述待检测网站内所有内容页面中提取的人物与职称关系;
第二确定单元,用于确定所述第一确定单元确定的所述第一人物与职称关系与第二人物与职称关系是否一致,所述第二人物与职称关系存储于人物职称库中,所述人物职称库记录有预设官方媒体网站的页面内容中包含的人物与职称之间的对应关系;
显示单元,用于当所述第二确定单元确定所述第一人物与职称关系与所述第二人物与职称关系不一致时,输出显示所述待检测网站中有错别字的提示信息。
借由上述技术方案,本发明提供的技术方案至少具有下列优点:
本发明提供的网站错别字的识别方法及装置,在识别待检测网站内的错别字时,首先,获取该待检测网站内所有内容页面,并确定第一人物与职称关系,该第一人物与职称关系为从该待检测网站内所有内容页面中提取出人物与职称关系,将第一人物与职称关系与第二人物与职称关系进行比对,确认该第一人物与职称关系与该第二人物与职称关系是否一致,其中,该第二人物与职称关系存储于人物职称库中,该人物职称库中记录有预设官方媒体网站的页面内容中包含的人物与职称之间的对应关系,若确定该第一人物与职称关系与该第二人物与职称关系不一致,则输出显示该待检测网站内存在错别字的提示信息;与现有技术中人工识别待检测网站中的错别字相比,本发明基于人物职称库中存储的人物与职称之间的对应关系,确定待检测网站中人物与职称之间的对应关系是否一致,若一致,则说明待检测网站内没有错别字;若不一致,则说明待检测网站中有错别 字,并输出显示待检测网站有错别字的提示信息,提高了识别待检测网站中错别字的准确率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种网站错别字的识别方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510719774.4/2.html,转载请声明来源钻瓜专利网。