[发明专利]可动态扩展的错字检测服务实现方法及系统在审

专利信息
申请号: 202210207314.3 申请日: 2022-03-04
公开(公告)号: CN115065671A 公开(公告)日: 2022-09-16
发明(设计)人: 董仲舒;张阳光;左洪强;何文欢;姚金龙;谷晶中 申请(专利权)人: 山谷网安科技股份有限公司
主分类号: H04L67/02 分类号: H04L67/02;H04L67/51;G06F9/54;G06F16/955;G06F40/284;H04L41/0896
代理公司: 郑州大通专利商标代理有限公司 41111 代理人: 石丹丹
地址: 450000 河南省郑州市金水*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 动态 扩展 错字 检测 服务 实现 方法 系统
【说明书】:

发明属于分布式服务以及自然语言处理技术领域,特别涉及一种可动态扩展的错字检测服务实现方法及系统,该方法包括首先grpc网关接收http错字识别请求;然后grpc网关选取一个已经注册的服务地址;其次grpc网关和已经选取的错字识别服务建立连接;错字识别服务调用错字识别算法对内容进行错字检测,向网关返回错字识别结果;最后网关把错字识别结果返回给用户。本发明在错字识别的基础上,提供一种互联网服务,而且随着业务需求的增长能够快速、无缝的扩容从而满足用户方便、快捷、简单的错字识别需求。

技术领域

本发明属于分布式服务以及自然语言处理技术领域,特别涉及一种可动态扩展的错字检测服务实现方法及系统。

背景技术

随着互联网技术以及新媒体技术的发展,互联网每天产生的内容越来越多。很多门户网站在内容发布前,都需要对内容进行严格的审核,因为一旦出现错字错词,不但会对网站造成不好的影响,同时也对网站拥有者的形象也造成了极大的破坏。

因此人们需要对文章的错字进行严格的审核,但是人的精力是有限的,在大量的文件面前,人们审核的速度和精度会随着时间的增长而降低,所以需要一种快速准确的技术来辅助人们来进行错字审核。

对于现有的错字识别服务来说,有的需要安装软件,限制了用户需求的时间、地点的同时,也会给用户带来经常需要升级的麻烦;有的仅支持文本,而且速度也不高,在用户需要快速完成审核时,不能很好的满足用户的要求。

发明内容

针对现有技术中存在的问题,本发明提出一种可动态扩展的错字检测服务实现方法及系统,在错字识别的基础上,提供一种互联网服务,而且随着业务需求的增长能够快速、无缝的扩容从而满足用户方便、快捷、简单的错字识别需求。

为了实现上述目的,本发明采用以下的技术方案:

本发明提供了一种可动态扩展的错字检测服务实现方法,包含以下步骤:

grpc网关接收http错字识别请求;

grpc网关选取一个已经注册的服务地址;

grpc网关和已经选取的错字识别服务建立连接;

错字识别服务调用错字识别算法对内容进行错字检测,向网关返回错字识别结果;

网关把错字识别结果返回给用户。

进一步地,所述grpc网关接收http错字识别请求之前还包括:

错字识别服务从本地文件中读取配置文件;

根据读取的信息向etcd集群中注册自己提供的服务;

启动grpc网关服务;

grpc网关程序、本地错字识别程序分别启动监听服务。

进一步地,所述配置文件包括本机IP地址、端口号和服务名字。

进一步地,所述根据读取的信息向etcd集群中注册自己提供的服务,注册形式为key/value,其中key的形式为:前缀/服务名字/本机IP地址:端口,value的形式为:本机IP地址:端口。

进一步地,所述grpc网关和已经选取的错字识别服务建立连接之后还包括:

错字识别服务接收请求,检查请求类型是文本检测还是URL错字检测;

如果是URL错字检测,则对URL页面进行下载,如果URL页面下载成功,则提取该页面内容,错字识别服务调用错字识别算法对内容进行错字检测,否则向网关返回下载错误结果;

如果是文本检测,则错字识别服务调用错字识别算法对内容进行错字检测。

进一步地,所述错字识别算法包含以下步骤:

加载主要词库,建立双tire数组;

加载错字词库;

对http错字识别请求的文本内容进行读取;

根据主要词库对文本内容进行分词;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山谷网安科技股份有限公司,未经山谷网安科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210207314.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top