[发明专利]一种文字处理方法、设备及存储介质在审

专利信息
申请号: 202110078268.7 申请日: 2021-01-20
公开(公告)号: CN113569851A 公开(公告)日: 2021-10-29
发明(设计)人: 王帅;邓强;钟滨;徐进 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06F40/103
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 熊永强;杜维
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文字处理 方法 设备 存储 介质
【权利要求书】:

1.一种文字处理方法,其特征在于,所述方法包括:

获取至少两个参考文字,对所述至少两个参考文字进行拆分,得到所述至少两个参考文字的拆分字形;所述至少两个参考文字的拆分字形包括拆分文字;

基于所述至少两个参考文字和所述至少两个参考文字的拆分字形,构建文字字形图;所述文字字形图包括每个参考文字与所属的拆分字形之间的关联关系;

将所述每个参考文字和所述拆分文字确定为待识别文字,基于所述文字字形图生成每个待识别文字的文字特征向量;

根据所述每个待识别文字的文字特征向量,确定所述每个待识别文字之间的文字相似度。

2.如权利要求1所述的方法,其特征在于,所述至少两个参考文字包括参考文字i,i为小于或等于所述至少两个参考文字的总数量的正整数;

所述基于所述至少两个参考文字和所述至少两个参考文字的拆分字形,构建文字字形图,包括:

建立所述参考文字i与所述参考文字i的拆分字形之间的连边;

根据所述参考文字i的文字属性信息与所述参考文字i的拆分字形的字形属性信息,确定所述参考文字i与所属的拆分字形之间的连边的连边权重;

根据所述参考文字i与所属的拆分字形之间的连边的连边权重,生成所述文字字形图。

3.如权利要求2所述的方法,其特征在于,所述基于所述文字字形图生成每个待识别文字的文字特征向量,包括:

将所述每个参考文字与所述每个参考文字的拆分字形确定为所述文字字形图中的连接节点;

根据所述文字字形图确定所述参考文字i的关联文本序列;所述关联文本序列包括与所述参考文字i依次进行连接的M个连接节点,M为小于或等于所述文字字形图中的连接节点的总数量的正整数;

基于所述关联文本序列训练初始模型,得到文字字形模型;

基于所述文字字形模型生成所述每个待识别文字的文字特征向量。

4.如权利要求3所述的方法,其特征在于,所述根据所述文字字形图确定所述参考文字i的关联文本序列,包括:

从所述文字字形图中获取所述参考文字i的至少两个待选关联文本序列;

根据与每个待选关联文本序列相关联的连边的连边权重,分别获取所述每个待选文本关联序列对应的连边权重和;

将所述至少两个待选文本关联序列中所属的连边权重和最大的待选文本关联序列,确定为所述参考文字i的所述关联文本序列。

5.如权利要求2所述的方法,其特征在于,所述根据所述参考文字i的文字属性信息与所述参考文字i的拆分字形的字形属性信息,确定所述参考文字i与所属的拆分字形之间的连边的连边权重,包括:

根据所述文字属性信息和所述字形属性信息,获取所述参考文字i针对所属的拆分字形的第一连边权重,获取所述参考文字i的拆分字形针对所述参考文字i的第二连边权重;

将所述第一连边权重和所述第二连边权重,确定为所述参考文字i与所属的拆分字形之间的连边的连边权重。

6.如权利要求5所述的方法,其特征在于,所述根据所述文字属性信息和所述字形属性信息,获取所述参考文字i针对所属的拆分字形的第一连边权重,获取所述参考文字i的拆分字形针对所述参考文字i的第二连边权重,包括:

将所述每个参考文字与所述每个参考文字的拆分字形确定为所述文字字形图中的连接节点;

获取所述参考文字i的第一笔画信息以及所述文字字形图中所述参考文字i的相邻连接节点的第一节点数量,将所述第一笔画信息和所述第一节点数量确定为所述文字属性信息;

获取所述参考文字i的拆分字形的第二笔画信息以及所述文字字形图中所述参考文字i的拆分字形的相邻连接节点的第二节点数量,将所述第二笔画信息和所述第二节点数量确定为所述字形属性信息;

根据所述文字属性信息中的所述第一笔画信息和所述字形属性信息,确定所述第一连边权重,并根据所述字形属性信息中的所述第二笔画信息和所述文字属性信息,确定所述第二连边权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110078268.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top