[发明专利]文本的标准化处理方法、装置、电子设备及计算机介质有效
申请号: | 202010773036.9 | 申请日: | 2020-08-04 |
公开(公告)号: | CN111881679B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 柯昆 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/247;G06F40/232;G06F16/35 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开涉及一种文本的标准化处理方法、装置、电子设备及计算机可读介质,属于数据处理技术领域。该方法包括:获取待处理的原始文本,并将原始文本进行拆分得到各个待识别文本成分;通过标准文本成分集合对待识别文本成分进行识别,确定待识别文本成分中的错误文本成分和缩写文本成分;将错误文本成分进行拆分得到子文本成分,并根据子文本成分与标准文本成分集合中的各个标准文本成分的关联关系,得到与错误文本成分对应的正确文本成分;根据预先生成的缩写文本对照表对缩写文本成分进行成分匹配,根据匹配结果得到与缩写文本成分对应的完整文本成分。本公开通过对错误文本成分和缩写文本成分进行标准化校正,可以提高文本数据统计和处理的效率。 | ||
搜索关键词: | 文本 标准化 处理 方法 装置 电子设备 计算机 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010773036.9/,转载请声明来源钻瓜专利网。