[发明专利]用于文本中待纠错的目标重点词确定的方法与设备在审
申请号: | 202210412144.2 | 申请日: | 2022-04-19 |
公开(公告)号: | CN115270768A | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海蜜度信息技术有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/284 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 王路丰 |
地址: | 201204 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本申请的目的是提供一种用于文本中待纠错的目标重点词确定的方法与设备。与现有技术相比,本申请通过获取待纠错的文本以及目标重点词,并基于所述目标重点词在所述待纠错的文本中进行n‑gram全文匹配,确定匹配的n‑gram单元,其中,n为不大于所述目标重点词长度的预设自然数,然后将距离小于预设阈值的n‑gram单元进行合并,确定合并后的候选子串集,并从所述候选子串集中确定长度符合阈值的子串作为目标候选子串,最后计算所述目标候选子串与所述目标重点词的相似度,并对相似度大于相似度阈值的目标候选子串作为目标重点词进行纠错。通过这种方式,不需要依赖训练样本,泛化能力强且灵活度高,能够适应各种任务场景。 | ||
搜索关键词: | 用于 文本 纠错 目标 重点 确定 方法 设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海蜜度信息技术有限公司,未经上海蜜度信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210412144.2/,转载请声明来源钻瓜专利网。
- 上一篇:二氧化钛纳米管/PE复合材料及其制备方法
- 下一篇:半导体存储器件