[发明专利]一种用于文本校验的数据处理方法、电子设备及存储介质有效
申请号: | 202111310983.5 | 申请日: | 2021-11-08 |
公开(公告)号: | CN113761880B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 刘远;陈旻晖 | 申请(专利权)人: | 北京中电汇智科技有限公司;中电(苏州)共享服务有限公司 |
主分类号: | G06F40/226 | 分类号: | G06F40/226;G06F16/31;G06F16/36 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 原春香 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种用于文本校验的数据处理方法、电子设备及存储介质,所述方法包括如下步骤:从文本数据库获取样本文本列表并当任一样本文本中存在与预设关键词列表中任一预设关键词一致的关键词时,将样本文本的关键词位置标记为指定起始位置和将样本文本的结束位置标记为指定结束位置,且将指定起始位置和指定结束位置之间的语段作为的目标语段,以基于存在目标语段的样本文本作为训练集数据,构建成训练集;将训练集输入至预设的语言模型中进行训练,得到已训练的语言模型;通过已训练的语言模型,获取目标文本的知识图谱,以使得根据知识图谱与预设的校验数据进行比对。本发明能够提高结构化文本数据和半结构化文本数据比对的准确性格效率。 | ||
搜索关键词: | 一种 用于 文本 校验 数据处理 方法 电子设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中电汇智科技有限公司;中电(苏州)共享服务有限公司,未经北京中电汇智科技有限公司;中电(苏州)共享服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111310983.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种二氧化碳驱替用发泡剂及驱替方法技术
- 下一篇:废水分段式三维电催化装置