[发明专利]一种标题抽取模型的生成方法、装置及电子设备在审
申请号: | 202210413888.6 | 申请日: | 2022-04-15 |
公开(公告)号: | CN114724166A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 方文浩;苏磊;韩光耀;陈禹燊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/416 | 分类号: | G06V30/416;G06V30/414;G06V30/19;G06K9/62;G06F40/258;G06F40/30;G06F40/253;G06F40/216 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 宫传芝 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供了一种标题抽取模型的生成方法、装置及电子设备,涉及数据处理领域,尤其涉及自然语言处理、深度学习、光学字符识别、数据处理等技术领域。该方案为:获取文档样本,其中,文档样本中的文档为图像格式;对文档样本中的文档进行文本特征提取,得到文本特征信息,并对文档进行图像特征提取,得到图像特征信息,文本特征信息表征文档样本所包含文本的文本内容以及文本位置,图像特征信息表征文档样本所包含文档的文档布局;基于文本特征信息对文档样本进行标注,得到标注后的文档样本;对标注后的文档样本和图像特征信息进行特征融合,得到训练样本;基于训练样本生成标题抽取模型,标题抽取模型用于提取待处理文档中的标题。 | ||
搜索关键词: | 一种 标题 抽取 模型 生成 方法 装置 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210413888.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种制备高纯硫酸的蒸馏方法
- 下一篇:一种电池热管理方法和装置