[发明专利]基于深度学习的面向图像的端到端中文古诗词推荐方法在审

专利信息
申请号: 202210799035.0 申请日: 2022-07-06
公开(公告)号: CN115062179A 公开(公告)日: 2022-09-16
发明(设计)人: 吴致远 申请(专利权)人: 吴致远
主分类号: G06F16/583 分类号: G06F16/583;G06F16/51;G06F16/9535;G06V30/41;G06V30/18;G06V30/19
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 邱启旺
地址: 310013 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 面向 图像 端到端 中文 古诗词 推荐 方法
【权利要求书】:

1.一种基于深度学习的面向图像的端到端中文古诗词推荐方法,其特征在于,包括以下步骤:

步骤(1):根据中文古诗词数据特点,在开源图像数据的基础上,进行图像的增减和标签空间的调整,并利用调整后的数据集完成图像特征提取模型的训练;

步骤(2):从互联网收集中文古诗词构建诗词数据库,训练用于古诗词特征提取的Bert模型,提取数据库中诗词的特征向量;

步骤(3):输入图片,中文古诗词深度推荐模型推荐合适的古诗。

2.根据权利要求1所述基于深度学习的面向图像的端到端中文古诗词推荐方法,其特征在于,所述步骤(1)包括以下子步骤:

(1.1)在图像的标签空间中增加了诗词的意象和主题,记为Yitem,得到图像数据训练集表示如下:

其中,i为图像的索引,n为图像总数量,xi为图像像素特征,yi为图像的分类标签,并满足yi∈Ye∪Yitem,即yi属于原有标签集合Ye或新增标签集合Yitem

(1.2)利用图像数据训练集训练神经网络,训练损失为均方误差,优化策略为梯度下降,损失函数表示如下:

其中,xi表示从训练集输入的图片,li表示图片对应的标签向量,F1表示用于图像标签预测的神经网络,||·||2是向量的L2范数,Ω(F1)表示神经网络的正则项,用于控制模型复杂度;将神经网络F1最后几层线性映射层丢弃,即获得图像特征提取模型,记为F1′。

3.根据权利要求2所述基于深度学习的面向图像的端到端中文古诗词推荐方法,其特征在于,所述步骤(2)包括以下子步骤:

(2.1)收集中文古诗词;

(2.2)利用标签间的低秩假设提取标签和隐层特征间的相关性,矩阵的低秩假设通过最小化矩阵的奇异值之和进行近似;模型Bert的训练损失可以表示如下:

其中,m表示古诗词总数量,x′j表示输入的某个古诗词,l′j表示诗词对应的标签向量,F2表示用于诗词标签预测的Bert模型,Ω(F2)表示Bert的正则项,用于控制模型复杂度,F2(X′)表示所有古诗词的预测标签矩阵,||·||*是核范数,用于计算矩阵奇异值之和;将Bert模型F2最后几层线性映射层丢弃,即获得中文古诗词特征提取模型,记为F2′;

(2.3)确保图像特征提取模型F1′和中文古诗词特征提取模型F2′提取到的特征维度相同,将F1′和F2′结合相同线性映射模型,最后利用和交替优化图像特征提取模型F1′和中文古诗词特征提取模型F2′。

4.根据权利要求3所述基于深度学习的面向图像的端到端中文古诗词推荐方法,其特征在于,所述利用和交替优化图像特征提取模型F1′和中文古诗词特征提取模型F2′具体为,

(a)固定F1′和F2′,根据图像数据和中文古诗词数据,分别用和计算线性映射模型参数的梯度并更新;

(b)固定线性映射层,根据图像数据和中文古诗词数据,分别用和计算特征提取模型F1′和F2′的参数的梯度并更新;

(c)利用F2′提取诗词库中所有诗词的特征,生成对应特征向量,记第j首诗词的特征向量pj,所有特征向量组成的矩阵为P。

5.根据权利要求4所述基于深度学习的面向图像的端到端中文古诗词推荐方法,其特征在于,所述步骤(3)具体为:针对用户输入的图像,利用图像特征提取模型F1′提取输入图像的特征,记特征向量为F1′(x),同时计算;已知模型F1′和F2′提取的特征在同一特征空间中,即F1′(x)与P位于同一特征空间,直接用该特征空间内的欧氏距离衡量输入图像与诗词的距离,并选择最邻近诗词进行推荐,即求解以下最小化问题,

其中,诗词的索引j满足1≤j≤m,m表示古诗词总数量,表示返回使式子最小化时j的取值,pj是第j首诗词的特征向量,||·||2是向量的L2范数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴致远,未经吴致远许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210799035.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top